Apache Sparkバッチジョブを使用して動画とディレクターの情報を結合する - 7.3

Talend Data Fabric入門ガイド

author
Talend Documentation Team
EnrichVersion
7.3
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
このシナリオでは以下について説明します。
  1. Apache SparkバッチのTalendジョブの作成方法詳細は、Sparkバッチジョブの作成を参照して下さい。

  2. Sparkバッチジョブで使用するコンポーネントをドロップおよびリンクする方法。詳細は、Sparkコンポーネントのドロップとリンクを参照して下さい。

  3. [Repository] (リポジトリー)から関連するメタデータを使用して入力コンポーネントを設定する方法。詳細は、入力データの設定を参照して下さい。

  4. 入力データを結合するための変換を設定する方法。詳細は、データ変換の設定を参照して下さい。

  5. 変換されたデータをADLS.に書き込む方法。詳細は、Azure ADLS Gen1への出力の書き込みを参照して下さい。