Apache Spark Batchジョブを使って映画とディレクターの情報を結合 - 8.0

Talend Real-Time Big Data Platform 入門ガイド

Version
8.0
Language
日本語
Operating system
Real-Time Big Data Platform
Product
Talend Real-Time Big Data Platform
Module
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2024-03-13
このシナリオでは以下について説明します。
  1. Apache Spark BatchのTalendジョブの作成方法詳細は、Spark Batchジョブを作成を参照してください。

  2. Spark Batchジョブで使用するコンポーネントをドロップおよびリンクする方法。詳細は、Sparkコンポーネントをドロップしてリンクを参照してください。

  3. [Repository] (リポジトリー)から関連するメタデータを使用して入力コンポーネントを設定する方法。詳細は、入力データを設定を参照してください。

  4. 入力データを結合するための変換を設定する方法。詳細は、データ変換を設定を参照してください。

  5. 変換されたデータをADLS.に書き込む方法。詳細は、Azure ADLS Gen1に出力を書き込むを参照してください。