ビッグデータのデータ統合タスクを実行する - 7.3

Talend Big Data入門ガイド

author
Talend Documentation Team
EnrichVersion
7.3
EnrichProdName
Talend Big Data
task
インストールとアップグレード
ジョブデザインと開発
EnrichPlatform
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
この章では、動画レンタルとストリーミングビデオサービスを提供する会社の例を取り上げ、そのような会社によるTalend Big Dataの利用方法について説明します。

以下の方法を習得すれば、動画とディレクターに関するデータ、および顧客に関するデータの作業を行えるようになります。

  • 会社のビッグデータプラットフォームのファイルシステムからジョブのデータフローにデータをロードします。この例では、このプラットフォームはAzure Databricksであり、このファイルシステムはDBFSです。
  • ディレクターデータを動画データに結合して新しいデータセットを作成し、このデータセットをAzure Blob Storageコンテナーに保存する。