Talend Big Data Platformの使い方 - 7.0

Talend Big Data Platform入門ガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio

この章では、動画レンタルとストリーミングビデオサービスを提供する会社の例を取り上げ、そのような会社によるTalend Big Data Platformの利用方法について説明します。

以下の方法を習得すれば、動画とディレクターに関するデータ、および顧客に関するデータの作業を行えるようになります。

  • 顧客の電子メールアドレスを検証し、電話番号を標準化してから、顧客サポートシステムに送信する
  • 有効なディレクター情報のある動画エントリーとそうでない動画エントリーを区別するためにデータのフィルタリングを行う
  • ローカルファイルシステムに保存されているデータを会社のHadoopクラスターのHDFSファイルシステムにアップロードする
  • ディレクターデータを動画データに結合して新しいデータセットを生成し、このデータセットもHDFSシステムに保存する
  • 顧客IDを使用して顧客の電子メールアドレスと電話番号を顧客サポートシステムから探す
  • クリーンで、正確で、一貫していることを確認するために、データモデルに基づいて動画データを検証してからマスターデータとして保存する