Talend Data Preparationの概念 - 2.8

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
2.8
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation
これらの定義について学習すると、Talend Data Preparationの主な概念が理解しやすくなります。
データセット
データセットには、1つ以上のプレパレーションの原材料として使用できるローデータが保存されています。データセットは、元データに影響を与えることなくレシピステップを適用できるテーブルとして表示されます。データセットは複数のプレパレーションで再使用できます。
プレパレーション
プレパレーションはデータセットとレシピがリンクされたものです。データを使って成し遂げたい最終的な成果ということもできます。この成果をファイルとしてエクスポートしたり、データターゲットに接続したりすることができます。ひとつのプレパレーションはひとつのデータセットに対応し、結果を生成するためのレシピが適用されます。元のデータセットが変更されることはありません。
レシピ
レシピは、「何かを作成または準備するための材料リストと一連の指示」として文字通り定義されます。Talend Data Preparationでは、材料はデータセットと呼ばれるローデータに相当し、指示はデータセットに適用されるファンクションのセットです。レシピは視覚的には、左側の折りたたみパネルに、上から下の順に表示される一連のファンクションです。レシピはプレパレーションを介してデータセットにリンクされています。レシピの各更新は、必ずプレパレーションに自動保存されます。
関数
ファンクションは空の行の削除など、データセットの行やカラムまたはデータセット全体に適用される処理です。ファンクションはプレパレーションの一部として適用されるので、元データは変更されません。適用されたファンクションは適用順にレシピに記録されます。