ジョブを実行 - Cloud - 8.0

Data privacy

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント

手順

  1. ジョブを保存し、F6を押して実行します。
    複製データが生成されて出力ファイルに書き込まれます。
  2. 出力コンポーネントを右グリックして[Data Viewer] (データビューアー)を選択し、複製データを表示します。
    複製レコードはORIGINAL_MARKカラムでfalseとマークされています。
    [Name] (名前)[City] (市区町村)、および[DOB]フィールドの一部のデータが、[Modifications] (変更)テーブルで設定した基準に従って変更されており、複製レコードがこれらの変更に基づいて生成されています。
    たとえば、元の名前Mrs Morgan Rossと複製名Mrs M rganosRissを比較すると、複製レコードに2つの関数が使われていることがわかります文字oはスペースに置き換えられ、サウンドもロスリスに置き換えられました。ただし、soundexコードは、置き換えられた読み方に変えられていません。
  3. tDuplicateRowの基本設定と[Distribution of duplicates] (複製の分布)エリアで、ベルヌーイ分布など別の分布を選択してジョブを実行します。
    以下の図に示すように、選択した分布に従って、同じ入力フローからさまざまな複製が生成されます。