コンポーネントを設定 - 7.3

Data extraction

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データクオリティ
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データクオリティ
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データクオリティ

手順

  1. tFileInputDelimitedをダブルクリックして、その[Basic settings] (基本設定)ビューを開き、入力ファイル名、スキップするヘッダー行数、およびスキーマを含め、コンポーネントのプロパティを定義します。
    1. [Edit Schema] (スキーマの編集)をクリックし、スキーマを作成します。
    2. [+]をクリックしてName__Telephone_Addressをスキーマに追加し、[OK]をクリックして確定します。
  2. tPatternExtractをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
    1. [Column to check] (チェックするカラム)リストから、定義されたパターンに基づいてデータをチェックするカラムを選択します。この例ではName_Telephone_Addressです。
    2. [PROPERTY] (プロパティ)リストから[Repository] (リポジトリー)を選択して、[DQ Repository] (DQリポジトリー)からのパターンに基づいてデータをチェックします。
    3. [PROPERTY] (プロパティ)フィールドの横にある[...]ボタンをクリックし、[Pattern Selector] (パターンセレクター)から[Regex] (正規表現) > [internet] (インターネット) > [Email Address] (メールアドレス)を選択します。
  3. tFilterColumnsコンポーネントの[Basic settings] (基本設定)ビューで、[Edit schema] (スキーマの編集)の横にある[...]ボタンをクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
  4. 入力スキーマから目的のカラムを選択し、右矢印ボタンをクリックして、カラムを出力スキーマにコピーします。[OK]をクリックして、ダイアログボックスを閉じます。
  5. tFileOutputDelimitedをダブルクリックして[Basic settings] (基本設定)ビューを開き、コンポーネントのプロパティを定義します。
    1. [File Name] (ファイル名)フィールドに、出力データを書き込むファイルへのパスを指定します。
    2. 必要に応じて、該当するフィールドに行とフィールドの区切り記号を定義します。この例では、顧客のメールアドレスをセミコロンで区切ります。