コンポーネントを設定 - 7.2

Data extraction

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データクオリティ
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データクオリティ
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データクオリティ

手順

  1. tFileInputDelimitedをダブルクリックして、その[Basic settings] (基本設定)ビューを開き、入力ファイル名、スキップするヘッダー行数、およびスキーマを含め、コンポーネントのプロパティを定義します。
    1. [Edit Schema] (スキーマを編集)をクリックし、スキーマを作成します。
    2. [+]をクリックしてName__Telephone_Addressをスキーマに追加し、[OK]をクリックして確定します。
  2. tPatternExtractをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
    1. [Column to check] (チェックするカラム)リストから、定義されたパターンに基づいてデータをチェックするカラムを選択します。この例ではName_Telephone_Addressです。
    2. [PROPERTY] (プロパティ)リストから[Repository] (リポジトリー)を選択して、[DQ Repository] (DQリポジトリー)からのパターンに基づいてデータをチェックします。
    3. [PROPERTY] (プロパティ)フィールドの横にある[...]ボタンをクリックし、[Pattern Selector] (パターンセレクター)から[Regex] (正規表現) > [internet] (インターネット) > [Email Address] (メールアドレス)を選択します。
  3. tFilterColumnsコンポーネントの[Basic settings] (基本設定)ビューで、[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、[Schema] (スキーマ)ダイアログボックスを開きます。
  4. 入力スキーマから目的のカラムを選択し、右矢印ボタンをクリックして、カラムを出力スキーマにコピーします。[OK]をクリックして、ダイアログボックスを閉じます。
  5. tFileOutputDelimitedをダブルクリックして[Basic settings] (基本設定)ビューを開き、コンポーネントのプロパティを定義します。
    1. [File Name] (ファイル名)フィールドに、出力データを書き込むファイルへのパスを指定します。
    2. 必要に応じて、該当するフィールドに行とフィールドの区切りを定義します。この例では、顧客のメールアドレスをセミコロンで区切ります。