データを照合するプロセスの設定 - 7.2

ネーム標準化

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 名前標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 名前標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 名前標準化コンポーネント
tFirstnameMatchを使用して照合する前に、対象のデータカラムを選択する必要があります。

手順

  1. tFilterColumnsコンポーネントをクリックして、その[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、ダイアログボックスを開きます。
  3. 入力スキーマから[name] (名前)[gender] (性別)のカラムを選択し、出力スキーマに移動します。
  4. [OK]をクリックして変更の妥当性チェックを行い、ダイアログボックスを閉じます。
  5. tFirstnameMatchをクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。
  6. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし入力および出力スキーマを表示し、[OK]をクリックしてダイアログボックスを閉じます。

    このコンポーネントの出力スキーマは、入力スキーマと1つの固定カラムと同じです。FIRSTNAMEMATCH.

  7. [First Names] (名)リストから、このサンプルでは[name] (名前)を保持するカラムを選択します。
  8. 必要に応じて、[Use Gender] (性別を使用)または[Use Country] (国を使用)チェックボックスをオンにし、リストから性別または国がそれぞれ含まれるカラムを選択します。
    これにより、システムのパフォーマンスが最適化され、より正確な結果が得られます。
  9. 必要に応じて、いくつかの一致が可能な場合に名前のベストマッチを可能にする場合は、[Fuzzy Search] (ファジー検索)チェックボックスをオンにします。