tMapコンポーネントの設定 - 7.0

データクオリティシステムルーチン

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio

手順

  1. tMapをダブルクリックしてマップエディターを開きます。
  2. エディターの右下にある[+]ボタンをクリックして8つの行を追加し、名前を次のように変更します: Entity_stringcontains_only_initialssafe_trimcontains_only_initials_after_trimstr1str2str3safe_concat
    これらの行は元の入力データまたはDqStringHandlingルーチンによって処理されるデータに対応しています。
  3. このテーブルの[Type] (タイプ)カラムのcontains_only_initials行とcontains_only_initials_after_trim行で、それぞれのドロップダウンリストから[Boolean]を選択します。
    エディターの上部で、これらの新しい行は右側の出力テーブルに自動的に追加されます。
  4. 右側の出力テーブルの[Expression] (式)カラムの左側にあるrow1入力テーブルから、Entity_stringstr1str2str3の行をそれぞれ出力側の対応する行にドロップします。
  5. [Expression] (式)カラムで、contains_only_initials行を選択します。
  6. Ctrl+spaceを押して、自動完了リストを開きます。
  7. このリストから、DqStringHandling.containOnlyInitialsを選択します。
  8. 括弧の中のこの選択されたルーチンによって処理されるデータ行の入力を続行します(デフォルトで置換)。このユースケースでは、この行はrow1.Entity_stringです。
    そのため、入力された式は次のようになります: Handling.containsOnlyInitials(row1.Entity_string).
  9. 同様に、[Expression] (式)カラム内の残りの行も、各行に対応するDqStringHandlingルーチンを使用して完成します。その後、これらの行式は次のようになります。
    • safe_trim行の場合はDqStringHandling.safeTrim(row1.Entity_string)

    • contains_only_initials_after_trim行の場合はDqStringHandling.containsOnlyInitials; (DqStringHandling.safeTrim(row1.Entity_string) )

    • safe_concat行の場合はDqStringHandling.safeConcat(' ', row1.Entity_string , row1.str1, row1.str2 , row1.str3)

    注: このユースケースで示したように、異なるDqStringHandlingルーチンを1つの式で組み合わせて、高度な結果を生成することができます。
  10. [OK]をクリックして変更を確認し、ポップアップされたダイアログボックスにより求められるプロパゲーションを承認します。