スマート入力を使って社会保障番号の形式を設定 - 7.3

Talend Data Preparationユーザーガイド

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2023-11-29

スマート入力ファンクションを使用すると、例で定義されたパターンに基づいて自動的に社会保障番号の形式を設定できます。

この例では、顧客情報(名前、メールアドレスなど)が含まれているデータセットで作業していますが、最も重要なのは社会保障番号です。問題は、これらの社会保障番号がハイフンなしで間違った形式で入力されたことです。たとえば、334-20-6259などの数値は、このデータセットでは334206259として入力されています。この形式は間違っているため、ほとんどのデータはアプリケーションによって銀行のルーティング転送番号として解釈され、無効と見なされます。

この間違いを解決するには、入力するいくつかの例に基づいてパターンに従って、スマート入力ファンクションを使用し、データに正しい社会保障番号形式を適用します。

手順

  1. ssnカラムのヘッダーをクリックして、その内容を選択します。
  2. ファンクションパネルにMagic fillと入力し、結果をクリックして関連するファンクションのオプションを表示します。
  3. [Input 1] (入力1)フィールドに、変換するssnカラムの値の1つ、472989590などを入力します。
  4. [Output 1] (出力1)フィールドに、同じ値を入力しますが、この時は正しい形式になります:472-98-9590.
    ファンクションを動作させるには、適用する変換の少なくとも2つの完全な例を入力する必要があります。その後は3つまで例を追加できます。例は、データセットから取ることも新たに作成することもできます。入力する例が多いほど、ファンクションによってより正確にパターンが識別されます。
  5. 残りのフィールドで、例の前後にデータを追加入力します:
    • [Input 2] (入力2)428990989[Output 2] (出力2)428-99-0989を入力
    • [Input 3] (入力3)281066499[Output 3] (出力3)281-06-6499を入力
    • [Input 4] (入力4)244356471[Output 4] (出力4)244-35-6471を入力
    • [Input 5] (入力5)233262165[Output 5] (出力5)233-26-2165を入力
  6. [Submit] (送信)をクリックします。

タスクの結果

例によって定義された変換が残りの数値に適用される新しいカラムが作成されます。これで、社会保障番号は正しい形式になり、この新しいカラムのヘッダーのセマンティックタイプによって示されるように、自動的にそのように検出されます。無効なデータを含む他のカラムを削除できるようになりました。