スマート入力を使用した社会保障番号の形式の設定 - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

スマート入力関数を使用すると、サンプルで定義されたパターンに基づいて自動的に社会保障番号の形式を設定できます。

この例では、名前、電子メールアドレスなどの顧客情報を含むデータセットを処理していますが、最も重要なのは社会保障番号です。問題は、これらの社会保障番号がハイフンなしで間違った形式で入力されたことです。例えば、334-20-6259などの数値は、このデータセットでは334206259として入力されています。この形式は間違っているため、ほとんどのデータはアプリケーションによって銀行のルーティング転送番号として解釈され、無効と見なされます。

この間違いを解決するには、入力するいくつかの例に基づいてパターンに従って、スマート入力関数を使用し、データに正しい社会保障番号形式を適用します。

手順

  1. ssnカラムのヘッダーをクリックして、その内容を選択します。
  2. 関数パネルでスマート入力と入力し、結果をクリックして関連する関数のオプションを表示します。
  3. [Input 1] (入力1)フィールドに、変換するssnカラムの値の1つ、472989590などを入力します。
  4. [Output 1] (出力1)フィールドに、同じ値を入力しますが、この時は正しい形式になります:472-98-9590.
    関数を動作させるには、適用する変換の少なくとも2つの完全なサンプルを入力する必要があります。その後、あと3つまでサンプルを追加できます。サンプルは、データセットから取ることも新たに作成することも可能です。入力するサンプルが多いほど、関数によってより正確にパターンが識別されます。
  5. 残りのフィールドで、サンプルの前後にデータを追加入力します:
    • [Input 2] (入力2)428990989[Output 2] (出力2)428-99-0989を入力
    • [Input 3] (入力3)281066499[Output 3] (出力3)281-06-6499を入力
    • [Input 4] (入力4)244356471[Output 4] (出力4)244-35-6471を入力
    • [Input 5] (入力5)233262165[Output 5] (出力5)233-26-2165を入力
  6. [Submit] (送信)をクリックします。

タスクの結果

例によって定義された変換が残りの数値に適用される新しいカラムが作成されます。これで、社会保障番号は正しい形式になり、この新しいカラムのヘッダーのセマンティックタイプによって示されるように、自動的にそのように検出されます。無効なデータを含む他のカラムを削除できるようになりました。