フルネームの部分の抽出 - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

Extract full name parts機能を使用して、フルネームを構成するさまざまな部分をそれぞれのカラムに抽出できます。

このタスクについて

フルネームが含まれているカラムに適用されるこの機能によって、内部でトレーニングされた機械学習モデルを通じ、敬称、ファーストネーム、ミドルネーム、ラストネーム、サフィックス、ニックネームに関する情報を抽出できます。また、そのモデルに基づいて、抽出プロセスの信頼性がわかるトラストスコアも追加されます。

この例では、オンラインサービスのサブスクライバに関する情報(フルネーム、またはサブスクリプションの日付など)を含むデータセットを受け取ったという想定です。ただし、このデータをCRMソリューションにエクスポートする必要があり、フルネーム形式はこのタスクには向いていません。CRMの想定される形式に合わせるには、顧客名の各部を専用のカラムに表示する方がよいと考えます。これを実現する処理は、Extract full name parts機能を、顧客名が含まれているカラムに適用するだけです。

手順

  1. [Name] (名前)カラムのヘッダーをクリックしてその内容を選択します。
  2. 機能パネルにExtract full name partsと入力し、表示される結果をクリックして、関連する機能のオプションを開きます。
  3. 抽出するすべてのカテゴリを選択します。
    この例では、すべてのチェックボックスをオンのままにしておきます。各カテゴリーが新しいカラムに抽出されます。
  4. [Submit] (送信)をクリックします。

タスクの結果

フルネームの部分だったさまざまな情報が抽出され、新しいカラムに別々に表示されます。データはこれで適切な形式になりました。これは、将来CRMソリューションにエクスポートしたり、フィルターを適用してデータセットの作業を進めたりする場合にも、はるかに実用的です。
ヒント: この変換はスマート入力関数を使って行うこともできます。