電話番号を標準化するジョブの生成 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

Studioの Profiling パースペクティブを使用してデータベース内の電話番号を分析すると、指定されたカラムの電話番号に対して正しい形式を提供する既製ジョブを後で生成できます。

電話番号インジケーターの詳細は、[Phone number statistics] (電話番号統計)を参照して下さい。

前提条件:Studioの Profiling パースペクティブで電話番号のカラム分析が作成され、実行されていること。カラム分析の作成方法の詳細な手順は、分析するカラムの定義とインジケーターの設定を参照して下さい。

分析対象カラムの電話番号を標準化するには、以下のようにします:

  1. Studioの Profiling パースペクティブから、電話番号を含む指定されたカラムに[Phone Number Statistics] (電話番号統計)インジケーターを設定します。

  2. この分析を実行し、結果を[Analysis Results] (分析結果)ビュー内に開きます。

  3. [Phone Number Statistics] (電話番号統計)テーブルと[Count] (カウント)リストで、[Valid Phone Number Count] (有効な電話番号の数)[Possible Phone Number Count] (可能な電話番号の数)、または[Well formed National Number Count] (正しい形式の国内番号の数)を右クリックして、コンテキストメニューから[Generate a standardization phone number job] (電話番号を標準化するジョブを生成する)を選択します。

    Studioに 統合 パースペクティブが開き、tStandardizePhoneNumberコンポーネントで生成されたジョブが表示されます。このコンポーネントの詳細は、『Talendコンポーネントリファレンスガイド』のデータクオリティの章を参照して下さい。

    新しく生成されたジョブのノードは、[Integration] (統合)パースペクティブの[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)フォルダーの下にも表示されます。

生成されたジョブには、カラム分析に使用する接続および分析対象カラムに応じて、入力およびtStandardizePhoneNumberコンポーネントが設定されています。

出力コンポーネントはファイルコンポーネントですが、これをデータベース出力コンポーネントに置き換えて、標準化電話番号を直接特定のデータベースに書き込むことなどもできます。

電話番号の標準化に使用する形式を決定するには、以下のようにします:

  1. tStandardizePhoneNumberコンポーネントをダブルクリックして、[Component] (コンポーネント)ビューを開きます。

  2. [Phone number format for output] (出力用電話番号形式)リストから、選択したカラムの電話番号を標準化する形式を選択します。

  3. 変更を保存します。

出力コンポーネントを設定するには、以下のようにします:

  1. 出力コンポーネントをダブルクリックして、[File Name] (ファイル名)フィールドで、電話番号分析結果を格納する出力ファイルのパスを設定します。

  2. [Sheet Name] (シート名)フィールドで、標準化の結果を書き込むExcelシートの名前を設定します。

  3. ジョブを保存し、[F6]を押して実行します。

    電話番号の標準化の結果は、指定されたExcelシートに書き込まれます。

  4. 必要に応じて、生成されたジョブでtFileOutputExcelを右クリックし、[Data Viewer] (データビューア)を選択します。

    Studioに標準化されたデータのプレビューが開きます。