電話番号情報を抽出 - 8.0

Talend Data Preparationユーザーガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-26

Extract phone number informationファンクションを使って、電話番号に関する新しいタイプの情報を複数の新しいカラムに抽出できます。

このファンクションでは、電話タイプ、国、地域、地理的地域、通信事業者名、タイムゾーンに関する情報を抽出できます。ただし、ファンクションの動作は電話番号データを含んでいるカラムのセマンティックタイプによります。

  • セマンティックタイプが、US PhoneUK PhoneDE Phone、またはFR Phoneのいずれかに対応する場合は、出力が必要なフィールドを選択し、ファンクションを適用するだけの処理になります。
  • カラムに異なる国からの番号が含まれており、フォーマットがそれぞれ異なり、一致するセマンティックタイプがよりジェネリックなPhone numberである場合は、Extract phone number informationファンクションを使用する前にフォーマット作業が必要になります。この手順が必要なのは、標準化されていない番号は複数の国に対応するストラクチャーになっている場合が多く、国を一意識別することが不可能であるためです。

ここでは、世界中の顧客の基本的な顧客情報(名前、国、電話番号など)が含まれているデータセットの例を見てみましょう。このプレパレーションの目的は、連絡先情報として携帯電話番号を入力した顧客のみを残すように電話番号を処理することです。[Extract phone number information] (電話番号情報を抽出)には電話タイプに関するこの情報を表示できませんでしたが、番号がさまざまなフォーマットになっているため、このままではまだファンクションを適用できません。最初に、countryカラムの情報を使用して[phone]カラムにフォーマットオペレーションを行い、番号に国際電話のプレフィックスを追加します。Talend Data Preparationはこの段階で、形式が揃い、それぞれの国情報が含まれた電話番号の情報を抽出できます。

手順

  1. phoneカラムのヘッダーをクリックしてその内容を選択します。
  2. ファンクションパネルでFormat phone numbersファンクションを選択し、countryカラムからの情報を使用して適用し、出力を[International] (国際)形式に設定します。

    これで、電話番号は単一の形式になり、プレフィックスとして国際コードが付いています。電話番号から国を一意識別し、追加情報を抽出できるようになりました。

    別のカラムでFormat phone numbersファンクションを使用する方法については、電話番号をフォーマットをご覧ください。

  3. ファンクションパネルにExtract phone number informationと入力し、結果をクリックして関連するファンクションのオプションを開きます。
  4. 抽出する情報のさまざまなカテゴリーに対応するチェックボックスをオンにします。

    各カテゴリーが新しいカラムにエクスポートされます。この例では、[Phone number region] (電話番号の地域コード)チェックボックスはオフにしておきます。データセットには国コードの形式で地域に関する情報が既に含まれているからです。

  5. [Language] (言語)ドロップダウンリストで、出力する情報に使用する言語を選択します。この例では[English] (英語)です。
  6. [Submit] (送信)をクリックします。

タスクの結果

フォーマットを指定する簡単な手順を終えると、電話番号から抽出されたさまざまな情報を含むカラムが作成済みとなっています。情報はGoogle電話ライブラリーから抽出されたものです。これで、それぞれの番号が固定回線または携帯電話のどちらであるかを容易に特定でき、プレパレーションを続行できます。

空または無効だった行は、ファンクションの適用後に空のセルを生成します。