このドキュメントのユースケースでは、Talend Cloud Data Preparationを使ってデータのフォーマット化やクレンジング化を行う方法について説明します。
アプリケーションに組み込まれたガイド付きツアーからデモデータセットとその上に作成されたデモプレパレーションをインポートすれば、データ全体の品質向上につながるアイデアが得られます。
- Customersデータセットは、Standardizeプレパレーションのソースとして使われます。ここでは、州名の標準化、無効なレコードの削除、電話番号の統合、日付を含めた形式の変更、マスキング機能を使ったデータの保護について説明しています。スマート入力機能は、日付を対応する曜日に変換するために使われます。
- Build_emailプレパレーションではMarketing LeadsデータセットとEmails Referenceデータセットを使い、それらを結合して顧客名、会社名、対応するドメインアドレスからメールアドレスを再作成します。
アプリケーション内で直接利用できるこれらのアプリケーションに加え、このページの左パネルにある[Downloads] (ダウンロード)タブで他のデータセットをダウンロードして使用すれば、次の例を完了させることができます。
- CRM_export.xlsxデータセットに基づいてプレパレーションを構築し、顧客の携帯電話番号と固定電話番号をすべて新しいカラムに統合して、携帯でも固定でも有効な番号が少なくとも1つずつあるようにします。
CRMソリューションからの電話番号リストの統合を参照してください。
- marketing_leads.csvデータセットとemails_reference.csvデータセットは、ルックアップ操作を介して同じプレパレーションで一緒に使うことによって、会社のドメインアドレスに関する情報を結合させてメールアドレス全体を再作成できます。
マーケティングソリューションへのアップロード前のメールアドレスの再作成を参照してください。
- HRMS_export.xlsxデータセットでは、日付形式を変更し、任意の列から特定の文字列を抽出する方法が学べます。
人事管理システムのデータのクレンジングを参照してください。
- customer_contact_data.csvデータセットは、空の無効なデータセットをクリーニングし、テキストレコードの不要な空白スペースを削除すれば改良できます。
マーケティングソリューションにアップロードする顧客データの準備を参照してください。
- video_customers.xlsxデータセットでは、シナリオに従ってフィルターを組み合わせてif条件を作成し、特定の顧客グループのデータを分離します。
フィルターを使った、顧客データ上での"if"条件の作成を参照してください。
- car_dealership.xlsxデータセットは、通常のフィルターでは選択できないデータを、正規表現を使ってマッチングさせる方法を示すプレパレーションのベースとして使用されます。
正規表現とフィルターを使って顧客データに "or" 条件を作成を参照してください。