一致分析の作成 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

Talend DQポータルTalend 7.1以降、非推奨となっています。Data Qualityデータマートを自身のレポートツールに接続することはできません。

マッチング分析では、ブロッキングキーやマッチングキーまたはサバイバーシップルールを使ってデータベース内または区切り記号付きファイル内のカラムのセットを比較し、類似するレコードのグループを作成できます。

このタスクについて

この分析によって、一致ルールを作成してデータでテストし、tMatchGroupコンポーネントで一致ルールを使用する前などに重複値の数を評価できます。現在、同じテーブル内のカラムに対してのみ、一致ルールをテストできます。

前提条件: Studioの Profiling パースペクティブが選択済みであること。1つ以上のデータベースまたはファイル接続が[Metadata] (メタデータ)ノードの下で定義されていること。詳細は、データベースへの接続を参照して下さい。

マッチング分析をセットアップするシーケンスには、次の手順が含まれます。

手順

  1. Studioのツリービューの[Metadata] (メタデータ)フォルダーの下で定義されている接続がない場合は、エディター内からデータソースへの接続を作成する。
    詳細は、一致分析の設定を参照して下さい。
  2. 一致プロセスを使用して、類似するレコードを検索したいテーブルまたはカラムのグループを定義する。
  3. ブロッキングキーを定義して、比較が必要なペアの数を減らす。
    詳細は、一致ルールの定義を参照して下さい。
  4. グループ化する類似のレコードに基づいて、一致キーと一致メソッドを定義する。詳細は、一致ルールの定義を参照して下さい。
  5. マッチング分析エディターから一致ルールをエクスポートして、Studioリポジトリーで一元管理する。
  6. マッチング分析に基づいてレポートを生成し、遠隔データベースで履歴を生成する。これらのレポートを使用して現在と履歴の統計を比較し、データクオリティの向上または劣化を判断できます。詳細は、レポートとは?を参照して下さい。
  7. Studioで生成されたレポートの検討および監視を可能にする異なる分析ツールにアクセスします。ポータルの詳細は、『Talend DQポータルユーザーおよび管理者ガイド』を参照してください。ポータルのインストールについての詳細は、『Talendインストレーションおよびアップグレードガイド』を参照して下さい。