一致分析を作成 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

一致分析では、ブロッキングキーやマッチングキー、およびサバイバーシップルールを使ってデータベース内または区切り付きファイル内のカラムのセットを比較し、類似するレコードのグループを作成できます。

始める前に

Metadataノードの下で、データベースかファイル接続が少なくとも1つ定義されていること。

このタスクについて

この分析によって、マッチングルールを作成してデータでテストし、重複値の数を評価できるようになります。マッチングルールは同じテーブル内のカラムに対してのみテストできます。

対象製品:

Big Data Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Talend DQ PortalTalend 7.1以降、非推奨となっています。

手順

  1. Studioのツリービューの[Metadata] (メタデータ)フォルダーの下で定義されている接続がない場合は、エディター内からデータソースへの接続を作成する。
    詳細は、一致分析の設定をご覧ください。
  2. 一致プロセスを使用して、類似するレコードを検索したいテーブルまたはカラムのグループを定義する。
  3. ブロッキングキーを定義して、比較が必要なペアの数を減らす。
    詳細は、マッチングルールを定義をご覧ください。
  4. グルーピングする類似のレコードに基づいて、マッチングキーと一致メソッドを定義する。詳細は、マッチングルールを定義をご覧ください。
  5. 一致分析エディターからマッチングルールをエクスポートして、Studioリポジトリーで一元管理する。
  6. 一致分析に基づいてレポートを生成し、遠隔データベースで保存する。これらのレポートを使って現在の統計と過去の統計を比較することで、データの進化を判断できます。詳細は、レポートとはをご覧ください。
  7. 対象製品:

    Big Data Platform

    Data Fabric

    Data Management Platform

    Data Services Platform

    MDM Platform

    Real-Time Big Data Platform

    Studioで生成されたレポートの検討および監視を可能にする異なる分析ツールにアクセスします。ポータルの詳細は、Talend DQ Portalユーザー&管理者ガイドをご覧ください。ポータルのインストールに関する詳細は、Talendインストール&アップグレードガイドをご覧ください。