パターンに対してデータを分析し表示する - Cloud - 8.0

Talend Studioユーザーガイド

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-03-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

始める前に

データクオリティに必要なSQLエクスプローラーライブラリーをTalend Studioにインストール済みであること。

このタスクについて

分析するカラムに1つ(または複数)のパターンを追加すると、指定したパターンに対してカラムの既存のデータがすべてチェックされます。カラム分析を実行したら、JavaエンジンまたはSQLエンジンを使用して、分析したカラムの有効または無効なすべてのデータにアクセスできます。

Javaエンジンを使って分析を実行すると、Profilingパースペクティブで実際のデータのビューが開きます。SQLエンジンを使って分析を実行すると、Data Explorerパースペクティブで実際のデータのビューが開きます。

これらのライブラリーをインストールしていない場合、 Data Explorer パースペクティブがTalend Studioに表示されず、多くの機能が使用できなくなります。外部モジュールの識別とインストールの詳細は、Talend Studioに外部モジュールをインストールをご覧ください。

特定のパターンに対して分析したカラムで実際のデータを表示するには、以下のようにします:

手順

  1. 分析するカラムを定義およびカラム分析への正規表現またはSQLパターンの追加で説明されているステップを実行し、パターンを使用するカラム分析を作成します。
  2. カラム分析を実行します。
    エディターが[Analysis Results] (分析結果)ビューに切り替わります。
  3. 分析済みカラムの名前の下の[Pattern Matching] (パターンマッチング)に移動します。
    パターンマッチングの生成グラフと、一致結果の詳細を示すテーブルが表示されます。
    [パターンマッチング]セクションからのラベルのコンテキストメニュー。
  4. [Pattern Matching] (パターンマッチング)テーブルのパターン行を右クリックし、オプションを1つ選択します。
    オプション [Results] (結果)
    [View valid/invalid values] (有効な値/無効な値を表示) 選択したカラムに使用したパターンに対して測定された有効または無効なすべての値を含むビューが開きます。
    [View valid/invalid rows] (有効な行/無効な行を表示) 選択したカラムに使用したパターンに対して測定された有効または無効なすべての行を含むビューが開きます。
    [Generate Job] (ジョブの生成) 選択したカラムで有効な行、無効な行、または両方の行を再取得する既製ジョブを生成し、出力ファイルまたはデータベースにそれらを書き込みます。

    詳細は、一致した行および一致しない行を再取得をご覧ください。

タスクの結果

SQLエンジンを使用すると、Data Explorerパースペクティブでビューが開き、このデータエクスプロラーで設定した制限数に従って分析されたデータの有効行と無効行、または有効値と無効値が表示されます。

[データエクスプローラー]パースペクティブでの有効および無効な値と行。

このエクスプローラービューでは、分析に関する基本的な情報も得られます。この情報は同時に複数の分析で作業する際に非常に役立ちます。

データエクスプローラーでは、ユーザー名が空白の接続(MS SQL Serverのシングルサインオンなど)はサポートされていません。そのような接続を使ってデータを分析し、Data Explorerパースペクティブでデータ行を表示しようとすると、警告メッセージが表示され、SQL Serverへの接続認証情報を設定するよう求められます。

Javaエンジンを使用すると、Profilingパースペクティブでビューが開き、分析エディターの[Analysis parameters] (分析パラメーター)で設定した行数制限に基づいて有効なデータや無効なデータが表示されます。詳細は、JavaエンジンまたはSQLエンジンの使用をご覧ください。

[無効な行を表示]タブの概要。

エディターツールバーにある保存アイコンをクリックすると、実行したクエリーが保存され、[DQ Repository] (DQリポジトリー)ツリービューの[Libraries] (ライブラリー) > [Source Files] (ソースファイル)フォルダーの下に表示されます。詳細は、インジケーターで実行したクエリーの保存をご覧ください。