テーブル名またはカラム名から分析の作成 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

Studioでは、簡単な方法を使用して1つ以上のカラム分析を作成することができます。必要な操作は、[DQ Repository] (DQリポジトリ)ツリービューの該当する[DB Connection] (DB接続)フォルダーの下にあるテーブル名またはカラム名から始めます。

ただし、テーブル名から始める場合のカラム分析を作成するオプションは、カラム名から始める場合のオプションとは異なります。

[DB Connection] (DB接続)の該当するテーブル名から直接カラム分析を作成するには、次の手順に従います。

  1. [DQ Repository] (DQリポジトリ)ツリービューで、[Metadata] (メタデータ) > [DB Connections] (DB接続)の順に展開します。

  2. 分析するカラムが格納されるテーブルを参照し、右クリックします。

  3. コンテキストメニューから、以下のように選択します:

    アイテム

    内容...

    [Match Analysis] (マッチ分析)

    一致分析エディターを開いて一致ルールを定義し、一致ルールを使用するカラムを選択できます。

    詳細は、重複値の分析を参照して下さい。

    [Table Analysis] (テーブル分析)

    SQLビジネスルールを使って、選択したテーブルを分析します。

    シンプル統計インジケーターの詳細は、[Simple statistics] (シンプル統計)を参照してください。

    [Column Analysis] (カラム分析)

    シンプル統計インジケーターを使って、選択したテーブルに含まれるすべてのカラムを分析します。

    シンプル統計インジケーターの詳細は、[Simple statistics] (シンプル統計)を参照してください。

    [Pattern Frequency Analysis] (パターン頻度分析)

    パターン頻度統計インジケーターを行カウントインジケーターとNULL値カウントインジケーターとともに使って、選択したテーブルに含まれるすべてのカラムを分析できます。

    パターン頻度統計の詳細は、[Pattern frequency statistics] (パターン頻度統計)を参照してください。

    パターン頻度統計インジケーターでサポートされているデータベースおよびエンジンの詳細は、 List of engines used and database types supported when using Pattern Frequency Statistics indicators (https://help.talend.com)のドキュメンテーションを参照して下さい。

前述の手順は、分析するカラムの定義とインジケーターの設定で説明されている手順の代わりになります。これで、カラム分析の確定と実行での説明に従って、次に進むことができます。

[DB Connection] (DB接続)のカラム名から直接カラム分析を作成するには、次の手順に従います。

  1. [DQ Repository] (DQリポジトリ)ツリービューで、[Metadata] (メタデータ) > [DB Connections] (DB接続)の順に展開します。

  2. 分析するカラムが格納されているテーブルに移動し、右クリックします。

  3. コンテキストメニューから、以下のように選択します:

    アイテム

    内容...

    [Analyze] (分析)

    選択したカラムの分析を作成します。

    選択したカラムの分析に使用するインジケーターを後で設定する必要があります。

    インジケーターの設定の詳細は、カラムにインジケーターを設定するを参照してください。カラム分析の実行についての詳細は、カラム分析の確定と実行を参照してください。

    [Nominal Value Analysis] (名義分析)

    名義データに適したインジケーターで設定済みの名義データに対するカラム分析を作成します。すなわち、[Value Frequency] (値の頻度)、[Simple Statistics] (シンプル統計)、[Text Statistics] (テキスト統計)のインジケーターです。

    [Simple Analysis] (単純分析)

    シンプル統計インジケーターを使って、選択したカラムを分析します。

    シンプル統計インジケーターの詳細は、[Simple statistics] (シンプル統計)を参照してください。

    [Pattern Frequency Analysis] (パターン頻度分析)

    行カウントインジケーターとNULL値カウントインジケーターとともにパターン頻度統計インジケーターを使って、選択したカラムを分析します。

    パターン頻度統計の詳細は、[Pattern frequency statistics] (パターン頻度統計)を参照してください。

    パターン頻度統計インジケーターでサポートされているデータベースおよびエンジンの詳細は、 List of engines used and database types supported when using Pattern Frequency Statistics indicators (https://help.talend.com)のドキュメンテーションを参照して下さい。

    [Analyze Column Set] (カラムセット分析)

    カラムセットの内容を分析します。カラム分析と同様、この分析は個々のカラムではなくカラムセット(フルレコード)に焦点を当てます。

    詳細は、単純なテーブル分析の作成(カラムセット分析)を参照して下さい。

    [Analyze Correlation] (相関分析)

    データベーステーブルの名義カラムと間隔カラムまたは名義カラムと日付カラムの間のカラムコリレーション分析を実行します。

    詳細は、数値コリレーション分析を参照して下さい。

    [Analyze matches] (一致の分析)

    一致分析エディターを開いて一致ルールを定義し、一致ルールを使用するカラムを選択できます。

    詳細は、重複値の分析を参照して下さい。

前述の手順は、分析するカラムの定義とインジケーターの設定で説明されているいずれかの手順または両方の手順の代わりになります。これで、カラム分析の確定と実行での説明に従って、次に進むことができます。