一致した行および一致しない行の再取得 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

カラムのセットの分析にパターンを追加すると(単純なテーブル分析)、結果グラフには、1つのみでなく使用された全てのパターンを全てのカラムでマッチングして、その値の割合が表示されます。カラムのセットの分析を実行した後、一致する行/一致しない行を再取得する既製ジョブを生成し、それらを出力ファイルまたはデータベースに書き込むことができます。

前提条件:Studioの Profiling パースペクティブで、パターンを使用するカラムのセットの分析が作成され、実行されていること。詳細は、パターンを使ってカラムセット分析を作成するを参照して下さい。

分析対象カラムの一致する行および一致しない行を再取得するジョブを生成するには、以下のようにします:

手順

  1. パターンを使ってカラムセット分析を作成するで説明されている手順を実行し、異なるパターンを使用する単純なテーブル分析を作成します。
  2. カラム分析を実行します。
  3. [Analysis Results] (分析結果)ビューで[All Match] (すべて一致)をクリックし、対応するビューを開きます。
    生成されたグラフは、使用されたパターンの総計を表す単一棒グラフとなります。このグラフには、"全て"のパターンに一致する行と一致しない行の数が表示され、一致した結果の詳細を示すテーブルも一緒に表示されます。
  4. [All Match] (すべて一致)テーブルでパターンの行を右クリックして、[Generate an ETL Job to handle rows] (行を処理するETLジョブを生成)を選択します。 統合 パースペクティブに生成されたジョブが開きます。
    このジョブは抽出、変換、ロードプロセスを使用して、2つの個別の出力ファイルに、"全て"のパターンと一致する/一致しない分析対象カラムの有効/無効な行を書き込みます。
  5. 必要に応じて、異なる出力コンポーネントを使用して、異なるファイルのタイプまたはデータベースで有効/無効な行を再取得します。
  6. ジョブを保存し、[F6]を押して実行します。分析対象カラムの有効および無効な行が、指定された出力ファイルに書き込まれます。