分析されたデータの表示とエクスポート - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

SQLエンジンまたはJavaエンジンを使って、分析エディターの[Analysis Results] (分析結果)ビューから分析を実行したら、統計結果テーブルの行を右クリックし、実際のデータのビューにアクセスできます。

Javaエンジンを使って分析を実行したら、分析結果から実際のデータのビューにアクセスできます。

SQLエンジンを使って分析を実行したら、分析結果からData Explorerパースペクティブを開いて、実際のデータのビューにアクセスできます。

前提条件: StudioでProfilingパースペクティブを選択していること。カラム分析が作成され実行されていること。

  1. 分析エディターの下部にある[Analysis Results] (分析結果)タブをクリックし、分析結果の詳細ビューを開きます。
  2. 分析されたカラムの統計結果でデータ行を右クリックし、次のいずれかのオプションを選択します。

    オプション

    操作

    [View rows] (行の表示)

    分析対象カラムの全データ行を示すリストビューが開きます。

    注: [Duplicate Count] (重複カウント)インジケーターの場合、[View rows] (行の表示)オプションを選択すると、重複するすべての行が表示されます。そのため、重複数が12だとすると、このオプションでは24行が表示されます。

    [View values] (値の表示)

    分析対象カラムの実際のデータ値を示すリストビューが開きます。

    [Identify duplicates] (重複の検出)

    後続処理のため、選択されたカラムでユニークなレコードと重複レコードを検出および区別する既製ジョブを生成します。このジョブによって、重複レコードはすべてデフォルトでリジェクトファイル(.csv)に出力され、ユニークな値は別のファイルに書き込まれます。詳細は、分析対象カラムの重複値を特定するジョブの生成を参照して下さい。

カラム分析で正規表現とSQLパターンを使用する場合は、前述以外のオプションがあります。詳細は、カラム分析での正規表現とSQLパターンの使用およびパターンを基にしてデータを分析し表示するを参照して下さい。

SQLエンジンを使用すると、Data Explorerパースペクティブにビューが開き、このパースペクティブで設定した制限数に従って分析されたデータの行または値が表示されます。

Data ExplorerパースペクティブがStudioに存在しない場合は、データクオリティを正しく機能させるために必要な特定のSQL Explorerライブラリをインストールする必要があります。インストールしていないと、エラーメッセージが表示される場合があります。

外部モジュールの確認とインストールの詳細は、『Talend Installation and Upgrade Guide』を参照して下さい。

このエクスプローラービューでは、分析に関する基本的な情報も得られます。この情報は同時に複数の分析で作業する際に非常に役立ちます。
警告: データエクスプローラーでは、ユーザー名が空白の接続(MS SQL Serverのシングルサインオンなど)はサポートされていません。そのような接続を使ってデータを分析し、Data Explorerパースペクティブでデータ行と値を表示しようとすると、SQL Serverへの接続資格情報を設定するよう警告メッセージが表示されます。

Javaエンジンを使用すると、Studioでビューが開き、分析エディターの[Analysis parameters] (分析パラメーター)ビューで設定した数に従って分析されたデータの行が表示されます。詳細は、JavaエンジンまたはSQLエンジンの使用を参照して下さい。

分析したデータをこのビューからcsvファイルにエクスポートできます。これを設定するには、次の手順に従います。

  1. ビューの右上にあるアイコンをクリックします。 ダイアログボックスが開きます。
  2. [Choose...] (選択...)をクリックし、csvファイルを保存する場所に移動し、名前を付けます。
  3. [OK]をクリックして、ダイアログボックスを閉じます。 指定した場所にcsvファイルが作成され、ビューのリストに含まれる分析されたすべてのデータ行が格納されます。