メイン コンテンツをスキップする 補完的コンテンツへスキップ

分析されたデータを表示およびエクスポート

始める前に

  • Profilingパースペクティブを選択済みであること。
  • カラム分析が作成され実行されていること。

このタスクについて

分析の実行後は:
  • SQLエンジンまたはJavaエンジンを使い、分析エディターの[Analysis Results] (分析結果)ビューで統計結果テーブルの行を右クリックし、実際のデータのビューにアクセスできます。
  • Javaエンジンを使い、分析結果から実際のデータのビューにアクセスできます。
  • SQLエンジンを使い、分析結果からData Explorerパースペクティブを開き、実際のデータのビューにアクセスできます。
[シンプル統計]セクションからの分析済みデータのコンテキストメニュー。

手順

  1. 分析エディターの下部にある[Analysis Results] (分析結果)タブをクリックし、分析結果の詳細ビューを開きます。
  2. 分析済みカラムの統計結果でデータ行を右クリックし、次のいずれかのオプションを選択します。

    オプション

    操作

    [View rows] (行を表示)

    分析済みカラムの全データ行を示すリストビューが開きます。

    情報メモ注: [Duplicate Count] (超複数)インジケーターの場合、[View rows] (行を表示)オプションを選択すると、重複するすべての行が表示されます。そのため、超複数が12だとすると、このオプションでは24行が表示されます。

    [View values] (値を表示)

    分析済みカラムの実際のデータ値を示すリストビューが開きます。

    重複を検出

    後続処理のため、選択されたカラムで一意レコードと重複レコードを検出および区別する既製ジョブを生成します。このジョブによって、重複レコードはすべてデフォルトでリジェクトファイル(CSV)に出力され、一意値は別のファイルに書き込まれます。詳細は、分析済みカラムの重複値を特定するジョブの生成をご覧ください。

    カラム分析で正規表現とSQLパターンを使用する場合は、前述以外のオプションがあります。

    SQLエンジンを使用すると、Data Explorerパースペクティブでビューが開き、このパースペクティブで設定した制限数に従って分析されたデータの行または値が表示されます。

    Data ExplorerパースペクティブがTalend Studioに存在しない場合は、データクオリティが正しく機能するよう、必要な特定のSQL Explorerライブラリーをインストールする必要があります。インストールしていないと、エラーメッセージが表示される場合があります。

    外部モジュールの識別とインストールの詳細は、Talend Studioに外部モジュールをインストールをご覧ください。

    クエリーと、そのクエリーに対して返された行の例。
    情報メモ警告: データエクスプローラーでは、ユーザー名が空白の接続(MS SQL Serverのシングルサインオンなど)はサポートされていません。そのような接続を使ってデータを分析し、Data Explorerパースペクティブでデータ行を表示しようとすると、警告メッセージが表示され、SQL Serverへの接続認証情報を設定するよう求められます。

    Javaエンジンを使用すると、Talend Studioでビューが開き、分析エディターの[Analysis parameters] (分析パラメーター)ビューで設定した数に従って分析されたデータの行が表示されます。

    [行を表示]タブの概要。
  3. このビューで、分析されたデータをCSVファイルにエクスポートできます。
    1. ビューの左上にある[Export to .csv] (.csvにエクスポート)をクリックします。
    2. ダイアログボックスが開きます。
      [CSVエクスポートオプション]ダイアログボックスの概要。
    3. [Choose...] (選択...)をクリックし、CSVファイルを保存する場所に移動し、名前を付けます。
    4. OKをクリックしてダイアログボックスを閉じます。
      指定した場所にCSVファイルが作成され、ビューのリストに含まれる分析されたすべてのデータ行が保存されます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。