分析するカラムのセットの選択 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. [DB connections] (DB接続)を展開します。
  2. 目的のデータベースで分析するカラムを参照して選択し、[Finish] (終了)をクリックしてこの[New analysis] (新規分析)ウィザードを閉じます。

    定義された分析メタデータとともに分析エディターが開き、新規作成された分析用のフォルダーが[DQ Repository] (DQリポジトリ)ツリービュー内の[Analyses] (分析)の下に表示されます。

    サンプルデータが[Data Preview] (データプレビュー)セクションに表示され、選択したカラムが分析エディターの[Analyzed Column] (分析対象カラム)セクションに表示されます。

    この例では、[customer]テーブル内のカラム6つのセット、つまり口座番号 (account_num)、教育(education)、電子メールアドレス(email)、ファーストネーム(fname)、セカンドネーム(Iname)、性別(gender)を分析します。分析結果に表示される統計は、行カウント、重複を除いたカウント、ユニークカウント、重複カウントで、いずれもレコード(カラムセットの値)に適用されます。
  3. [Data preview] (データプレビュー)セクションで、以下を選択します。

    オプション

    目的

    [New Connection] (新規接続)

    ウィザードを開き、エディター内からデータソースへの接続を作成するか、または変更します。

    データソースへの接続を作成する方法についての詳細は、データベースへの接続およびファイルへの接続を参照して下さい。

    このセクションの上にある[Connection] (接続)フィールドには、Studioで作成したすべての接続がリストされています。

    [Select Columns] (カラムの選択)

    [Column Selection] (カラム選択)ダイアログボックスを開くと、テーブル内にリストされているカラムを選択し、その選択を分析または変更することができます。

    開いたダイアログボックスから、[Table filter] (テーブルフィルター)フィールドまたは[Column filter] (カラムフィルター)フィールドをそれぞれ使用して、テーブルまたはカラムのリストをフィルター処理することができます。

    [n first rows] (最初のn行)

    または

    [n random rows] (ランダムなn行)

    選択したカラムから最初のNデータレコードをテーブルにリスト、または選択したカラムからランダムなNレコードをリストします。

    [Refresh Data] (データの更新)

    設定した条件に従って、選択したカラムにデータを表示します。

    [Run with sample data] (サンプルデータで実行)

    [Limit] (制限)フィールドでサンプルデータセットにのみ分析を実行します。

  4. [Limit] (制限)フィールドで、テーブルに表示してサンプルデータとして使用するデータレコードの数を設定します。