メイン コンテンツをスキップする 補完的コンテンツへスキップ

分析するカラムのセットを定義

始める前に

Talend StudioProfilingパースペクティブでデータベース接続が少なくとも1つ定義されていること。

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで[Data Profiling] (データプロファイリング)を展開し、[Analyses] (分析)をクリックします。
  2. [New Analysis] (新しい分析)をクリックします。[Create New Analysis] (新しい分析を作成)ウィザードが開きます。
  3. Column Set Analysisの最初の数文字を入力して、[Column Set Analysis] (カラムセット分析)を選択して[Next] (次へ)をクリックします。
  4. 名前を入力します。
  5. オプション: 該当するフィールドで、カラム分析のメタデータ(目的説明作成者)を設定します。
  6. [Next] (次へ)をクリックし、データベースの接続先を選択します。
  7. [DB connections] (データベース接続)を展開します。
  8. 目的のデータベースで分析するカラムを参照して選択し、[Finish] (終了)をクリックしてウィザードを閉じます。
    この例では、customerテーブルでアカウント番号(account_num)、教育(education)、メール(email)、ファーストネーム(fname)、セカンドネーム(Iname)、性別(gender)という6つのカラムを分析します。分析結果に表示される統計は、行数、個別数、一意数、超複数で、いずれもレコード(カラムセットの値)に適用されます。
    定義された分析メタデータと共に分析エディターが開き、新規作成された分析用のフォルダーが[DQ Repository] (DQリポジトリー)ツリービュー内の[Analyses] (分析)の下に表示されます。
    [分析結果]タブにある[データプレビュー]の概要。
    サンプルデータが[Data Preview] (データプレビュー)セクションに表示され、選択したカラムが分析エディターの[Analyzed Column] (分析済みカラム)セクションに表示されます。

    このサンプルでは、customerテーブル内のカラム6つのセット、つまり口座番号 (account_num)、教育(education)、メールアドレス(email)、ファーストネーム(fname)、セカンドネーム(Iname)、性別(gender)を分析します。分析結果に表示される統計は、行数、個別数、一意数、超複数で、いずれもレコード(カラムセットの値)に適用されます。

  9. [Data preview] (データプレビュー)セクションで、オプションを1つ選択します:
    オプション 結果
    [New Connection] (新規接続) ウィザードを開き、エディター内からデータソースへの接続を作成するか、変更します。

    このセクションの上部にある[Connection] (接続)フィールドには、Talend Studioで作成した接続がすべてリスト表示されています。

    [Select Columns] (カラムを選択) [Column Selection] (カラム選択)ダイアログボックスを開くと、テーブル内にリスト表示されているカラムを選択し、その選択を分析または変更できます。

    開いたダイアログボックスで[Table filter] (テーブルフィルター)フィールドや[Column filter] (カラムフィルター)フィールドに必要なテキストを入力すると、テーブルやカラムのリストをフィルタリングできます。

    [n first rows] (最初のn行)または[n random rows] (ランダムなn行) 選択したカラムから最初のNデータレコードをテーブルにリスト、または選択したカラムからランダムなNレコードをリスト表示します。
    [Refresh Data] (データを更新) 設定した条件に従って、選択したカラムにデータを表示させます。
    [Run with sample data] (サンプルデータで実行) [Limit] (制限)フィールドで、サンプルデータセットにのみ分析を実行します。
  10. [Limit] (制限)フィールドで、テーブルに表示してサンプルデータとして使用するデータレコードの数を設定します。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。