データベースカラムの選択とサンプルデータの設定 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. [DB connections] (DB接続)を展開し、目的のデータベースで、分析を行うカラムに移動します。
    注: DB2データベースでプロファイリングをする場合、テーブルのカラム名に二重引用符が使用されていても、カラムを取得する際に二重引用符は取得されません。そのため、DB2データベースのテーブルではカラム名に二重引用符を使用しないことが推奨されます。
  2. カラムを選択し、[Finish] (終了)をクリックしてウィザードを閉じます。
    新規作成した分析のフォルダーが[DQ Repository] (DQリポジトリ)ツリービューの[Analysis] (分析)ノードの下に表示され、分析エディターが開いて、分析メタデータが表示されます。
    この例では、フルネーム、電子メールアドレス、売上額を分析します。
  3. [Data preview] (データプレビュー)ビューで、[Refresh Data] (データの更新)をクリックします。
    選択したカラム内のデータがテーブルに表示されます。
  4. [Data preview] (データプレビュー)ビューで、以下を選択します。

    オプション

    内容...

    [New Connection] (新規接続)

    ウィザードを開き、エディター内からデータソースへの接続を作成します。

    データソースへの接続を作成する方法についての詳細は、データベースへの接続およびファイルへの接続を参照して下さい。

    このセクションの上にある[Connection] (接続)フィールドには、Studioで作成したすべての接続がリストされています。

    [Select Columns] (カラムの選択)

    [Column Selection] (カラム選択)ダイアログボックスを開くと、テーブル内にリストされているカラムを選択し、その選択を分析または変更することができます。

    開いたダイアログボックスから、[Table filter] (テーブルフィルター)フィールドまたは[Column filter] (カラムフィルター)フィールドをそれぞれ使用して、テーブルまたはカラムのリストをフィルター処理することができます。

    [Select Indicators] (インジケーターの選択)

    [Indicator Selection] (インジケーター選択)ダイアログボックスを開き、カラムのプロファイリングに使用するインジケーターを選択することができます。

    詳細は、カラムにインジケーターを設定するを参照して下さい。

    [n first rows] (最初のn行)

    または

    [n random rows] (ランダムなn行)

    選択したカラムから最初のNデータレコードをテーブルにリスト、または選択したカラムからランダムなNレコードをリストします。

    [Refresh Data] (データの更新)

    設定した条件に従って、選択したカラムにデータを表示します。

    [Run with sample data] (サンプルデータで実行)

    [Limit] (制限)フィールドでサンプルデータセットにのみ分析を実行します。

  5. [Limit] (制限)フィールドで、テーブルに表示してサンプルデータとして使用するデータレコードの数を設定します。
  6. 分析するカラム数が多い場合は、[Analyzed Columns] (分析対象カラム)ビューで右上の矢印を使用して、ビュー内に複数のページを開きます。
    分析するカラムを[DQ Repository] (DQリポジトリ)ツリービューからこのビューの[Analyzed Columns] (分析対象カラム)リストに直接ドラッグすることもできます。
    分析するカラムの1つがプライマリーキーまたは外部キーの場合、そのデータマイニングタイプは、[Analyzed Columns] (分析対象カラム)リストで表示すると、自動的に[Nominal] (名義)になります。データマイニングタイプの詳細は、データマイニングのタイプを参照して下さい。
  7. 必要に応じて、[Analyzed Columns] (分析対象カラム)ビューに表示されるいずれかのカラムを右クリックし、[Show in DQ Repository view] (DQリポジトリビューで表示)を選択します。[DQ Repository] (DQリポジトリ)ツリービューのデータベース接続の下にそのカラムが見つかります。