区切り付きファイル内で分析するカラムセットの選択 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

手順

  1. [FileDelimited]接続を展開し、分析するカラムのセットを参照します。
  2. 分析するカラムを選択し、[Finish] (終了)をクリックしてこの[New analysis] (新しい分析)ウィザードを閉じます。
    定義された分析メタデータと共に分析エディターが開き、新規作成された分析用のフォルダーが[DQ Repository] (DQリポジトリー)ツリービュー内の[Analyses] (分析)の下に表示されます。
    サンプルデータが[Data Preview] (データプレビュー)セクションに表示され、選択したカラムが分析エディターの[Analyzed Column] (分析済みカラム)セクションに表示されます。
  3. 必要に応じて、[Analyzed Columns] (分析済みカラム)ビューの[Connection] (接続)ボックスで他の接続を選択します。このボックスには、Studioで作成されたすべての接続と該当するデータベース名がリスト表示されます。
    デフォルトでは、前の手順で選択した区切り付きファイル接続が[Connection] (接続)ボックスに表示されます。
  4. 必要に応じて、[Select columns to analyze] (分析するカラムを選択)リンクをクリックしてダイアログボックスを開き、カラムの選択を変更します。
    注: [Table filter] (テーブルフィルター)フィールドや[Column filter] (カラムフィルター)フィールドに必要なテキストを入力すると、テーブルやカラムのリストをフィルタリングできます。リストには、入力したテキストに対応するテーブルまたはカラムのみ表示されます。
  5. カラムリストで、分析するカラムのチェックボックスをオンにして[OK]をクリックし、次の手順に進みます。
    この例では、区切り付きファイル内にあるこのサンプルでは、区切りファイル内の6セットのカラム、つまり口座番号(account_num), 教育(education),メールアドレス(email),ファーストネーム(fname), ラストネーム(lname)性別(gender)を分析します。行数、重複を除いた一意値の数、重複値の数を識別します。