メイン コンテンツをスキップする 補完的コンテンツへスキップ

ファイル内で分析するカラムを定義

カラムの内容を分析する最初のステップは、分析するカラムを定義することです。分析結果から、各カラムの値に関する統計が得られます。

Dateカラムを分析し、Javaエンジンを使用して分析を実行することを選んだ場合、日付情報はTalend Studio およびデータマートに通常の日付/時刻として保存されます。日付/タイムスタンプの形式はYYYY-MM-DD HH:mm:ss.SSSで、時間の形式はHH:mm:ss.SSSです。SQLエンジンで分析を実行する場合、日付と時刻の形式は僅かに異なります。

始める前に、Talend StudioProfilingパースペクティブで区切り付きファイルへの接続を少なくとも1つ定義していること。

カラム分析を定義

Procedure

  1. [DQ Repository] (DQリポジトリー)ツリービューで、[Data Profiling] (データプロファイリング)フォルダーを展開します。
  2. [Analyses] (分析)フォルダーを右クリックし、[New Analysis] (新しい分析)を選択します。
    Analysesノードのコンテキストメニュー。

    [Create New Analysis] (新しい分析を作成)ウィザードが開きます。

    [Create New Analysis] (新しい分析を作成)ウィザード
  3. フィルターフィールドで、basic column analysisの最初の数文字を入力して、[Basic Column Analysis] (カラム分析)を選択し、[Next] (次へ)をクリックします。
  4. [Name] (名前)フィールドに、現在のカラム分析の名前を入力します。
    情報メモImportant:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  5. 該当するフィールドで、カラム分析のメタデータ(目的説明作成者)を設定して[Next] (次へ)をクリックします。

ファイルカラムの選択とサンプルデータの設定

Procedure

  1. [FileDelimited connections] (FileDelimited接続)を展開し、目的のファイルで、分析を行うカラムに移動します。
    この例では、選択した接続から、id, first_nameカラムとageカラムを分析します。
  2. カラムを選択し、[Finish] (終了)をクリックしてウィザードを閉じます。
    新規作成した分析のフォルダーが[DQ Repository] (DQリポジトリー)ツリービューの[Analysis] (分析)ノードの下に表示され、分析エディターが開いて、分析メタデータが表示されます。
    [データプレビュー]セクションの概要。
  3. [Data preview] (データプレビュー)ビューで、[Refresh Data] (データを更新)をクリックします。
    選択したカラム内のデータがテーブルに表示されます。
    [New Connection] (新規接続)ボタンと[Select Columns] (カラムの選択)ボタンを使用して、データソースと選択したカラムをそれぞれ変更できます。
  4. [Limit] (制限)フィールドで、テーブルに表示してサンプルデータとして使用するデータレコードの数を設定します。
    たとえば、50レコードの場合は次の手順に従います。
  5. [n first rows] (最初のn行)を選択し、選択したカラムから最初の50レコードをリスト表示します。
  6. 分析するカラム数が多い場合は、[Analyzed Columns] (分析済みカラム)セクションで右上の矢印を使い、ビュー内に複数のページを開きます。
    分析するカラムを[DQ Repository] (DQリポジトリー)ツリービューから[Analyzed Columns] (分析済みカラム)リストに直接ドラッグすることもできます。
  7. [Delete] (削除)、[Move Up] (上へ移動)、[Move Down] (下へ移動)の各ボタンを使い、分析済みカラムを管理します。
  8. 必要に応じて、[Analyzed Columns] (分析済みカラム)セクションに表示されるいずれかのカラムを右クリックし、[Show in DQ Repository view] (DQリポジトリービューで表示)を選択します。[DQ Repository] (DQリポジトリー)ツリービューのデータベース接続の下にそのカラムが見つかります。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。