正規表現を設定して分析を完了する - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

分析するカラムに1つ以上の正規表現を追加できます。

前提条件: 区切り記号付きファイルの分析が、Studioの Profiling パースペクティブの分析エディターで開かれていること。詳細は、分析するカラムを定義するカラムにインジケーターを設定するおよびシステムインジケーターのオプション設定を参照してください。

分析するカラムに正規表現を設定するには、次の手順に従います。

手順

  1. 分析するカラムに追加する正規表現を定義します。正規表現の作成の詳細は、新しい正規表現またはSQLパターンを作成するを参照してください。
    この例では、正規表現により大文字で始まる全ての単語がチェックされます。
  2. 開いている分析エディターで分析するカラムに正規表現を追加します。この例では、first_nameです。詳細は、カラム分析に正規表現またはSQLパターンを追加するを参照して下さい。
  3. 分析を保存し、[F6]を押して実行します。
    使用しているファイル形式に問題があると、エラーメッセージが表示され、どの行に問題があるかが示されます。
    分析結果の詳細ビューには、分析されたカラムに関して生成されたグラフと統計結果の詳細を含むテーブルが示されます。
    以下に示すのは、ファイル内で分析するカラムを定義するの手順に従って分析されたfirst_nameカラムの[Analysis Results] (分析結果)ビューに表示される統計グラフとそれらのグラフに付随するテーブルです。