正規表現ファイルの解析パラメーターを定義する - 7.0

データ統合のメタデータを一元管理

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio

このタスクについて

このビューではファイルのさまざまな設定を定義できるため、ファイルスキーマが適切に取得できるようになります。

手順

  1. [File Settings] (ファイル設定)エリアで、フィールドと行の区切りを設定します。
    • 必要に応じて、[Field Separator] (フィールド区切り)フィールドの数値を変更して、カラムの長さを正確に指定します。

    • ファイルの行区切りが標準のEOLではない場合、[Row Separator] (行区切り)リストから[Custom String] (ユーザー定義文字列)を選択し、[Corresponding Character] (対応する文字)フィールドで文字列を指定します。

  2. [Regular Expression settings] (正規表現の設定)パネルに、ファイルを区切るために使用する正規表現を入力します。
    警告:

    一重引用符または二重引用符で正規表現を囲むようにして下さい。

  3. データの内容から除外するヘッダー行がファイルにある場合、[Rows To Skip] (スキップする行)エリアの[Header] (ヘッダー)チェックボックスをオンにし、対応するフィールドで無視する行数を定義します。また、ファイルにフッター情報が含まれていることがわかっていれば、[Footer] (フッター)チェックボックスをオンにして、無視するフッター行の数を設定します。
  4. [Limit of Rows] (行数の制限)エリアでは、解析されるファイルの拡張を制限できます。必要に応じて、[Limit] (制限)チェックボックスをオンにし、希望する行数を設定または選択します。
  5. ファイルにカラムラベルが含まれる場合は、[Set heading row as column names] (最初の行をカラム名として設定)チェックボックスをオンにし、最初に解析された行をスキーマカラムのラベルにします。スキップするヘッダー行の数は1つずつ増えます。
  6. [Refresh preview] (プレビューの更新)をクリックして、変更を有効にします。プレビューが更新されるまで、ボタンは[Stop] (停止)になっています。
  7. [Next] (次へ)をクリックして、次のビューに進み、生成された正規表現ファイルスキーマの確認とカスタマイズを行います。