区切り記号付きファイルの完全な行を読み取る - 7.3

FullRow

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > FullRow
データガバナンス > サードパーティーシステム > ファイルコンポーネント > FullRow
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > FullRow

手順

  1. 新しいジョブを作成し、tFileInputFullRowコンポーネントとtLogRowコンポーネントを追加するには、その名前をデザインワークスペースに入力するか、[Palette] (パレット)からドロップします
  2. Row > Main接続を使用して、tFileInputFullRowコンポーネントをtLogRowコンポーネントに接続します。
  3. tFileInputFullRowコンポーネントをダブルクリックして、[Component] (コンポーネント)タブに[Basic settings] (基本設定)ビューを開きます。
  4. [Edit schema] (スキーマの編集)の横にある[...]ボタンをクリックすると、tLogRowコンポーネントに渡すデータが表示されます。スキーマは読み取り専用で、1つのカラムのみで構成されています。
  5. [File Name] (ファイル名)フィールドで、アップロードするファイルへのパスを参照するか入力します。このシナリオでは、E:/states.csvです。
  6. [Row Separator] (行区切り)フィールドに、行の終わりを識別するために使用する区切り記号を入力します。このサンプルでは、デフォルト値は\nです。
  7. [Header] (ヘッダー)フィールドに1を入力して、ファイルの先頭にあるヘッダー行をスキップします。
  8. tLogRowコンポーネントをダブルクリックして、[Component] (コンポーネント)タブの[Basic settings] (基本設定)ビューを開きます。
    [Mode] (モード)エリアで、[Table (print values in cells of a table)] (テーブル: テーブルのセルに値を印刷)を選択して、結果を読みやすくします。
  9. [Ctrl] + [S]を押してジョブを保存し、[F6]を押して実行します。
    上記のように、区切り記号付きファイルstates.csvの10行のデータはフィールドセパレータを無視して1つずつ読み込まれ、データの完全な行がコンソールに表示されます。
    行からフィールドを抽出するには、tExtractDelimitedFieldstExtractPositionalFields、またはtExtractRegexFieldsを使用する必要があります。詳細は、tExtractDelimitedFieldstExtractPositionalFieldstExtractRegexFieldsを参照してください。