区切り付きファイルの完全な行を読み取る - Cloud - 8.0

FullRow

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > FullRow
データガバナンス > サードパーティーシステム > ファイルコンポーネント > FullRow
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > FullRow

手順

  1. 新しいジョブを作成し、tFileInputFullRowコンポーネントとtLogRowコンポーネントを追加するには、その名前をデザインワークスペースに入力するか、[Palette] (パレット)からドロップします
  2. Row > Main接続を使用して、tFileInputFullRowコンポーネントをtLogRowコンポーネントに接続します。
  3. tFileInputFullRowコンポーネントをダブルクリックして、[Component] (コンポーネント)タブに[Basic settings] (基本設定)ビューを開きます。
  4. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックすると、tLogRowコンポーネントに渡すデータが表示されます。スキーマは読み取り専用で、1つのカラムのみで構成されています。
  5. [File Name] (ファイル名)フィールドで、アップロードするファイルへのパスを参照するか入力します。このシナリオでは、E:/states.csvです。
  6. [Row Separator] (行区切り)フィールドに、行の終わりを識別するために使用する区切りを入力します。このサンプルでは、デフォルト値は\nです。
  7. [Header] (ヘッダー)フィールドに1を入力して、ファイルの先頭にあるヘッダー行をスキップします。
  8. tLogRowコンポーネントをダブルクリックして、[Component] (コンポーネント)タブの[Basic settings] (基本設定)ビューを開きます。
    [Mode] (モード)エリアで、[Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))を選択して、結果を読みやすくします。
  9. [Ctrl] + [S]を押してジョブを保存し、[F6]を押して実行します。
    上記のように、区切り付きファイルstates.csvの10行のデータはフィールドセパレータを無視して1つずつ読み込まれ、データの完全な行がコンソールに表示されます。
    行からフィールドを抽出するには、tExtractDelimitedFieldstExtractPositionalFields、またはtExtractRegexFieldsを使用する必要があります。詳細は、tExtractDelimitedFieldstExtractPositionalFieldstExtractRegexFieldsを参照してください。