ジョブを設定 - Cloud - 8.0

Excel

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > Excel
データガバナンス > サードパーティーシステム > ファイルコンポーネント > Excel
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > Excel

手順

  1. tFixedFlowInput_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、そこにname (String型)、city (String型)、quantity (String型)という3つのカラムを追加します。
    2. [Use Inline Content(delimited file)] (インラインコンテンツ(区切りファイル)を使用)を選択し、[Content] (コンテンツ)フィールドに次のように入力します。
      Jack;Bei Jing;18
      Mary;Shang Hai;20
      Tom;Shen Zhen;25
    3. 他のオプションはそのままにしておきます。

    このコンポーネントは、Excel 2007 ファイルに書き込まれるデータを設定します。

  2. tFileOutputExcel_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Write excel2007 file format (xlsx)] (Excel 2007ファイル形式(xlsx)で書き込む)を選択し、[File Name] (ファイル名)フィールドにターゲットファイルへのパス(この例では"D:/temp/customers.xlsx")を入力します。
      注:
      • ファイルパスの入力は、[File Name] (ファイル名)フィールドの横にある[...]ボタンをクリックしてターゲットファイルかターゲットフォルダーに移動することでも可能です。
      • ターゲットファイルは既に存在する場合は上書きされ、存在しない場合は作成されます。
    2. [Include header] (ヘッダーを含める)を選択します。
    3. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、コンポーネントが tFixedFlowInput_1と同じスキーマかどうかチェックします。

      [Sync columns] (カラムを同期)をクリックすれば、このスキーマをtFixedFlowInput_1のスキーマと同期させることができます。

    4. 他のオプションはそのままにしておきます。

    このコンポーネントは、受信したデータをターゲットファイルに書き込みます。

  3. tFileInputExcel_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Read excel2007 file format (xlsx)] (Excel 2007ファイル形式(xlsx)を読み取る)を選択し、[File Name/Stream] (ファイル名/ストリーム)フィールドにデータの読み取り元となるExcelファイルへのパス(この例では"D:/temp/customers.xlsx")を入力します。
      注: ファイルパスの入力は、[File Name/Stream] (ファイル名/ストリーム)フィールドの横にある[...]ボタンをクリックしてターゲットファイルに移動することでも可能です。
    2. [Sheet list] (シートリスト)テーブルの下部にあるプラスボタンをクリックして行を追加し、行の[Sheet] (シート)カラムにシート名(この例では"Sheet1")を入力します。
      注: シート名は、指定したExcelファイル内の目的のシート名であることが必要です。
    3. [First column] (最初のカラム)フィールドに1と、[Last column] (最後のカラム)フィールドに4とそれぞれ入力します。
      注: [Last column] (最後のカラム)フィールドの数字は、Excelファイルで使われているカラムの数より大きい必要があります。
    4. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、スキーマエディターを開きます。
    5. プラスボタンをクリックしてスキーマエディターに行を追加し、[Column]フィールドにdocと入力し、[Type]フィールドのドロップダウンリストでDynamicを選択し、[OK]をクリックしてスキーマエディターを閉じます。
      注: 以上の設定によってスキーマはダイナミックスキーマとなります。タイプDynamicに設定されているカラムがスキーマに含まれており、そのカラムがスキーマ内の唯一のカラムまたは最後のカラムであれば、そのスキーマはダイナミックスキーマとなります。
    6. 他のオプションはそのままにしておきます。

    このコンポーネントは、ダイナミックスキーマを使ってExcelファイルからデータを抽出します。

  4. tLogRow_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、コンポーネントがtFileInputExcel_1と同じスキーマかどうかチェックします。

      [Sync columns] (カラムを同期)をクリックすれば、このスキーマをtFileInputExcel_1のスキーマと同期させることができます。

    2. [Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))を選択します。
    3. 他のオプションはそのままにしておきます。
    このコンポーネントは、ダイナミックスキーマを使って抽出されたデータを表示します。
  5. tFileOutputDelimited_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [File Name] (ファイル名)フィールドにこのファイルへパス(この例では"D:/temp/customers.csv")を入力します。
      注:
      • ファイルパスの入力は、[File Name] (ファイル名)フィールドの横にある[...]ボタンをクリックしてターゲットファイルに移動することでも可能です。
      • ターゲットファイルは既に存在する場合は上書きされ、存在しない場合は作成されます。
    2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、コンポーネントが tLogRow_1と同じスキーマかどうかチェックします。

      [Sync columns] (カラムを同期)をクリックすれば、このスキーマをtLogRow_1のスキーマと同期させることができます。

    3. 他のオプションはそのままにしておきます。
    このコンポーネントは、ダイナミックスキーマを使って受信したデータをCSVファイルに書き込みます。
  6. tFileInputExcel_2をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Read excel2007 file format (xlsx)] (Excel 2007ファイル形式(xlsx)を読み取る)を選択し、[File Name/Stream] (ファイル名/ストリーム)フィールドにデータの読み取り元となるExcelファイルへのパス(この例では"D:/temp/customers.xlsx")を入力します。
      注: ファイルパスの入力は、[File Name/Stream] (ファイル名/ストリーム)フィールドの横にある[...]ボタンをクリックしてターゲットファイルに移動することでも可能です。
    2. [Sheet list] (シートリスト)テーブルの下部にあるプラスボタンをクリックして行を追加し、行の[Sheet] (シート)カラムにシート名(この例では"Sheet1")を入力します。
      注: シート名は、指定したExcelファイル内の目的のシート名であることが必要です。
    3. [Header] (ヘッダー)フィールドに1と入力します。
    4. [First column] (最初のカラム)フィールドに1と、[Last column] (最後のカラム)フィールドに4とそれぞれ入力します。
      注: [Last column] (最後のカラム)フィールドの数字は、Excelファイルで使われているカラムの数より大きい必要があります。
    5. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、スキーマエディターを開きます。
    6. スキーマエディターにtFixedFlowInput_1と同じカラムを追加し、[OK]をクリックしてスキーマエディターを閉じます。
    7. 他のオプションはそのままにしておきます。

    このコンポーネントは、通常の方法でExcelファイルからデータを抽出します。

  7. tLogRow_2をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、コンポーネントがtFileInputExcel_2と同じスキーマかどうかチェックします。

      [Sync columns] (カラムを同期)をクリックすれば、このスキーマをtFileInputExcel_2のスキーマと同期させることができます。

    2. [Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))を選択します。
    3. 他のオプションはそのままにしておきます。
    このコンポーネントは、通常の方法で抽出されたデータを表示します。