Talend StudioでtMapコンポーネントを使って2つのデータソースを結合 - 8.0

Version
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン

Talend StudioのtMapコンポーネントで2つのデータソースを結合

このチュートリアルでは、Talend StudiotMapコンポーネントを使って2つのデータソースを結合する方法を確認します。

このチュートリアルでは、.csvファイルを使用します。.csvファイルがない場合は、 [Downloads] (ダウンロード)タブをクリックしてmovies.csvを保存します。

このチュートリアルでは他の区切り付きファイルも使用します。他の区切りファイルがない場合は、 [Downloads] (ダウンロード)タブをクリックしてdirectors.txtを保存します。

Talend Studioプロジェクトを作成

プロジェクトの作成は、Talend Studioを使用するための最初のステップです。プロジェクトによって仕事をよりよく整理できるようになります。

手順

  1. [Create a new project] (新しいプロジェクトを作成)を選択します。
  2. プロジェクトの名前を入力します。

    TalendDemo
  3. [Create] (作成)をクリックします。
  4. [Finish] (終了)をクリックします。

タスクの結果

プロジェクトが開きます。Talend Studioで作業する準備が整いました。

データソースを結合するジョブを作成

Talend Studioプロジェクトにはジョブが含まれています。ジョブではコンポーネントを通じてワークフローのビルドが可能なので、特定のアクションを完了できます。

始める前に

[Integration] (統合)パースペクティブ([Window] (ウィンドウ) > パースペクティブ > [Integration] (統合))を選択します。

手順

  1. [Repository] (リポジトリー)で、[Job Designs] (ジョブデザイン)を右クリックします。
    1. [Create Standard Job] (標準ジョブを作成)をクリックします。
  2. [Name] (名前)フィールドに、名前を入力します。

    tMapJoin
  3. オプション: [Purpose] (目的)フィールドに目的を入力します。

    Joining two different data sources in Talend Studio
  4. オプション: [Description] (説明)フィールドに説明を入力します。

    Using the tMap component to turn two different data sources into one
    ヒント: [Purpose] (目的)[Description] (説明)を入力して整理します。
  5. [Finish] (終了)をクリックします。

タスクの結果

[Designer] (デザイナー)で空のジョブが開かれます。

tMapコンポーネントを使ってデータを結合

tMapコンポーネントを使用すると、データを変換し、1つまたは複数のソースから1つまたは複数のデスティネーションにルーティングできます。

tMapコンポーネントのメタデータ定義を作成

メタデータ定義を作成すると、全コンポーネントで再利用可能な情報を設定できるようになります。

始める前に

このチュートリアルでは区切り付きファイルを使用します。区切りファイルがない場合は、 [Downloads] (ダウンロード)タブをクリックしてdirectors.txtを保存します。

手順

  1. [Repository] (リポジトリー)[Metadata] (メタデータ)を展開し、[File delimited] (区切り付きファイル)を右クリックして、[Create file delimited] (区切り付きファイルを作成)をクリックします。
  2. [Name] (名前)フィールドに、名前を入力します。

    directors
  3. オプション: [Purpose] (目的)フィールドに目的を入力します。

    Joining the directors data to the movies database
  4. オプション: [Description] (説明)フィールドに説明を入力します。

    Reusable shareable directors metadata
    ヒント: [Purpose] (目的)[Description] (説明)を入力して整理します。
  5. [Next] (次へ)をクリックします。
  6. [Browse] (参照)をクリックし、[File Explorer] (ファイルエクスプローラー)で目的のファイルを選択します。
  7. オプション: 解析の設定を定義します。

    • [File Settings] (ファイル設定)の下で[Field Separator] (フィールド区切り)を選択し、必要に応じて選択を変更します。
      注: 最も一般的な[Field Separator] (フィールド区切り) ; です。
    ヒント: [Preview] (プレビュー)の下で[Refresh Preview] (プレビューを更新)をクリックすると、解析結果を確認します。
  8. [Next] (次へ)をクリックします。
  9. オプション: [Name] (名前)フィールドに名前を入力します。

    directorsSchema
  10. サンプルファイルと同じ構造になるよう、[Schema] (スキーマ)をアップデートします。

    • Column0の名前をdirectorIDに、Column1の名前をdirectorNameに変更します。
    • directorID[Length] (長さ)4に、directorName[Length] (長さ)40に変更します。
  11. [Finish] (終了)をクリックします。

タスクの結果

[Repository] (リポジトリー)[Metadata] (メタデータ)の下にあるご自分のメタデータを使用できます。

2つのデータソースを結合するtMapコンポーネントを設定

tMapコンポーネントを使用すると、データを変換し、1つまたは複数のソースから1つまたは複数のデスティネーションにルーティングできます。この場合、2つのデータソースの結合方法を確認します。

このタスクについて

デモンストレーションのため、このチュートリアルではmovies 0.1directors 0.1という異なる2つのメタデータ定義を使います。次のように、このチュートリアルに従います。
  1. [Downloads] (ダウンロード)タブをクリックし、metadata_movies_directors.zipを保存します。
  2. [Repository] (リポジトリー)[Metadata] (メタデータ)を展開し、[File delimited] (区切り付きファイル)を右クリックして、[Import items] (アイテムのインポート)をクリックします。
  3. [Select archive file] (アーカイブファイルを選択)を選択し、[Browse] (参照)をクリックしてmetadata_movies_directors.zipを選択します。
  4. movies 0.1およびdirectors 0.1を選択します。
  5. [Finish] (終了)をクリックします。

また、両方のメタデータ定義を作成する方法もわかります(詳細はtMapコンポーネントのメタデータ定義を作成をご覧ください)。

手順

  1. movies 0.1メタデータとdirectors 0.1メタデータを[Designer] (デザイナー)にドラッグ&ドロップします。
    1. いずれの場合も、tFileInputDelimitedコンポーネントを選択します。
  2. tMapコンポーネントを追加します。
  3. moviesコンポーネントを右クリックします。
    1. [Row] (行) > [Main] (メイン)を選択します。
    2. tMapコンポーネントをクリックし、両コンポーネントをリンクさせます。
  4. directorsコンポーネントで前の3つのステップを繰り返します。
  5. tMapコンポーネントをダブルクリックします。
    tMapコンポーネントの設定ウィンドウが表示されます。
  6. 画面右側の[Add output table] (出力テーブルを追加)をクリックします。
  7. 出力テーブルの名前を入力します。

    joinedOutput
  8. [OK]をクリックします。
  9. 入力テーブルrow1movieIDカラム、titleカラム、releaseYearカラム、urlカラムを選択し、出力テーブルJoinedOutputにドラッグ&ドロップします。