ソート済み行の再グループ化 - 7.3

処理(インテグレーション)

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

このJavaシナリオでは、4つのエレメントからなるジョブについて説明します。これは、区切り記号付きファイル行を行ごとに読み取り、ソートタイプと順序別で入力データをソートし、すべての入力ソート済み行を非正規化し、[Run] (実行)ログコンソールに出力を表示することを目的としています。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

  • [Palette] (パレット)から、tFileInputDelimitedtSortRowtDenormalizeSortedRow および tLogRowのコンポーネントをデザインワークスペースにドロップします。

  • [Row Main] (行メイン) リンクを使って、4つのコンポーネントを接続します。

  • デザインワークスペースでtFileInputDelimitedを選択します。

  • [Component] (コンポーネント)タブをクリックして、tFileInputDelimitedの基本設定を定義します。

  • [Property type] (プロパティタイプ)[Built-in] (組み込み)に設定します。

  • 処理されたファイルへのパスを[File Name] (ファイル名)フィールドに入力します。この例で使用されているname_listファイルには、idと名前の2つのカラムがあります。

  • 必要に応じて、行とフィールドの区切り、ヘッダーとフッター、および処理される行数を定義します。

  • [Schema] (スキーマ)[Built-in] (組み込み)に設定し、[Edit schema] (スキーマを編集)の横にある3点ボタンをクリックして、次のコンポーネントに渡すデータを定義します。このサンプルのスキーマは、id[Named] (名前)の2つのカラムで構成されています。

  • デザインワークスペースで、tSortRowを選択します。

  • [Component] (コンポーネント)タブをクリックして、tSortRowの基本設定を定義します。

  • [Schema type] (スキーマのタイプ)[Built-in] (組み込み)に設定し、[Sync columns] (カラムの同期)をクリックしてtFileInputDelimitedコンポーネントからスキーマを取得します。

  • [Criteria] (条件)パネルで、プラスボタンを使用して行を追加し、処理するスキーマカラムのソートパラメーターを設定します。このサンプルでは、idカラムを昇順に並べ替えます。

  • デザインワークスペースで、tDenormalizeSortedRowを選択します。

  • [Component] (コンポーネント)タブをクリックして、tDenormalizeSortedRowの基本設定を定義します。

  • [Schema type] (スキーマのタイプ)[Built-in] (組み込み)に設定し、[Sync columns] (カラムの同期)をクリックしてtSortRowコンポーネントからスキーマを取得します。

  • [Input rows count] (入力行数)フィールドに、処理する入力行数を入力するか、[Ctrl] + [Space]を押してコンテキスト変数リストにアクセスし、変数を選択します: tFileInputDelimited_1_NB_LINE

  • [非正規化する] (To denormalize)パネルで、プラスボタンを使用して行を追加し、処理するスキーマカラムのソートパラメーターを設定します。このサンプルでは、[Named] (名前)カラムを非正規化します。

  • デザインワークスペースで、tLogRowを選択して、[Component] (コンポーネント)タブをクリックし、基本設定を定義します。tLogRowについて詳しくは、『tLogRow』を参照してください。

  • ジョブを保存し、[F6]を押して実行します。

コンソールに表示される結果は、[name] (名前)カラムがどのように非正規化されたかを示しています。