Talend Studioでファイルをソート
このチュートリアルでは、Talend StudioでtSortRowコンポーネントを使ってファイルからデータをソートする方法を確認できます。
このチュートリアルでは.csvファイルを使います。.csvファイルがない場合は、 [Downloads] (ダウンロード)タブをクリックしてcustomers_unordered.csvを保存します。
Talend Studioプロジェクトを作成
プロジェクトの作成は、Talend Studioを使用するための最初のステップです。プロジェクトによって仕事をよりよく整理できるようになります。
手順
タスクの結果
区切り付きファイルをソートするジョブを作成
Talend Studioプロジェクトにはジョブが含まれています。ジョブではコンポーネントを通じてワークフローのビルドが可能なので、特定のアクションを完了できます。
始める前に
手順
タスクの結果
区切り付きファイルを読み取るコンポーネントを設定
Talend Studioのコンポーネントを使えば、特定のアクションを完了できるようになります。コンポーネントはジョブに追加できます。tFileInputDelimitedコンポーネントを使えば、区切り付きファイルを読み取ったりできるようになります。
始める前に
手順
- [Designer] (デザイナー)内をクリックします。
- tFileInputDelimitedと入力し、同名のコンポーネントを選択します。
-
[Designer] (デザイナー)で、tFileInputDelimitedコンポーネントをダブルクリックします。
タスクの結果
区切り付きファイルを読み取るコンポーネントスキーマを定義
区切り付きファイルのコンポーネントスキーマを定義すれば、作業中のデータの解析が容易になります。
手順
タスクの結果
データをソート
Talend StudioはtSortRowコンポーネントを使えば、データをソートできます。
区切り付きファイルをソート
tSortRowコンポーネントへのリンクで、区切り付きファイルをソートできます。tSortRowコンポーネントは、1つまたは複数のカラムに基づき、ソートタイプやソート順序などによって入力データをソートします。
始める前に
- tFileInputDelimitedコンポーネントを追加および設定していること(区切り付きファイルを読み取るコンポーネントを設定をご覧ください)。
- また、そのスキーマを定義していること(区切り付きファイルを読み取るコンポーネントスキーマを定義をご覧ください)。
手順
タスクの結果
区切り付きファイルのソート結果を表示
tLogRowコンポーネントへのリンクを使えば、ワークフローの結果を表示できます。tLogRowコンポーネントは、[Run] (実行)コンソール内にデータを表示します。
始める前に
- tFileInputDelimitedコンポーネントを追加および設定していること(区切り付きファイルを読み取るコンポーネントを設定をご覧ください)。
- そのスキーマを定義していること(区切り付きファイルを読み取るコンポーネントスキーマを定義をご覧ください)。
- そのデータをソートしていること(詳細は区切り付きファイルをソートをご覧ください)。
手順
- [Designer] (デザイナー)でtLogRowコンポーネントを追加します。
-
tSortRowコンポーネントを右クリックします。