tSortRowの設定 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data

Big Data Platform

Cloud API Services Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

手順

  1. tSortRowをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
  2. [Criteria] (条件)テーブルの下にある ボタンを3回クリックして、テーブルに3行を追加します。
  3. [Schema column] (スキーマカラム)で、ソート基準として使用するスキーマカラムを各行ごとに選択します。この例では、[ZipCode] (郵便番号)[City] (市)、および[Address] (住所)を順に選択します。
  4. Sort num or alpha?カラムで、3行すべてでalphaを選択します。
  5. [Order asc or desc] (昇順または降順)カラムで、3行すべてについて[asc] (昇順)を選択します。
  6. スキーマが表示されない場合は、[Sync columns] (カラムを同期)ボタンをクリックして、先行コンポーネントからスキーマを取得します。
  7. [Advanced settings] (詳細設定)をクリックして、ビューを開きます。
  8. [Sort on disk] (ディスクでソート)を選択します。次に[Temp data directory path] (一時データディレクトリーパス)フィールドおよび[Create temp data directory if not exist] (存在しない場合一時データディレクトリーを作成)チェックボックスが表示されます。
  9. [Temp data directory path] (一時データディレクトリーパス)に、tSortRowで処理された一時データを格納するために使用するフォルダーのパスを入力するか、フォルダーを参照します。このアプローチを使うと、tSortRowが有効になり、より大量のデータをソートできます。
    これらのスレッドを同じディレクトリーに書き出すと、互いに上書きしてしまうため、スレッドごとにフォルダーを作成してから、スレッドIDを使って処理する必要があります。
    スレッドIDを表す変数を使用するには、[Code] (コード)をクリックしてそのビューを開き、ビューの中でthread_idの変数を探す必要があります。この例では、この変数はtCollector_1_THREAD_IDとなります。
    次にこの変数を使ってパスを入力する必要があります。次のようになります。
    "E:/Studio/workspace/temp"+((Integer)globalMap.get("tCollector_1_THREAD_ID"))
  10. [Create temp data directory if not exist] (存在しなければ一時データディレクトリーを作成)チェックボックスがオンになっていることを確認します。