tSortRowの設定 - Cloud - 8.0

Orchestration (インテグレーション)

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > プロセス制御コンポーネント
データガバナンス > サードパーティーシステム > プロセス制御コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > プロセス制御コンポーネント

手順

  1. tSortRowをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
  2. [Criteria] (条件)テーブルの下にある ボタンを3回クリックして、テーブルに3行を追加します。
  3. [Schema column] (スキーマカラム)で、ソート基準として使用するスキーマカラムを各行ごとに選択します。この例では、[ZipCode] (郵便番号)[City] (市)、および[Address] (住所)を順に選択します。
  4. Sort num or alpha?カラムで、3行すべてでalphaを選択します。
  5. Order asc or descカラムで、3行すべてについて[asc] (昇順)を選択します。
  6. スキーマが表示されない場合は、[Sync columns] (カラムを同期)ボタンをクリックして、先行コンポーネントからスキーマを取得します。
  7. [Advanced settings] (詳細設定)をクリックして、ビューを開きます。
  8. [Sort on disk] (ディスクでソート)を選択します。次に[Temp data directory path] (一時データディレクトリーパス)フィールドおよび[Create temp data directory if not exist] (存在しない場合一時データディレクトリーを作成)チェックボックスが表示されます。
  9. [Temp data directory path] (一時データディレクトリーパス)に、tSortRowで処理された一時データを格納するために使用するフォルダーのパスを入力するか、フォルダーを参照します。このアプローチを使うと、tSortRowが有効になり、より大量のデータをソートできます。
    これらのスレッドを同じディレクトリーに書き出すと、互いに上書きしてしまうため、スレッドごとにフォルダーを作成してから、スレッドIDを使って処理する必要があります。それには、tCollectorのグローバル変数THREAD_IDを of from the [Outline] (アウトライン)ビューからこのフィールドに直接ドロップします。これで、対応するコードが自動的に生成されます:
    
                      ((Integer)globalMap.get("tCollector_1_THREAD_ID"))
                   
    これで、パスは次のようになります:
    "E:/Studio/workspace/temp"+((Integer)globalMap.get("tCollector_1_THREAD_ID"))
    [Outline] (アウトライン)ビューがStudioに表示されない場合は、[Show View] (ビューを表示)ダイアログボックスから選択して表示します。詳細は、 Talend Studioユーザーガイドをご覧ください。
  10. [Create temp data directory if not exist] (存在しなければ一時データディレクトリーを作成)チェックボックスがオンになっていることを確認します。