tSortRowの設定 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. tSortRowをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
  2. [Criteria] (条件)テーブルの下にあるボタンを3回クリックして、テーブルに3行を追加します。
  3. [Schema column] (スキーマカラム)で、ソート基準として使用するスキーマカラムを各行ごとに選択します。この例では、[ZipCode] (郵便番号)、[City] (市)、および[Address] (住所)を順に選択します。
  4. [Sort num or alpha?] (数字または英字でソート?)カラムで、3行すべてで[alpha] (英字)を選択します。
  5. [Order asc or desc] (昇順または降順で並べ替え)カラムで、3行すべてについて[asc] (昇順)を選択します。
  6. スキーマが表示されない場合は、[Sync columns] (カラムの同期)ボタンをクリックして、先行コンポーネントからスキーマを取得します。
  7. [Advanced settings] (詳細設定)をクリックして、ビューを開きます。
  8. [Sort on disk] (ディスクでソート)を選択します。次に[Temp data directory path] (一時データディレクトリパス)フィールドおよび[Create temp data directory if not exist] (存在しない場合一時データディレクトリを作成)チェックボックスが表示されます。
  9. [Temp data directory path] (一時データディレクトリパス)に、tSortRowで処理された一時データを格納するために使用するフォルダーのパスを入力するか、フォルダーを参照します。このアプローチを使うと、tSortRowが有効になり、より大量のデータをソートできます。
    これらのスレッドを同じディレクトリに書き出すと、互いに上書きしてしまうため、スレッドごとにフォルダーを作成してから、スレッドIDを使って処理する必要があります。
    スレッドIDを表す変数を使用するには、[Code] (コード)をクリックしてそのビューを開き、ビューの中でthread_idの変数を探す必要があります。この例では、この変数はtCollector_1_THREAD_IDとなります。
    次にこの変数を使ってパスを入力する必要があります。次のようになります。
    "E:/Studio/workspace/temp"+((Integer)globalMap.get("tCollector_1_THREAD_ID"))
  10. [Create temp data directory if not exist] (存在しなければ一時データディレクトリを作成)チェックボックスがオンになっていることを確認します。