選択したデータにアクセスする - 7.3

Processing (インテグレーション)

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント
Last publication date
2024-03-05

手順

  1. tCacheOutをダブルクリックして[Component] (コンポーネント)ビューを開きます。
    このコンポーネントは、選択したデータをキャッシュに保管します。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、スキーマが入力スキーマと同一であることを確認します。同一でない場合は、[Sync columns] (カラムを同期)をクリックします。
  3. スキーマエディターの出力側で、ボタンをクリックしてスキーマをローカルファイルシステムにエクスポートし、[OK]をクリックしてエディターを閉じます。
  4. [Storage level] (ストレージレベル) リストから[Memory only] (メモリのみ)を選択します。

    各ストレージレベルの詳細は、https://spark.apache.org/docs/latest/programming-guide.html#rdd-persistenceをご覧ください。

  5. tCacheInをダブルクリックして[Component] (コンポーネント)ビューを開きます。
  6. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、ボタンをクリックして、前のステップでエクスポートしたスキーマをインポートします。[OK]をクリックしてエディターを閉じます。
  7. [Output cache] (出力キャッシュ)リストから、キャッシュされたデータを読み取る必要があるtCacheOutコンポーネントを選択します。ランタイムに、このデータはWebクリックログの処理に使われるサブジョブのルックアップフローに読み取られます。