選択したデータにアクセスする - 7.3

処理(インテグレーション)

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

手順

  1. tCacheOutをダブルクリックして[Component] (コンポーネント)ビューを開きます。
    このコンポーネントは、選択したデータをキャッシュに保管します。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、スキーマが入力スキーマと同一であることを確認します。同一でない場合は、[Sync columns] (カラムの同期)をクリックします。
  3. スキーマエディターの出力側で、ボタンをクリックしてスキーマをローカルファイルシステムにエクスポートし、[OK]をクリックしてエディターを閉じます。
  4. [Storage level] (ストレージレベル) リストから[Memory only] (メモリのみ)を選択します。

    各ストレージレベルの詳細は、https://spark.apache.org/docs/latest/programming-guide.html#rdd-persistenceを参照してください。

  5. tCacheInをダブルクリックして[Component] (コンポーネント)ビューを開きます。
  6. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、ボタンをクリックして、前のステップでエクスポートしたスキーマをインポートします。[OK]をクリックして、エディターを閉じます。
  7. [Output cache] (出力キャッシュ)リストから、キャッシュされたデータを読み取る必要があるtCacheOutコンポーネントを選択します。ランタイムに、このデータはWebクリックログの処理に使われるサブジョブのルックアップフローに読み込まれます。