Talend Studioでのジョブの設計 - 2.5

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
2.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation

ライブデータセットを作成する最初のステップは、tDatasetOutputコンポーネントを出力として使用するリモートプロジェクトでジョブを設計することです。

.zipアーカイブからライブデータセットを作成することも、ローカルプロジェクトでは可能です。

データセットとTalend Administration Centerの通信を可能にするには、リモート接続でプロジェクトを開くことをお勧めします。

作業ライブデータセットの作成に必要な最も簡単なジョブ設計は次のとおりです。

始める前に

https接続でTalend Data Preparationが実行されている場合に、作業ライブデータセットを作成するには、次の設定を行います。

  • 以下の例では、Talend Data Preparation証明書またはその認証機関を取得して、既存のまたは新しい.jksファイルに追加します。keytool -import -trustcacerts -alias <cert-alias> -file <dp_certificate.crt> -keystore <truststore.jks>
  • ジョブがTalend Data Preparation証明書を信頼するように、tSetKeystoreコンポーネントをOnSubjobOkリンクでtRowGeneratorに接続します。

    tSetKeystoreの設定方法の詳細については、tSetKeystoreのマニュアルを参照してください。

手順

  1. デザインワークスペースで、入力コンポーネント(この例ではtRowGenerator)を追加し、[Component] (コンポーネント)タブをクリックして基本設定を定義します。
  2. [RowGenerator Editor] (RowGeneratorエディター)の横の[...]をクリックして、データのスキーマを設定し、生成する行数を選択します。
  3. デザインワークスペースでtDatasetOutputコンポーネントを追加します。
  4. [Row] (行) > [Main] (メイン) リンクを使って、tRowGeneratorコンポーネントとtDatasetOutputコンポーネントをリンクします。
  5. tDatasetOutputコンポーネントの[Component] (コンポーネント)タブをクリックして、基本設定を定義します。
  6. [Sync Column] (カラムの同期)をクリックして、既存のコンポーネントからスキーマを取得します。
  7. [Mode] (モード)リストで[LiveDataset] (ライブデータセット)を選択します。

    [Url]フィールドと[Limit] (制限)フィールドが自動的に入力されます。

  8. ジョブを保存します。
  9. ローカルプロジェクトで作業をしている場合は、[Repository] (リポジトリー)ツリービューでジョブの名前を右クリックして、[Build Job] (ジョブのビルド)をクリックし、ジョブをアーカイブとしてエクスポートします。エクスポート後はTalend Administration Centerにアップロードすることができます。