データにプレパレーションを適用 - Cloud - 8.0

Azure Data Lake Store

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > クラウドストレージ > Azure > Azure Data Lake Storeコンポーネント
データガバナンス > サードパーティーシステム > クラウドストレージ > Azure > Azure Data Lake Storeコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > クラウドストレージ > Azure > Azure Data Lake Storeコンポーネント

手順

  1. デザインワークスペースでtDataprepRunを選択し、[Component] (コンポーネント)タブをクリックして基本設定を定義します。
  2. URLフィールドに、Talend Data PreparationまたはTalend Cloud Data PreparationWebアプリケーションのURLを二重引用符で囲んで入力します。ポート9999Talend Data Preparationのデフォルトポートです。
  3. [Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドに、Talend Data PreparationまたはTalend Cloud Data Preparationの接続情報を二重引用符で囲んで入力します。
    Talend Cloud Data Preparationを使用しており、
    • SSOが有効な場合は、アクセストークンをフィールドに入力します。
    • SSOが有効でない場合は、アクセストークンまたはパスワードをフィールドに入力します。
  4. [Choose an existing preparation] (既存のプレパレーションを選択)をクリックし、Talend Data PreparationまたはTalend Cloud Data Preparationで利用できるプレパレーションのリストを表示して、preparation_adlsgen2を選択します。

    このシナリオでは、プレパレーションであらかじめ互換性があるスキーマが作成されていることを前提とします。


  5. [Fetch Schema] (スキーマを取得)をクリックし、プレパレーションのスキーマ(この場合はdatapreprun_preparation)を取得します。

    tDataprepRunコンポーネントの出力スキーマには、各プレパレーションステップで行われた変更が反映されています。スキーマでは、たとえば、追加または削除されたカラムが考慮されます。デフォルトでは、出力スキーマは、プレパレーション中に日付または数値に対して実行されたフォーマット操作を上書きしないように、すべてのカラムにString型を使います。