スチュワードシップキャンペーンでのタスクの作成 - 7.3

Data Stewardship

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Data Stewardship
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > データスチュワードシップコンポーネント
データガバナンス > サードパーティーシステム > データスチュワードシップコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データスチュワードシップコンポーネント
tDataStewardshipTaskOutputコンポーネントを設定して、Talend Data Stewardship上で既に定義され、入力ファイル内のデータと同じデータモデルを持つBeta Candidates (ベータ候補)、Product Catalog (製品カタログ)、およびDuplicate customers (重複する顧客)の各キャンペーンにタスクをロードします。

手順

  1. 最初のtDataStewardshipTaskOutputをダブルクリックして[Basic settings] (基本設定)ビューを開きます。
  2. [URL]フィールドに、アプリケーションのアドレスを/data-stewardship/のサフィックスを付けて入力します(例、http://localhost:19999/data-stewardship/)。

    Talend Cloud Data Stewardshipを使用している場合は、対応するデータセンターのURLを使用してアプリケーションにアクセスします。たとえば、AWS USデータセンターの場合はhttps://tds.us.cloud.talend.comです。

    利用できるデータセンターのURLは、Talend CloudのリージョンとURLを参照してください。

  3. [Username] (ユーザー名)フィールドと[Password] (パスワード)フィールドにログイン情報を入力します。
    パスワードを入力するには、フィールドの横にある[…]をクリックし、開いたダイアログボックスの二重引用符の間にパスワードを入力して[OK]をクリックします。
    Talend Cloud Data Stewardshipを使用していて:
    • SSOが有効な場合は、アクセストークンをフィールドに入力します。
    • SSOが有効でない場合は、アクセストークンまたはパスワードをフィールドに入力します。
  4. [Find a campaign] (キャンペーンの検索)をクリックして、Talend Data Stewardshipで定義されていて、所有者であるかアクセス権のあるキャンペーンを一覧表示するダイアログボックスを開きます。
  5. カラムヘッダーをクリックすると、テキストカラムではアルファベット順に、日付カラムでは時系列にリストが並べ替えられて表示されます。タスクを書き込むアービトレーションキャンペーンを選択し、最初のコンポーネントに[Beta Candidates] (ベータ候補)を指定し、[OK]をクリックします。

    [Campaign] (キャンペーン)、および[Type] (タイプ)フィールドには、キャンペーンメタデータが自動的に入力されます。

    選択したキャンペーンのデータモデルはアプリケーションから取得され、読み取り専用になります。デフォルトでは以下の2列が追加されます:
    • TDS_DUE_DATEは、YYYY-MM-DD HH:mm:ssの形式でタスクの期日を指定するために使用できます。期日は、キャンペーンで定義したタスクの解決の遅延に応じて自動的に計算されます(該当する場合)。
    • TDS_EXTERNAL_IDを使用して、タスクの識別コードを指定できます。

    必要に応じて[Edit Schema] (スキーマの編集)をクリックしてカラムを表示できます。

    tDataStewardshipTaskOutputの出力スキーマでは、デフォルトで生成されるものを除き、最初のデータ型に関係なく、すべてのカラムに常にString型が使用されます。

  6. Talend Data Stewardshipで定義されているデータモデルの種類が一致しない場合もキャンペーンに新しいタスクを読み込むには、[Override enforcement of data model] (データモデルの強制上書き)チェックボックスをオンにします。
  7. [Arbitration] (アービトレーション)キャンペーンに書き込むタスクのメタデータは以下のように設定します:
    • [State] (状態)リストから書き込むタスクを選択し、[New] (新規)ステータスを割り当てます。

    • [Assignee] (割り当て先)リストから、この例で新しいタスクを割り当てるキャンペーン参加者を選択します。あるいは、[No Assignee] (割り当て先なし)を選択してキャンペーンにタスクを書き込み、参加者への割り当てを待ちます。

    • [Priority] (優先度)リストから、タスクに割り当てる優先度レベルとして[High] (高)を選択します。

    • [Choice] (選択項目)リストから、[No Choice] (選択項目なし)を選択してタスクを書き込み、選択を待ちます。

      ここでデータスチュワードはWebアプリケーションから関連する選択項目を選択します。

  8. [Tags] (タグ)フィールドに、タスクに関連付けるタグを入力し、コンマを使って複数のタグを分割します。
    このタグを使用して、キャンペーンにロードするタスクをフィルタリングできます。
  9. [Comments] (コメント)テーブルに、必要に応じて1つまたは複数のカラムのコメントを入力します。
    キャンペーン参加者は、Talend Data Stewardshipのカラムにポインターを置くことで、いつでもコメントを表示できます。この情報はタスクを解決する際に、より多くの情報を得た上で判断するのに役立ちます。
  10. [Advanced settings] (詳細設定)をクリックして、対応するビューを開き、各回のコミットに含めるタスクの数を[Max tasks per commit] (コミットごとの最大タスク数)フィールドに設定します。
    Talend Data Stewardshipのバッチサイズに制限はありません(オンプレミス)。ただし、Talend Cloud Data Stewardshipのコミットごとに200タスクを超過しないようにしてください。そうしないとジョブは失敗します。
  11. もう一方のtDataStewardshipTaskOutputコンポーネントをダブルクリックし、同じ手順で[Resolution] (レゾリューション)および[Grouping] (グルーピング)キャンペーンに書き込むタスクのメタデータを決定します。
    このジョブは、それぞれのキャンペーンにアービトレーション、レゾリューション、およびグルーピングタスクを書き込みます。このジョブは、[Grouping] (グルーピング)および[Resolution] (レゾリューション)のキャンペーンの参加者にタスクは割り当てず、優先度レベルの設定やタグの定義をすることもありません。