tDataStewardshipTaskInputの標準プロパティ - 7.3

Data Stewardship

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データスチュワードシップコンポーネント
データガバナンス > サードパーティーシステム > データスチュワードシップコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データスチュワードシップコンポーネント
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtDataStewardshipTaskInputコンポーネントを設定するために使われます。

標準のtDataStewardshipTaskOutputコンポーネントは、Talend Data Stewardshipファミリーに属しています。

このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。

 

[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマを表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

以下のカラムは、このコンポーネントのスキーマに自動的に追加され、読み取り専用になります。カラムはタスクのメタデータになります。
  • TDS_ID: タスク識別子。

  • TDS_STATE: タスクの現在の状態。

  • TDS_ASSIGNEE: タスクの割り当て先。

  • TDS_CREATION: タスクの作成日。

  • TDS_LAST_UPDATE: タスクの最終アップデート日。

  • TDS_LAST_UPDATED_BY: タスクを最後にアップデートしたユーザーの識別子。

  • TDS_PRIORITY: Webアプリケーションのタスクの優先度を表す数値。各数値は以下のようにテキスト値から取得されます。

    • [Very Low] (非常に低い) = 0

    • [Low] (低) = 1

    • [Medium] (中) = 2

    • [High] (高) = 3

    • [Very High] (非常に高い) = 3

    [No Priority] (優先度なし)は、デフォルトで[Medium] (中)=2に設定されています。

  • TDS_TAGS: コンマ区切りの値のリストとして取得されたタスクに割り当てられたタグ。

  • TDS_ARBITRATION: ([ARBITRATION] (アービトレーション)キャンペーンが選択されている場合のみ利用可能) 列挙値でタスクに割り当てられた選択項目。

  • TDS_ARBITRATION_LABEL: ([ARBITRATION] (アービトレーション)または[GROUPING] (グルーピング)キャンペーンが選択されている場合のみ利用可能) Talend Data Stewardshipに表示されるタスクに割り当てられた選択項目。

  • TDS_MASTER: (マージングキャンペーンが選択されている場合のみ利用可能)レコードがマスターレコードかどうかを示すインジケーター。

  • TDS_SOURCE: ([MERGING] (マージング)キャンペーンが選択されている場合のみ利用可能)レコードのソースの名前。

  • TDS_SCORE: ([GROUPING] (グルーピング)または[MERGING] (マージング)キャンペーンが選択されている場合のみ利用可能)マッチングアルゴリズムに基づいて計算される入力レコードとマスターレコードの距離。

  • TDS_RATING: ([MERGING] (マージング)キャンペーンが選択されている場合のみ利用できます)は、タスク作成時に設定したソースレコードごとにトラストスコアを示します。キャンペーン作成時に定義されていたスコアは、このスコアによって上書きされます。スコアは0から100までのパーセンテージを表す整数値になります。

  • TDS_EXTERNAL_ID: Talend MDM Web UIなどの他のシステムから簡単に取得できるように、任意のタスクの識別子を設定できます。

URL

http://<server_address>:19999/data-stewardship/)のように、Talend Data Stewardshipサーバーにアクセスするアドレスに/data-stewardship/というサフィックスを付けて入力します。

Talend Cloud Data Stewardshipで作業している場合は、/data-stewardship/というサフィックスが付いた対応するデータセンターのURLを使ってアプリケーションにアクセスします。たとえばAWS USデータセンターの場合はhttps://tds.us.cloud.talend.com/data-stewardshipとなります。

利用できるデータセンターのURLは、Talend CloudのリージョンとURLをご覧ください。

[Username] (ユーザー名)[Password] (パスワード)

Talend Data Stewardshipにログインするための認証情報を入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。

Talend Cloud Data Stewardshipで作業しており、かつ次の場合:
  • SSOが有効な場合は、アクセストークンをフィールドに入力します。
  • SSOが有効でない場合は、アクセストークンまたはパスワードをフィールドに入力します。

[Campaign] (キャンペーン)

[Find a campaign] (キャンペーンの検索)をクリックして、Talend Data Stewardshipで利用可能なすべてのキャンペーンのリストを開き、タスクが保存されているキャンペーンの名前を選択します。これは情報提示の読み取り専用のフィールドです。

[Type] (タイプ)

キャンペーンの選択後に事前定義済みのタイプからキャンペーンタイプを表示する読み取り専用リスト。

[Override enforcement of data model] (データモデルの強制オーバーライド)

有効ではないスキーマタイプでもあえてTalend Data Stewardshipサーバーのデータを処理する場合は、このチェックボックスをオンにし、スキーマの入力検証を実行しないようにします。データの円滑な処理を保証するため、このチェックボックスはすべてのキャンペーンタイプに対してデフォルトでオンになっています。

[State] (状態)

タスクを取得するワークフロー内の状態をリストから選択します。

このリストには、キャンペーンワークフロー内で定義するすべての状態の名前が表示されます。ここには、最初と最後の状態、およびTalend Data Stewardshipでキャンペーンを作成する時に追加する検証状態が表示されます。

[Any State] (任意の状態)オプションを使うと、状態に関係なくすべてのタスクが取得されます。

[Custom] (カスタム)オプションを使うと、取得するタスクのさまざまな状態をコンマで区切って指定できます(例: "New,toValidate1,Resolved")。ワークフローで定義する状態の正確なラベルを入力する必要があります。

担当者

取得するタスクを持つキャンペーン参加者を選択します。

[No Assignee] (割り当て先なし)は、どのデータスチュワードにも割り当てられていないタスクを取得します。他方、[Any Assignee] (任意の割り当て先)は、どの割り当て先も考慮せずにタスクを取得します。

[Custom] (カスタム)を使用すると、表示されているフィールドにコンテキスト変数を定義することで、キャンペーンのデータスチュワードの部分にタスクを動的に割り当てることができます。ここで想定される値はスチュワードのログイン情報です。

このオプションを使用し、受信データの指定された属性に基づいて特定のスチュワードにタスクを割り当てることができます。たとえば、フランスの顧客にはフランス人スチュワードJacques Bocuse、米国の顧客にはアメリカ人スチュワードCale Carolinaを割り当てるようにする、顧客サポートレベルがプラチナの場合はサポートチームリードに割り当て、ゴールドの場合はエキスパートに割り当てる、などのようにできます。

[Priority] (優先度)[Choice] (選択)および[Tags] (タグ)

[Priority] (優先度)(任意): タスク優先度のいずれかを選択します。あるいは、[Custom] (カスタム)を選択し、表示されるフィールドにカスタムの式を設定するために使われます。

レベルが選択されていない場合は、[Any Priority] (任意の優先度)によって優先度に関わらずすべてのタスクが取得されます。

Choice (選択)(オプションでアービトレーションキャンペーンが選択されている場合のみ使用可能): キャンペーンのレコードに設定されている任意の選択オプションを選びます。

[No Choice] (選択なし)では、データスチュワードによって選択肢が選ばれていないタスクが取得されます。他方、[Any Choice] (任意の選択)では、選ばれた選択肢に関係なくすべてのタスクが取得されます。

Tags (タグ) (オプション): 取得したいタスクに関連付けるタグを入力します。タグはタスクのフィルタリングに使用できます。

クエリー

キャンペーンから取得するタスクのフィルタリングに使用するクエリーステートメントを入力します。

条件はフィールド名、演算子、および値で構成されます。レコードのデータを参照する場合は、フィールド名の先頭にrecord.が付いていなければなりません。文字列の前後に一重引用符を使用し、文字列内の引用符の前にバックスラッシュを付ける必要があります。例: レコードにFirstNameフィールドがある場合、タスクを割り当て先と名前の値でフィルタリングするには、[Assignee] (割り当て先)フィールドでassignee='user1@talend.com'を使い、[Query] (クエリー)フィールドにrecord.firstName='De\'wayne'と入力します。

詳細は、Data StewardshipコンポーネントとREST APIで使われるクエリー言語をご覧ください。

Retrieve golden record only (ゴールデンレコードのみを取得)

このチェックボックスをオンにすると、マージング処理の結果となるゴールデンレコードのみ読み取られます。

このオプションは、マージングキャンペーンでのみ使用でき、デフォルトで選択されています。

詳細設定

[Campaign ID] (キャンペーンID)

基本設定でキャンペーンを選択すると、そのキャンペーンの技術的な名前を表示します。ただし、フィールド値を変更して、たとえばコンテキストパラメーターに置き換え、実行時にコンテキスト変数をジョブにパスできます。この技術的な名前は、ジョブがTalend Data Stewardshipと通信する時に、[Campaign] (キャンペーン)フィールドの値に関係なく、キャンペーンの特定に常に使用されます。

[Use ID based pagination] (IDベースのページネーションを使用)

このオプションは、タスクの最後のタスクIDに依存して次のタスクを取得することでタスク取得時のパフォーマンスを向上させます。

このオプションはTalend Cloud Data Stewardshipでのみ利用可能です。

[Batch Size] (バッチサイズ)

各処理バッチに含める行数を設定するために使われます。

パフォーマンスの問題が発生している場合を除き、デフォルト値は変更しないでください。バッチサイズを大きくするとパフォーマンスが向上しますが、高すぎる値を設定すると、ジョブの失敗の原因となる可能性があります。

[Consume tasks when they are read] (読み取り時にタスクを使用する)

このチェックボックスはデフォルトでオンになっており、タスクがコンポーネントによって取得されると、 Talend Data Stewardship サーバーで使用済みとしてマークされます。同じフィルター条件でジョブを再実行した場合、2回目にはタスクは取得されません。

このチェックボックスをオフにするのは特別のユースケースに対してのみ行ってください。そうしないと、同じタスクが2回処理されてしまうというリスクが非常に高くなります。
注: このオプションは解決済みのタスクにのみ適用されます。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

NB_LINE

処理されたメッセージの数。これはAfter変数で、整数を返します。

NB_REJECT

リジェクトされた行数。これはAfter変数で、整数を返します。

NB_SUCCESS

正しく処理された行数。これはAfter変数で、整数を返します。

ERROR_MESSAGE

エラー発生時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

使用方法

使用ルール

このコンポーネントは、通常、ジョブまたはサブジョブの開始コンポーネントとして使い、常に出力リンクが必要です。