ジョブタスクとは、Talend Studioから公開されたジョブアーティファクトを含んでいる実行可能な統合プロセスのことです。
このジョブアーティファクトのコンテキストがTalend Studioで定義済みの場合は、このジョブアーティファクトのデフォルトコンテキストが自動的に公開されます。これらのコンテキストをTalend Studioで定義する際に推奨されるルールについては、コンテキストと変数を使用をご覧ください。
セキュリティ上の理由により、このコンテキスト設定の値はエクスポートされたファイルでクリアされます。Talend Cloud Management Consoleでコンテキスト値を再入力する必要があります。
手順
-
[Management] (管理)ページを開きます。
-
[Tasks] (タスク)タブに移動します。
-
ページの上部にあるファセット検索を使って環境とワークスペースを選択します。
-
[Add task] (タスクを追加)をクリックします。
-
[Artifact] (アーティファクト)ステップで、[Job] (ジョブ)アーティファクトタイプを選択します。
-
ドロップダウンリストから実行するアーティファクトを選択します。
アーティファクトの詳細と説明が表示されます。
-
タスクで使用するアーティファクトのバージョンを選択します。
アーティファクトの新しいバージョンが公開されるたびにタスクを自動アップデートする場合は、[Always use the latest available artifact version] (アーティファクトの最新バージョンを常に使用)を選択します。必要であれば、特定のバージョンを選択して手動でアップデートすることもできます。
注: このオプションによって、Talend Studioの[Update corresponding job task] (対応するジョブタスクをアップデート)オプションが上書きされます。
アーティファクトの詳細と説明は自動的に更新されます。
- オプション:
[Override parameter values with artifact defaults] (パラメーター値をアーティファクトのデフォルトで上書き)チェックボックスをオンにします。
このオプションは、[Artifact version] (アーティファクトのバージョン)フィールドで[Always use the latest available artifact version] (アーティファクトの最新バージョンを常に使用)を選択した場合のみ利用できます。このオプションを選択すると、新しいバージョンのアーティファクトが公開されるたびに、タスクで定義されたパラメーターがデフォルトのアーティファクトパラメーターによって置き換えられます。
-
タスクのワークスペースを選択します。
-
新しいタスクに名前を付けます。
デフォルトでは、作成元であるアーティファクトの名前がタスク名になります。
注: ワークスペース内のタスクには一意名が必要です。
- オプション:
タグをタスクに追加します。
-
既存のタグをドロップダウンリストから選択します。
-
名前を入力し、ドロップダウンリストでクリックして、新しいタグを作成します。
-
[Continue] (続行)をクリックします。
-
[Parameters] (パラメーター)ステップで、ジョブのパラメーターに値を入力します。
このステップで[Show order as in Studio] (Studioと同じように順序を表示)の切り替えが無効になっている場合、値を設定できるのはTalend Studioでparameter_プレフィックスを使って定義したパラメーターのみです。
注: 値が特殊文字として解釈される場合(\tなど)は、\ではなく\\を使います。
Talend Cloud Management Consoleで表示される場合、パラメーター名の各単語の最初の文字は大文字に、アンダースコア(_)は空白にそれぞれ自動的に変更されます。たとえばcity_nameはCity Nameとなります。
つまり、プログラムでパラメーター名を使用する必要がある場合(APIリクエストなど)は、表示名ではなくTalend Studioの名前を使用してください。
- オプション:
[Advanced parameters] (詳細パラメーター)セクションで、Talend Studioでプレフィックスなしで定義したパラメーター、およびジョブで定義されていないconnection_パラメーターに値を入力します。 このセクションは、[Show order as in Studio] (Studioと同じように順序を表示)の切り替えが無効になっている場合に利用できます。無効になっていない場合、パラメーターはすべて[Parameters] (パラメーター)ステップにあります。
注: 値が特殊文字として解釈される場合(\tなど)は、\ではなく\\を使います。
- オプション:
[Connections] (接続)ステップで、ドロップダウンリストから適切な接続形式を選択するか、アーティファクトで既に定義されているパラメーターに基づいて新しい接続を作成します。
- オプション:
[Resources] (リソース)ステップで、タスクに使用する適切なリソースを選択します。
-
[Engine] (エンジン)ステップで、[Engine] (エンジン)ドロップダウンリストからタスクを実行するエンジンかエンジンクラスターを選択します。
- Cloud
- Cloud Exclusive
- Remote Engine
- Remote Engineクラスター
- オプション:
実行プロファイルを選択します。
タスク実行のJVMパラメーターは、選択したRemote Engineやクラスターのために以前作成した実行プロファイルを選択して設定できます。
Remote Engineまたはクラスターを使用している場合、この機能はRemote Engine2.9.1以降でサポートされています。
-
ログレベルを設定します。
有効にする最低ログレベルを選択します。
Remote Engineまたはクラスターを使用している場合、この機能はRemote Engine2.8.3以降でサポートされています。
例
ログレベルが[Warning] (警告)に設定されている場合、[Task run log] (タスク実行ログ)ページには[Warning] (警告)と[Error] (エラー)というフラグが付けられたログのみ表示されます。
セキュリティ上の理由により、本番環境にデプロイされるジョブのログレベルを[Warning] (警告)に設定します。
- オプション:
[Allow parallel run of this task] (このタスクの並列実行を許可)オプションを選択すると、Cloud Engine、Cloud Exclusive、Remote Engine、クラスターを使用する時にタスクを並列実行できるようになります。
Remote Engineを使って同一のタスクを同時に実行する場合、この機能のサポートはRemote Engine v2.12.0以降です。
デフォルトでは、1つのRemote Engineで3つの異なるタスクか同一のタスクを並列実行できます。関連設定の詳細は、1台のRemote Engineでタスクを並列実行をご覧ください。
このオプションを無効にする前に、タスクを停止するか、実行の終了を待ちます。このいずれかの操作を行わない限り、並列実行は許可されたままとなります。
- オプション:
Remote Engineやクラスターを選択した場合は、[Run as impersonated user] (実行ユーザーとして実行)フィールドにユーザー名を入力すれば別のユーザーとしてジョブを実行できます。
この機能は、Unix (または同様の)環境にRemote Engineがインストールされている場合のみサポートされます。
- オプション:
次のいずれかを選択してタスク実行のタイムアウトを設定します。
- オプション:
[Schedule] (スケジュール)ステップで実行間隔を(そして必要であればトリガーのタイムアウトも)選択します。
1つまたは複数のトリガーを追加してタスクをスケジュールすることも、トリガーなしでタスクを手動で開始することもできます。
デフォルトでは、トリガーのタイムアウト値はタスクのタイムアウト値と同じです。
タスクのタイムアウトはトリガーのタイムアウトによってオーバーライドされます。
-
[Save and close] (保存して閉じる)をクリックします。
タスクの結果
これで、Talend Cloud Management Consoleでタスクを実行できます。
注:
指数関数的なバックオフ再試行パターンを採用することで、1回目と2回目の再試行が高速化(最初の失敗からそれぞれ1分後と3分後)されるだけでなく、ピーク時の負荷急増の際にグローバルな動作が向上しました。
たとえば既に実行中のタスクを実行しようとすると、その実行は失敗します。
Talend Cloud Management Consoleは実行間隔を長くしながら再試行するので、最初の再試行は1分後、2回目は2分後、その後は4分後と8分後に行われます。
4回目の試行が失敗すると、Exceeded the limit of deployment attempts: another instance of the same task was running on the engine at same time
というエラーメッセージが表示されます。その場合は、後でタスクを実行し直してみてください。
トラブルシューティング: タスク実行スケジュールの頻度が高すぎると、異なる2つのCloud EngineやRemote Engineで同じタスクが並列実行されてしまうことがあります。この問題を回避するためには、Cloud Engineが1つのみ割り当てられた環境でタスクを実行するか、Remote Engineでタスクをスケジュール設定してください。