ジョブの[Run] (実行)ビューの[Spark configuration] (Spark設定)タブで、Atlus接続設定を完成させます。この設定は、ジョブごとに有効です。
このタイプのクラスターでは、[Yarn cluster] (Yarnクラスター)モードしか使用できません。
このセクションの情報は、Talend Data Fabric またはビッグデータ対応のTalend製品のいずれかにサブスクライブしているユーザーだけを対象とします。また、Talend Open Studio for Big Dataユーザーは対象外です。
始める前に
前提条件:
Cloudera Altusクライアント、Altus CLIは、ジョブが実行されるマシンにインストールする必要があります。
-
Cloudera Altus CLIをLinuxにインストールするには、Clouderaドキュメンテーションの Cloudera Altus Client Setup for Linuxを参照してください。
-
Cloudera Altus CLIをWindowsにインストールするには、Clouderaキュメンテーションの『Cloudera Altus Client Setup for Windows』を参照してください。
手順
タスクの結果
-
接続の設定後、必須ではありませんがSparkのパフォーマンスを調整できます。調整する場合は、以下に記載のプロセスに従います。
-
Apache Spark BatchジョブでSparkを調整 (Spark Batchジョブの場合)
-
Apache Spark StreamingジョブでSparkを調整 (Spark Streamingジョブの場合)
-
-
問題が発生した場合にSparkジョブのデバッグや再開ができるよう、[Run] (実行)ビューの[Spark configuration] (Spark設定)タブでロギングとチェックポインティングを有効にしておくことをお勧めします:
-
Altus関連のログを参照する必要がある場合は、Cloudera ManagerサービスまたはAltusクラスターインスタンスでご確認ください。