Hadoopに保管されているデータをStudioで表示する - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio
警告:

このセクションで説明する情報は、サブスクリプションのTalend Studioユーザーのみを対象としています。Talend Open Studio for Big Dataのユーザーには適用されません。

ジョブのデザインまたは実行時に、処理するソースデータや実行後の出力データを表示しなければならないことがよくあります。Data viewer (データビューワー)は、他の特殊なツールを使わずに、Studioで直接データにアクセスすることができます。

ほとんどの場合、唯一必要なことは、このジョブから確認するデータが保管されているHadoopディストリビューションへの接続が正しく設定されていることのみです。

  1. ソースデータを表示するには、ワークスペースで使用しているtHDFSInputなどの入力コンポーネントを右クリックし、コンテキストメニューから[Data viewer] (データビューワー)を選択します。

  1. 実行後に出力データを確認するには、ワークスペースで使用しているtHDFSOutputなどの出力コンポーネントを右クリックし、コンテキストメニューから[Data viewer] (データビューワー)を選択します。

次の図は、[Data viewer] (データビューワー)にリモートのHadoopサーバーからデータを読み込んだ例を示しています。データスキーマは、Data Viewer (データビューワー)を呼び出したコンポーネントで定義されます。

MapR Hadoopディストリビューションを使用する場合、つまり、StudioがインストールされているマシンにMapRクライアントをインストールする必要がある場合は、StudioがそのMapRクライアントのネイティブライブラリにアクセスするために、 -Djava.library.path引数を設定する必要があります。

  1. Studioのメニューバーで、[Window] (ウィンドウ) > [Preferences] (環境設定)をクリックし、[Preferences] (環境設定)ダイアログボックスを開きます。

  2. [Talend]を展開して、[Run/Debug] (実行/デバッグ)を選択します。

  3. [Job Run VM arguments] (ジョブの実行VM引数)エリアで、[New] (新規作成)をクリックし、[Set the VM Argument] (VM引数の設定)ダイアログボックスを開きます。

  4. -Djava.library.pathの引数を設定します。たとえば、Windows 7を使用している場合は「-Djava.library.path=C:\opt\mapr\lib\native\Windows_7」、Linuxを使用している場合は「-Djava.library.path=/opt/mapr/lib」と入力します。

  5. [OK]をクリックしてダイアログボックスを閉じると、この引数が[Argument] (引数)テーブルに追加されます。

  6. [Apply] (適用)をクリックして変更を有効にし、[OK]をクリックして[Preferences] (環境設定)ダイアログボックスを閉じます。