MapR-DBへの接続の作成 - Cloud - 8.0

Talend Studioユーザーガイド

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
対象製品...

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

手順

  1. [Repository] (リポジトリー)ツリーで、[Metadata] (メタデータ)ノードの下の[Hadoop cluster] (Hadoopクラスター)ノードを展開し、使用するMapR接続を右クリックしてコンテキストメニューから[Create MapRDB] (MapRDBの作成)を選択します。
  2. 接続ウィザードが表示されます。ここで、[Name] (名前)[Purpose] (目的)[Description] (説明)など、ジェネリックプロパティを入力します。[Status] (ステータス)フィールドは、[File] (ファイル) > [Edit project properties] (プロジェクトプロパティを編集)で定義できます。
  3. [Next] (次へ)をクリックして次の手順に進みます。ここでは、MapR-DBの接続情報を入力します。このうち、[DB Type] (DBの種類)[Hadoop cluster] (Hadoopクラスター)[Distribution] (ディストリビューション)[MapR-DB version] (MapR-DBのバージョン)[Server] (サーバー)は、前の手順で選択したMapR接続から継承されたプロパティが自動的に入力されます。
    [Hadoop cluster] (Hadoopクラスター)リストから[None] (なし)を選択すると、手動モードに切り替わり、継承されたプロパティが破棄されるので、すべてのプロパティを手動で入力しなければなりません。作成された接続は、[Db connection] (データベース接続)ノードの下だけに表示されます。
  4. [Port] (ポート)フィールドには、接続するMapR-DBデータベースのポート番号を入力します。デフォルト番号は5181です。これは実際、Zookeeperサービスを実行しているノードに対するポートです。
    注:

    MapRサーバーのホスト名をクライアントやホストのコンピューターで識別可能にするには、クライアントとホストのコンピューターの関連するhostsファイルにそのホスト名でIPアドレスとホスト名のマッピングエントリーを追加する必要があります。たとえば、MapRサーバーのホスト名がmyMapRで、IPアドレスが192.168.x.xの場合、マッピングエントリーは192.168.x.x myMapRとなります。Windowsシステムでは、このエントリーをC:\WINDOWS\system32\drivers\etc\hostsに追加します(WindowsがCドライブにインストールされている場合)。Linuxシステムでは、このエントリーを/etc/hostsのファイルに追加します。

  5. カラムをフィルターしたい場合は、[Column family] (カラムファミリー)フィールドにカラムファミリーを入力し、[Check] (確認)をクリックして接続を確認します。
  6. 使用するデータベースにKerberosセキュリティを実行している場合は、[Use Kerberos authentication] (Kerberos認証を使用)チェックボックスをオンにし、表示されるフィールドにプリンシパル名を入力します。情報は、使用するMapRクラスターのhbase-site.xmlファイル内にあります。
    ログインにkeytabファイルが必要な場合は、[Use a keytab to authenticate] (認証にkeytabを使用)チェックボックスをオンにします。keytabファイルには、Kerberosのプリンシパルと暗号化されたキーのペアが含まれています。使用するプリンシパルを[Principal] (プリンシパル)フィールドに入力し、keytabファイルへのパスを[Keytab]フィールドに入力します。
    keytabが有効なジョブは、プリンシパルに任命されたユーザーでなくても実行できますが、使用するkeytabファイルの読み取り権限が必要です。たとえば、user1というユーザー名でジョブを実行し、使用するプリンシパルがguestの場合、user1に使用するkeytabファイルの読み取り権限があることをご確認ください。
  7. 使用するMapRクラスターがMapRチケット認証メカニズムで保護されている場合は、関連するセキュリティ設定を指定するために、[Force MapR Ticket authentication] (MapRチケット認証を強制)を選択します。
    1. [Force MapR ticket authentication] (MapRチケット認証を強制)チェックボックスをオンにして、定義する関連パラメーターを表示します。
    2. [Username] (ユーザー名)フィールドには認証するユーザー名を入力し、[Password] (パスワード)フィールドには、このユーザーが使用するパスワードを指定します。
      MapRセキュリティチケットがMapRによってこのユーザーのために生成され、設定しているジョブを実行するマシンに保存されます。
    3. このタブで[Group] (グループ)フィールドが利用可能な場合は、認証するユーザーが属するグループの名前を入力する必要があります。
    4. [Cluster name] (クラスター名)フィールドに、このユーザー名を使用して接続するMapRクラスターの名前を入力します。
      このクラスター名は、クラスターの/opt/mapr/confに保存されているmapr-clusters.conf ファイル内にあります。
    5. [Ticket duration] (チケットの有効期間)フィールドに、チケットが有効となる時間の長さ(秒単位)を入力します。
  8. 使用するMapR-DBディストリビューションにカスタム設定を使用する必要がある場合は、[Hadoop properties] (Hadoopのプロパティ)の横の[...]ボタンをクリックしてプロパティテーブルを開き、カスタマイズするプロパティを追加します。その後、ランタイムにStudioがHadoopのエンジンに使用するデフォルトのプロパティが、カスタマイズした設定に上書きされます。
    [Parent Hadoop properties] (親Hadoopのプロパティ)テーブルは、現在編集中のプロパティテーブルの上部に表示されます。この親テーブルは読み取り専用で、現在のMapR-データベース接続のベースとなる親MapR接続のウィザードで定義されたMapRプロパティがリストされます。
    MapRのプロパティの詳細は、MapRのドキュメンテーション、またはApache Hadoopから、より一般的なドキュメンテーションをご覧ください。
    HBaseとMapR-DBには密接な関係があるため、MapR-DBのプロパティの詳細は、HBaseに関するApacheのドキュメンテーションをご覧ください。たとえば、次のページにはHBaseの設定プロパティについていくつか説明されています: http://hbase.apache.org/book.html#_configuration_files
    このプロパティテーブルの活用方法の詳細は、再利用可能なHadoopのプロパティの設定をご覧ください。
  9. [Finish] (終了)をクリックして変更を確定します。
    新しく作成したMapR接続は、[Repository] (リポジトリー)ツリーの[Hadoop cluster] (Hadoopクラスター)ノードの下に表示されます。また、MapR-データベース接続はデータベース接続のため、この接続は[Db connections] (データベース接続)ノードの下にも表示されます。

タスクの結果

環境コンテキストを使用してこの接続のパラメーターを定義する必要がある場合は、[Export as context] (コンテキストとしてエクスポート)ボタンをクリックして対応するウィザードを開き、以下のオプションから選択します。
  • [Create a new repository context] (新しいリポジトリーコンテキストを作成): 現在のHadoop接続からこの環境コンテキストを作成します。つまり、ウィザードで設定するパラメーターは、これらのパラメーターに設定した値と共にコンテキスト変数として取られます。

  • [Reuse an existing repository context] (既存のリポジトリーコンテキストを再利用): 特定の環境コンテキストの変数を使用して現在の接続を設定します。

コンテキストの実装をキャンセルする必要がある場合は、[Revert Context] (コンテキストを復元)をクリックします。使用中のコンテキスト変数の値は、このウィザードに直接入力されます。

この[Export as context] (コンテキストとしてエクスポート)機能の使い方に関するステップバイステップの説明は、メタデータのコンテキストとしてエクスポート、およびコンテキストパラメーターを再利用して接続を設定をご覧ください。