MapR-DBへの接続の作成 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

手順

  1. [Repository] (リポジトリー)ツリーで、[Metadata] (メタデータ)ノードの下の[Hadoop cluster] (Hadoopクラスター)ノードを展開し、使用するMapR接続を右クリックしてコンテキストメニューから[Create MapRDB] (MapRDBの作成)を選択します。
  2. 接続ウィザードが表示されます。ここで、[Name] (名前)、[Purpose] (目的)、[Description] (説明)など、一般的なプロパティを入力します。[Status] (ステータス)フィールドは、[File] (ファイル) > [Edit project properties] (プロジェクトプロパティの編集)で定義することができます。
  3. [Next] (次へ)をクリックして次の手順に進みます。ここでは、MapR-DBの接続情報を入力します。このうち、[DB Type] (DBの種類)、[Hadoop cluster] (Hadoopクラスター)、[Distribution] (ディストリビューション)、[MapR-DB version] (MapR-DBのバージョン)、[Server] (サーバー)は、前の手順で選択したMapR接続から継承されたプロパティが自動的に入力されます。
    [Hadoop cluster] (Hadoopクラスター)リストから[None] (なし)を選択すると、手動モードに切り替わり、継承されたプロパティが破棄されるので、すべてのプロパティを手動で入力しなければなりません。作成された接続は、[Db connection] (Db接続)ノードの下だけに表示されます。
  4. [Port] (ポート)フィールドには、接続するMapR-DBデータベースのポート番号を入力します。デフォルト番号は5181です。これは実際、Zookeeperサービスを実行しているノードに対するポートです。
    注:

    MapRサーバーのホスト名をクライアントやホストのコンピューターで識別可能にするには、クライアントとホストのコンピューターの関連するhostsファイルにそのホスト名でIPアドレスとホスト名のマッピングエントリを追加する必要があります。たとえば、MapRサーバーのホスト名がmyMapRで、IPアドレスが192.168.x.xの場合、マッピングエントリは192.168.x.x myMapRとなります。Windowsシステムでは、このエントリをC:\WINDOWS\system32\drivers\etc\hostsに追加します(WindowsがCドライブにインストールされている場合)。Linuxシステムでは、このエントリを/etc/hostsに追加します。

  5. カラムをフィルターしたい場合は、[Column family] (カラムファミリー)フィールドにカラムファミリーを入力し、[Check] (確認)をクリックして接続を確認します。
  6. 使用するデータベースにKerberosセキュリティを実行している場合は、[Use Kerberos authentication] (Kerberos認証の使用)チェックボックスをオンにし、表示されるフィールドにプリンシパル名を入力します。情報は、使用するMapRクラスターのhbase-site.xmlファイル内にあります。
    ログインにkeytabファイルが必要な場合は、[Use a keytab to authenticate] (認証にkeytabを使用)チェックボックスをオンにします。keytabファイルには、Kerberosのプリンシパルと暗号化したキーのペアが含まれています。使用するプリンシパルを[Principal] (プリンシパル)フィールドに入力し、keytabファイルへのパスを[Keytab]フィールドに入力します。
    keytabが有効なジョブは、プリンシパルに任命されたユーザーでなくても実行できますが、使用するkeytabファイルの読み取り権限が必要です。たとえば、user1というユーザー名でジョブを実行し、使用するプリンシパルがguestの場合、user1に使用するkeytabファイルの読み取り権限があることを確認して下さい。
  7. 使用するMapRクラスターがMapRチケット認証メカニズムで保護されている場合は、関連するセキュリティ設定を指定するために、[Force MapR Ticket authentication] (MapRチケット認証を強制)を選択します。
    1. [Force MapR ticket authentication] (MapRチケット認証を強制)チェックボックスをオンにして、定義する関連パラメーターを表示します。
    2. [Username] (ユーザー名)フィールドには認証するユーザー名を入力し、[Password] (パスワード)フィールドには、このユーザーが使用するパスワードを指定します。
      MapRセキュリティチケットがMapRによってこのユーザーのために生成され、設定しているジョブを実行するマシンに保存されます。
    3. このタブで[Group] (グループ)フィールドが利用可能な場合は、認証するユーザーが属するグループの名前を入力する必要があります。
    4. [Cluster name] (クラスター名)フィールドに、このユーザー名を使用して接続するMapRクラスターの名前を入力します。
      このクラスター名は、クラスターの/opt/mapr/confに保存されているmapr-clusters.conf ファイル内にあります。
    5. [Ticket duration] (チケットの有効期間)フィールドに、チケットが有効となる時間の長さ(秒単位)を入力します。
  8. 使用するMapR-DBディストリビューションにカスタム設定を使用する必要がある場合は、[Hadoop properties] (Hadoopプロパティ)のとなりの[...]ボタンをクリックしてプロパティテーブルを開き、カスタマイズするプロパティを追加します。これらの変更内容はHadoopエンジンのプロパティとして使用され、Studioで使用される対応するデフォルトプロパティは実行時に上書きされます。
    [Parent Hadoop properties] (親Hadoopプロパティ)テーブルは、現在編集中のプロパティテーブルの上に表示されます。この親テーブルは読み取り専用で、現在のMapR-DB接続のベースとなる親MapR接続のウィザードで定義されたMapRプロパティがリストされます。
    MapRのプロパティの詳細は、MapRのドキュメンテーション、またはApache Hadoopから、より一般的なドキュメンテーションを参照して下さい。
    HBaseとMapR-DBには密接な関係があるため、MapR-DBのプロパティの詳細は、HBaseに関するApacheのドキュメンテーションを参照して下さい。たとえば、次のページにはHBaseの設定プロパティについていくつか説明されています: http://hbase.apache.org/book.html#_configuration_files
    このプロパティテーブルの活用方法の詳細は、再利用可能なHadoopプロパティの設定を参照して下さい。
  9. [Finish] (終了)をクリックして、変更を確定します。
    新しく作成したMapR接続は、[Repository] (リポジトリー)ツリーの[Hadoop cluster] (Hadoopクラスター)ノードの下に表示されます。また、MapR-DB接続はデータベース接続のため、この接続は[Db connections] (Db接続)ノードの下にも表示されます。

タスクの結果

環境コンテキストを使用してこの接続のパラメーターを定義する必要がある場合は、[Export as context] (コンテキストとしてエクスポート)ボタンをクリックして対応するウィザードを開き、以下のオプションから選択します。
  • [Create a new repository context] (新しいリポジトリコンテキストの作成): 現在のHadoop接続からこの環境コンテキストを作成します。つまり、ウィザードで設定するパラメーターは、これらのパラメーターに設定した値と共にコンテキスト変数として取られます。

  • [Reuse an existing repository context] (既存のリポジトリコンテキストを再利用): 特定の環境コンテキストの変数を使用して現在の接続を設定します。

コンテキストの実装をキャンセルする必要がある場合は、[Revert context] (コンテキストから戻す)をクリックします。使用中のコンテキスト変数の値は、このウィザードに直接入力されます。

この[Export as context] (コンテキストとしてエクスポート)機能の使い方の手順を追った説明は、コンテキストとしてのメタデータのエクスポートとコンテキストパラメーターを再利用した接続の設定を参照して下さい。