特定のHadoop Distributed File System (HDFS)に接続できるよう設定するプロパティです。
HDFS接続
プロパティ |
設定 |
|
---|---|---|
[Selection] (選択) | HDFSを選択または入力します。 | |
[Configuration] (設定) | ||
[Engine] (エンジン) | リストからエンジンを選択します。 | |
[Connection] (接続) | [User name] (ユーザー名) | HDFSへの認証に使用するユーザー名を入力します。 |
[Description] (説明) | 接続の表示名(必須)と説明(オプション)を入力します。 |
HDFSデータセット
プロパティ | 設定 | |
---|---|---|
[Dataset Name] (データセット名) | データセットの表示名を入力します。この名前はすべてのTalend Cloudアプリでデータセットの一意識別子として使われます。 | |
[Connection] (接続) | リストで接続を選択します。既存の接続に基づいてデータセットを作成する場合、このフィールドは読み取り専用となります。 | |
[HDFS data] (HDFSデータ) | [Path] (パス) | ファイルシステムで取得するデータをポイントするパスを入力します。 |
[Format config] (形式設定) | [Auto detect] (自動検出) | このボタンをクリックすると、取得するデータの形式が自動的に検出されます。 |
[Format] (形式) | または、取得する次のようなファイル形式をリストで選択し、そのファイル形式に関連する情報を入力または選択します。
|
コネクターがソースデータセットやデスティネーションデータセットとして使われているかどうかによって、次のようなパラメーターが表示されることがあります。
- HDFSソースデータセットの場合:
- [Force parallelism-ignore escape char and text enclosure parameters] (並列処理を強制 - エスケープ文字とテキスト囲み文字パラメーターを無視): ファイル内のエスケープ文字、およびテキストを囲むための文字を無視したい場合は、このオプションを有効にします。
- HDFSデスティネーションデータセットの場合:
- [Overwrite] (上書き): ファイルが既に存在し、その内容を上書きする場合は、このオプションを有効にします。
- [Merge output] (出力をマージ): ファイルが既に存在し、既存ファイルやアップデート済みファイルの内容をマージする場合は、このオプションを有効にします。
- [Map input column names to output] (入力カラム名を出力カラム名にマッピング): このオプションは、CSV、JSON、Excel形式のファイルにのみ適用されます。これによって、入力カラム名と出力カラム名が同一であることが保証されます。