tFileOutputDelimited標準プロパティ - 7.2

Delimited

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データガバナンス > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き

これらのプロパティを使って、[Standard] (標準)ジョブフレームワークで実行されているtFileOutputDelimitedを設定します。

[Standard] (標準) tFileOutputDelimitedコンポーネントはファイルファミリーに含まれます。

このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-In] (組み込み)または[Repository] (リポジトリー)のいずれか。

 

[Built-In] (組み込み): プロパティデータは一元的に保存されません。

 

[Repository] (リポジトリー): プロパティを保存するリポジトリーファイルを選択します。

[Use Output Stream] (出力ストリームの使用)

このチェックボックスをオンにすると、目的のデータフローが処理されます。これを選択すると、[Output Stream] (出力ストリーム)フィールドが表示され、目的のデータフローを入力できます。

対応する代表変数により、コンポーネントでデータを取得できるようにするには、処理するデータフローを追加する必要があります。

この変数はStudioで事前に定義されているか、このコンポーネントと共に使用されているコンテキストまたはコンポーネントによって提供されている可能性があります。 それ以外の場合は、手動で変数を定義し、ジョブの設計に従って使用できます(たとえば、tJavaまたはtJavaFlexを使用)。

手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl] + [Space])から目的の変数を選択して、現在のフィールドに入力できます。

ストリームの使用方法の詳細は、ストリーミングモードでのリモートファイルからのデータの読み取りを参照してください。

[File name] (ファイル名)

出力ファイルや使用する変数の名前またはパス。

[Use Output Stream] (出力ストリームの使用)チェックボックスをオンにすると、このフィールドは使用できなくなります。

ジョブで変数を定義して使用する方法の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。

[Row Separator] (行区切り)

行の終端を識別するために使用される区切り記号。

[Field Separator] (フィールド区切り)

転送されたデータのフィールドを区切る場合は、文字か文字列を入力します。

注: [Advanced settings] (詳細設定)ビューで[CSV options] (CSVオプション)が選択されていると、フィールド区切りは1文字のみとなります。この場合、このフィールドに複数の文字を入力しても、フィールド区切りとして機能するのは最初の文字だけです。

[Append] (追加)

このチェックボックスをオンにすると、ファイルの最後に新しい行が追加されます。

ヘッダーを含める

このカラムヘッダーをファイルに含めるには、このチェックボックスをオンにします。

[Compress as zip file] (ZIPファイルとして圧縮)

出力ファイルをzip形式で圧縮するには、このチェックボックスをオンにします。

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

このコンポーネントはダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、『 Talend Studio ユーザーガイド』を参照してください。

このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。

 

[Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

[Sync columns] (カラムの同期)

クリックすると、出力ファイルのスキーマと入力ファイルのスキーマが同期されます。同期機能は、[Row] (行)接続が出力コンポーネントにリンクされている場合にのみ表示されます。

詳細設定

[Advanced separator (for numbers)] (詳細区切り文字: 数値)

数値に使用する区切り記号を変更するには、このチェックボックスをオンにします。デフォルトでは、桁区切り記号はコンマ(,)で、小数点区切り記号はピリオド(.)です。

[Thousands separator] (3桁区切り): 数字3桁の区切り文字を定義します。

[Decimal separator] (小数点区切り): 小数点の区切り文字を定義します。

CSV options (CSVオプション)

このチェックボックスをオンにすると、次のCSVパラメーターを指定できます:

  • Escape char (エスケープ文字): 二重引用符の間にエスケープ文字を入力します。

  • Text enclosure (テキストエンクロージャー): 二重引用符の間にエンクロージャー文字(1文字のみ)を入力します。たとえば、エンクロージャー文字として二重引用符(")を使用する場合は、"""と入力する必要があります。

標準エスケープ文字("\")を使用することをお勧めします。これを使用しない場合は、[Escape char] (エスケープ文字)[Text enclosure] (テキストエンクロージャー)に同じ文字を設定する必要があります。たとえば、エスケープ文字が"\"に設定されている場合、テキストエンクロージャーはその他の任意の1文字に設定できます。他方、エスケープ文字が"\"以外の文字に設定されている場合、テキストエンクロージャーはその他の任意の複数の文字に設定できます。ただし、エスケープ文字はテキストエンクロージャーと同じ文字に変更されます。たとえば、エスケープ文字が"#"に設定され、テキストエンクロージャーが"@"に設定されている場合、エスケープ文字は"#"ではなく"@"に変更されます。

[Create directory if not exists] (ディレクトリーがない場合はディレクトリーを作成)

このチェックボックスはデフォルトで選択されています。区切り記号付き出力ファイルが存在しない場合は、保管するディレクトリーを作成します。

[Split output in several files] (出力を複数のファイルに分割)

非常に大きな出力ファイルの場合は、このチェックボックスをオンにして、区切り記号付き出力ファイルを複数のファイルに分割します。

[Rows in each output file] (各出力ファイルの行):各出力ファイルの行数を設定します。

フラッシュバッファーサイズのカスタマイズ

このチェックボックスをオンにすると、バッファーを空にする前に書き込む行数が定義されます。

[Row Number] (行数):書き込む行数を設定します。

[Output in row mode] (行モード出力)

このチェックボックスをオンにすると、フラッシュのアトミック性が確保され、データ各行の一貫性が保たれるため不完全なデータ行がファイルに書き込まれることはありません。

このチェックボックスは通常、マルチスレッドでコンポーネントを使用する場合に使用します。

Encoding (エンコーディング)

リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.comを参照してください。

[Don't generate empty file] (空のファイルを生成しない)

空のファイルを生成しない場合は、このチェックボックスをオンにします。

[Throw an error if the file already exist] (ファイルが既存の場合はエラーにする)

[Basic settings] (基本設定)ビューの[File Name] (ファイル名)フィールドに指定された出力ファイルが既に存在する場合は、このチェックボックスをオンにして例外をスローします。

既存のファイルを上書きするには、このチェックボックスをオフにします。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルやコンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

FILE_NAME: 処理されているファイルの名前。これはFlow変数で、文字列を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

[Usage rule] (使用ルール)

このコンポーネントを使用して、区切り記号付きファイルを作成し、フィールド区切り値を使用してフィールドを区切ります。

制限事項

ライセンスの互換性の問題のため、このコンポーネントの使用に必要な1つ以上のJARが提供されていません。この特定のコンポーネントに不足しているJARをインストールするには、Component (コンポーネント)タブビューの[Install] (インストール)ボタンをクリックします。Studioの Integration パースペクティブの[Modules] (モジュール)タブでも、不足しているすべてのJARを簡単に見つけて追加できます。詳細は、外部モジュールのインストールを参照してください。外部モジュールをインストールする方法の詳細は、Talend Help Center (https://help.talend.com)を参照してください。