tFileInputDelimited標準プロパティ - 7.2

Delimited

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データガバナンス > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き

このプロパティはStandardジョブフレームワークで実行されているtFileInputDelimitedを設定するために使います。

[Standard] (標準) tFileInputDelimitedコンポーネントはファイルファミリーに含まれます。

このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-In] (組み込み)または[Repository] (リポジトリー)のいずれか。

 

[Built-In] (組み込み): プロパティデータは一元的に保存されません。

 

[Repository] (リポジトリー): プロパティを保存するリポジトリーファイルを選択します。

[File Name/Stream] (ファイル名/ストリーム)

[File Name] (ファイル名): 処理されるファイルの名前とパス

[Stream] (ストリーミング): 処理されるデータフロー。対応する代表変数によりtFileInputDelimitedでデータを取得するには、データをフローに追加する必要があります。

この変数はStudioで事前に定義されているか、このコンポーネントと共に使用されているコンテキストまたはコンポーネントによって提供されている可能性があります。 それ以外の場合は、手動で変数を定義し、ジョブの設計に従って使用できます(たとえば、tJavaまたはtJavaFlexを使用)。

手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl + Space])から目的の変数を選択して、現在のフィールドに入力できます。

使用可能な変数に関連するトピックは、 Talend Studioユーザーガイドを参照してください。

警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。

[Row separator] (行区切り)

行の終端を識別するために使用される区切り記号。

[Field separator] (フィールド区切り)

転送されたデータのフィールドを区切る場合は、文字、文字列、正規表現のいずれかを入力します。

注: [CSV options] (CSVオプション)が選択されていると、フィールド区切りは1文字のみとなります。この場合、このフィールドに複数の文字を入力しても、フィールド区切りとして機能するのは最初の文字だけです。

[CSV options] (CSVオプション)

このチェックボックスをオンにすると、次のCSVパラメーターを指定できます:

  • Escape char (エスケープ文字): 二重引用符の間にエスケープ文字を入力します。

  • Text enclosure (テキストエンクロージャー): 二重引用符の間にエンクロージャー文字(1文字のみ)を入力します。たとえば、エンクロージャー文字として二重引用符(")を使用する場合は、"""と入力する必要があります。

標準エスケープ文字("\")を使用することをお勧めします。これを使用しない場合は、[Escape char] (エスケープ文字)[Text enclosure] (テキストエンクロージャー)に同じ文字を設定する必要があります。たとえば、エスケープ文字が"\"に設定されている場合、テキストエンクロージャーはその他の任意の1文字に設定できます。他方、エスケープ文字が"\"以外の文字に設定されている場合、テキストエンクロージャーはその他の任意の複数の文字に設定できます。ただし、エスケープ文字はテキストエンクロージャーと同じ文字に変更されます。たとえば、エスケープ文字が"#"に設定され、テキストエンクロージャーが"@"に設定されている場合、エスケープ文字は"#"ではなく"@"に変更されます。

[Header] (ヘッダー)

ファイルの先頭でスキップする行の数を入力します。

ダイナミックスキーマを使用する場合、ヘッダーフィールド値が設定されているかどうかに関係なく、入力データの最初の行が常にヘッダー行として扱われることに注意してください。ダイナミックスキーマの詳細は、 Talend Studio ユーザーガイドを参照してください。

[Footer] (フッター)

ファイルの最後にスキップする行数。

[Limit] (制限事項)

処理される行の最大数。[Limit] (制限) = 0の場合、行の読み取りや処理は行われません。

[Schema] (スキーマ)[Edit Schema] (スキーマの編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマの編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

null不可能なプリミティブフィールドの入力値がnullの場合、そのフィールドを含むデータ行は拒否されることに注意してください。

このコンポーネントではダイナミックスキーマ機能のメリットが提供されています。ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、 Talend Studio ユーザーガイドを参照してください。

このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。

ダイナミックスキーマ機能を使用する場合、ダイナミックカラムには入力ファイルの実際のカラム名は含まれません。出力フローに実際のカラム名を含める場合は、入力ファイルにヘッダー行があり、ヘッダー値が正しく設定されていることを確認してください。

 

[Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

[Skip empty rows] (空の行をスキップ)

このチェックボックスをオンにすると、空の行はスキップされます。

[Uncompress as zip file] (Zipファイルを展開)

このチェックボックスをオンにすると、入力ファイルの圧縮が解除されます。

[Die on error] (エラー発生時に強制終了)

このチェックボックスをオンにすると、エラー発生時にジョブの実行が停止されます。

エラーの発生した行をスキップし、エラーが発生していない行の処理を完了するには、このチェックボックスをオフにします。エラーをスキップしたら、[Row] (行)> [Reject] (リジェクト)リンクを使用してエラーの発生した行を収集できます。

FileNotFoundExceptionを取得するには、このチェックボックスも選択する必要があります。

詳細設定

[Advanced separator (for numbers)] (詳細区切り文字: 数値)

数値に使用する区切り記号を変更するには、このチェックボックスをオンにします。デフォルトでは、桁区切り記号はコンマ(,)で、小数点区切り記号はピリオド(.)です。

[Extract lines at random] (行をランダムに抽出)

このチェックボックスをオンにすると、ランダムに抽出する行数を設定できます。

[Encoding] (エンコーディング)

リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.comを参照してください。

[Trim all column] (すべてのカラムのトリム)

このチェックボックスをオンにすると、先行ホワイトスペースおよび後続ホワイトスペースがすべてのカラムから削除されます。このチェックボックスをオフにすると、[Check column to trim] (トリミングするカラムの確認)テーブルが表示され、トリミングする特定のカラムを選択できます。

[Check each row structure against schema] (スキーマに対する各行構造のチェック)

このチェックボックスをオンにすると、各行のカラム総数がスキーマと一致するかどうかチェックされます。一致しない場合、コンソール上にエラーメッセージが表示されます。

[Check date] (日付の確認)

このチェックボックスをオンにすると、日付形式が入力スキーマに対して厳密にチェックされます。

[Check columns to trim] (トリミングするカラムのチェック)

このテーブルは使用されているスキーマで自動入力されます。トリミングするカラムに対応するチェックボックスをオンにします。

[Split row before field] (フィールドの前の行を分割)

このチェックボックスをオンにすると、フィールドの分割前に行を分割できます。

[Permit hexadecimal (0xNNN) or octal (0NNNN) for numeric types] (数値型に16進数または8進数を許可)

16進数文字列または8進数文字列を数値データ型(long、integer、short、またはbyte)に解析する場合は、このチェックボックスをオンにします。

表示されるテーブルで対象となるカラムの横にあるチェックボックスをオンにし、各カラムの入力文字列をスキーマで定義されている型に変換します。

[Permit hexadecimal or octal] (16進数または8進数を許可)チェックボックスをオンにすると、すべてのカラムが選択されます。

このテーブルは、数値型の16進数(0xNNN)または8進数(0NNNN)のチェックボックスが選択されている場合にのみ表示されます。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルで処理メタデータが収集されます。

グローバル変数

グローバル変数

NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細については、 Talend Studio ユーザーガイドを参照してください。

使用方法

[Usage rule] (使用ルール)

このコンポーネントを使用してファイルを読み取り、定義されたセパレーターを使用してこのファイルに含まれるフィールドを区切ります。[Row] (行) > [Main] (メイン)リンクを使用するか、定義されたタイプに対応しないデータでデータをフィルタリングする[Row] (行) > [Reject] (リジェクト)リンクを使用してデータフローを作成できます。詳細については、zmf1550477847335.htmlを参照してください。

制限事項

ライセンスの互換性の問題のため、このコンポーネントの使用に必要な1つ以上のJARが提供されていません。この特定のコンポーネントに不足しているJARをインストールするには、Component (コンポーネント)タブビューの[Install] (インストール)ボタンをクリックします。Studioの Integration パースペクティブの[Modules] (モジュール)タブでも、不足しているすべてのJARを簡単に見つけて追加できます。詳細は、外部モジュールのインストールを参照してください。