tPostgresqlInvalidRowsの標準プロパティ - Cloud - 8.0

PostgreSQL

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > PostgreSQL
データガバナンス > サードパーティーシステム > DBコンポーネント > PostgreSQL
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > PostgreSQL

このプロパティはStandardジョブフレームワークで実行されているtPostgresqlInvalidRowsを設定するために使います。

[Standard] (標準) tPostgresqlInvalidRowsコンポーネントは、データクオリティファミリーとデータベースファミリーに属しています。

このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricで利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Validation type] (検証タイプ)

[Regex pattern validation] (正規表現パターンの検証)または[DQ rule validation] (DQルール検証)のいずれか。
  • [Regex pattern validation] (正規表現パターンの検証): データベース内のデータを正規表現パターンに基づいて検証します。

  • [DQ rule validation] (DQルール検証): データベース内のデータをDQルールに基づいて検証します。

[Regex pattern validation] (正規表現パターンの検証)

  • [Analyzed column] (分析カラム): 分析するカラムをスキーマリストから選択します。

  • [Custom pattern] (カスタムパターン): このチェックボックスをオンにして、DB行をチェックするための独自のカスタマイズされた正規表現を手動で定義します。
  • [Pattern list] (パターンリスト): パターンリストからDB行をチェックするためのパターンを選択します。

[DQ rule validation] (DQルール検証)

  • [DQ rule list] (DQルールリスト): DB行をチェックするためのルールをリストから選択します。

  • [Query type] (クエリータイプ): [Buiilt-in] (組み込み)[Repository] (リポジトリー)のいずれかです。
    1. [Built-in] (組み込み): 手動でクエリーステートメントを入力するか、SQLBuilderを使ってグラフィカルに作成します。
    2. [Repository] (リポジトリー): リポジトリーに保管されている関連クエリーを選択します。[Query] (クエリー)フィールドはそれに従って入力されます。
  • [Guess query] (クエリーを推測): [Guess Query] (クエリーを推測)ボタンをクリックして、クエリーフィールド内のテーブルスキーマに対応するクエリーを生成します。

  • [Guess Schema] (スキーマを推測): [Guess Schema] (スキーマを推測)ボタンをクリックして、テーブルからスキーマを取得します。

  • [Query] (クエリー): DBクエリーを入力します。フィールドの順序に気を付けて、スキーマ定義と一致するようにしてください。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

 

[Built-in] (組み込み): 一元的に保存されるプロパティデータはありません。

 

[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。後続するフィールドは、取得されたデータを使用して事前に入力されます。

[Use existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、親ジョブと子ジョブの間の既存の接続を共有したい場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、次のように実行します。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。
  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。

[DB Version] (DBバージョン)

データベースバージョンのリスト。

[Host] (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

データベースサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Postgresql schema] (Postgresqlスキーマ)

Postgresqlスキーマの名前。

Username (ユーザー名)Password (パスワード)

データベースユーザー認証データ。

パスワードを入力するためには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

    変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

 

[Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。関連項目: Talend Studioユーザーガイドをご覧ください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保存されているため、必要な時に再利用できます。関連項目:Talend Studioユーザーガイドをご覧ください。

[Table Name] (テーブル名)

読み取るテーブルの名前を入力します。

[Where clause] (Where句)

WHERE句を入力して、テーブル内に行フィルターを定義します。

テーブル内の分析する行をフィルタリングするには、WHERE句を使用します。このWHERE句で、指定した条件に一致する有効なデータと無効なデータを取得できます。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するデータベース接続に追加のJDBCパラメーターを指定します。

このプロパティは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。

[Use cursor] (カーソルの使用)

このチェックボックスをオンにすると、指定された時に作業する行数を指定できます。このオプションにより、パフォーマンスを最適化できます。

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)

すべてのStringカラム/Charカラムの先頭や末尾の空白を削除する場合は、このチェックボックスをオンにします。

[Trim column] (カラムをトリミング)

定義されたカラムから先頭や末尾の空白を削除します。

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)がオンの場合、このチェックボックスは表示されません。[Trim column] (カラムをトリミング)を有効にするには、[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)をオフにします。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

グローバル変数

グローバル変数

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

QUERY: 処理されているクエリーステートメント。これはFlow変数で、文字列を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、開始または中間ステップとして使用できます。出力フローが必要です。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データ構造が同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

動的パラメーターの使用サンプルは、コンテキストベースの動的接続によるデータベースからのデータの読み取りおよび動的に読み取られた接続パラメーターを使用した異なるMySQLデータベースからのデータの読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。