tMySQLValidRowsの標準プロパティ - 7.3

MySQL validation

Version
7.3
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > MySQL検証コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > MySQL検証コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > MySQL検証コンポーネント
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtMySQLValidRowsを設定するために使われます。

標準tMySQLValidRowsコンポーネントは、データクオリティファミリーとデータベースファミリーに属しています。

このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricで利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Validation type] (検証タイプ)

[Regex pattern validation] (正規表現パターンの検証)または[DQ rule validation] (DQルールの検証)のいずれか。
  • [Regex pattern validation] (正規表現パターンの検証): データベース内のデータを正規表現パターンに基づいて検証します。

  • [DQ rule validation] (DQルールの検証): データベース内のデータをDQルールに基づいて検証します。

[Regex pattern validation] (正規表現パターンの検証)

  • [Analyzed column] (分析カラム): 分析するカラムをスキーマリストから選択します。

  • [Custom pattern] (カスタムパターン): このチェックボックスをオンにして、DB行をチェックするための独自のカスタマイズされた正規表現を手動で定義します。
  • [Pattern list] (パターンリスト): パターンリストからDB行をチェックするためのパターンを選択します。

[DQ rule validation] (DQルールの検証)

  • [DQ rule list] (DQルールリスト): DB行をチェックするためのルールをリストから選択します。

  • [Query type] (クエリータイプ): [Buiilt-in] (組み込み)[Repository] (リポジトリー)のいずれかです。
    1. [Built-in] (組み込み): 手動でクエリーステートメントを入力するか、SQLBuilderを使ってグラフィカルに作成します。
    2. [Repository] (リポジトリー): リポジトリーに保管されている関連クエリーを選択します。[Query] (クエリー)フィールドはそれに従って入力されます。
  • [Guess query] (クエリーを推測): [Guess Query] (クエリーを推測)ボタンをクリックして、クエリーフィールド内のテーブルスキーマに対応するクエリーを生成します。

  • [Guess Schema] (推測スキーマ): [Guess Schema] (推測スキーマ)ボタンをクリックして、テーブルからスキーマを取得します。

  • [Query] (クエリー): DBクエリーを入力します。フィールドの順序に気を付けて、スキーマ定義と一致するようにしてください。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

 

[Built-in] (組み込み): 一元的に保存されるプロパティデータはありません。

 

[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。後続するフィールドは、取得されたデータを使用して事前に入力されます。

[DB Version] (データベースバージョン)

使用するMySQLのバージョンを選択します。

[Use existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。

[Host] (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

データベースサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Username] (ユーザー名)[Password] (パスワード)

データベースユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

 

[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。関連項目:Talend Studioユーザーガイドをご覧ください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保存されているため、必要な時に再利用できます。関連項目:Talend Studioユーザーガイドをご覧ください。

[Table Name] (テーブル名)

読み取るテーブルの名前を入力します。

[Where clause] (Where句)

WHERE句を入力して、テーブル内に行フィルターを定義します。

テーブル内の分析する行をフィルタリングするには、WHERE句を使用します。このWHERE句で、指定した条件に一致する有効なデータと無効なデータを取得できます。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するデータベース接続の接続の追加プロパティを指定します。このオプションは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。

注:

事前定義済みのグローバル変数のリストにアクセスするには、Ctrl + スペースを押します。

[Enable stream] (ストリームを有効化)

ストリーミングオーバーバッファリングを有効にするには、このチェックボックスをオンにします。それによって大きなテーブルからの読み取りでも大量のメモリを消費せずに済むため、パフォーマンスが最適化されます。

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)

すべてのStringカラム/Charカラムの先頭や末尾の空白を削除する場合は、このチェックボックスをオンにします。

[Trim column] (カラムをトリミング)

定義されたカラムから先頭や末尾の空白を削除します。

注:

[Trim column] (カラムをトリミング)を有効にするには、[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)をオフにします。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

グローバル変数

グローバル変数

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

QUERY: 処理されているクエリーステートメント。これはFlow変数で、文字列を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、開始または中間ステップとして使用できます。出力フローが必要です。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。