tMySQLValidRows標準プロパティ - Cloud - 8.0

MySQL validation

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > MySQL検証コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > MySQL検証コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > MySQL検証コンポーネント

このプロパティはStandardジョブフレームワークで実行されているtMySQLValidRowsを設定するために使います。

[Standard] (標準) tMySQLValidRowsコンポーネントは、データクオリティファミリーとデータベースファミリーに属しています。

このコンポーネントは、Talend Data Management PlatformTalend Big Data PlatformTalend Real Time Big Data PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricで使用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントを参照してください。

基本設定

データベース

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Validation type] (検証タイプ)

[Regex pattern validation] (正規表現パターンの検証)または[DQ rule validation] (DQルール検証)のいずれか。
  • [Regex pattern validation] (正規表現パターンの検証): データベース内のデータを正規表現パターンに基づいて検証します。

  • [DQ rule validation] (DQルール検証): データベース内のデータをDQルールに基づいて検証します。

[Regex pattern validation] (正規表現パターンの検証)

  • [Analyzed column] (分析カラム): 分析するカラムをスキーマリストから選択します。

  • [Custom pattern] (カスタムパターン): このチェックボックスをオンにして、DB行をチェックするための独自のカスタマイズされた正規表現を手動で定義します。
  • [Pattern list] (パターンリスト): パターンリストからDB行をチェックするためのパターンを選択します。

[DQ rule validation] (DQルール検証)

  • [DQ rule list] (DQルールリスト): DB行をチェックするためのルールをリストから選択します。

  • [Query type] (クエリータイプ): [Buiilt-in] (組み込み)または[Repository] (リポジトリー)
    1. [Built-in] (組み込み): 手動でクエリーステートメントを入力するか、SQLBuilderを使ってグラフィカルに作成します。
    2. [Repository] (リポジトリー): [Repository] (リポジトリー)に保管されている関連クエリーを選択すると、[Query] (クエリー)フィールドはそれに従って入力されます。
  • [Guess query] (クエリーの推測): [Guess Query] (クエリーの推測)ボタンをクリックして、クエリーフィールド内のテーブルスキーマに対応するクエリーを生成します。

  • [Guess schema] (スキーマの推測): [Guess Schema] (スキーマの推測)ボタンをクリックして、テーブルからスキーマを取得します。

  • [Query] (クエリー): DBクエリーを入力します。フィールドの順序に気を付けて、スキーマ定義と一致するようにしてください。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。

 

[Built-in] (組み込み): プロパティデータは一元的に保管されません。

 

[Repository] (リポジトリー): プロパティを保存するリポジトリーファイルを選択します。後続するフィールドは、取得されたデータを使用して事前に入力されます。

[DB Version] (DBバージョン)

使用するMySQLのバージョンを選択します。

[Use existing connection] (デフォルト接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、『 Talend Studio ユーザーガイド』を参照してください。

Host (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

DBサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

 

[Built-in] (組み込み): このコンポーネントに対してのみスキーマを作成して、ローカルに保管します。関連項目: 『 Talend Studioユーザーガイド』を参照してください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保存されているため、必要な時に再利用できます。関連項目:Talend Studioユーザーガイドをご覧ください。

[Table Name] (テーブル名)

読み込むテーブルの名前を入力します。

[Where clause] (Where句)

WHERE句を入力して、テーブル内に行フィルターを定義します。

テーブル内の分析する行をフィルタリングするには、WHERE句を使用します。このWHERE句で、指定した条件に一致する有効なデータと無効なデータを取得できます。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するDB接続の追加の接続プロパティを指定します。このオプションは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続の使用)チェックボックスをオンにしている場合は使用できません。

注:

事前定義済みのグローバル変数のリストにアクセスするには、[Ctrl] + [Space]を押します。

[Enable stream] (ストリームを有効化)

ストリーミングオーバーバッファーリングを有効にするには、このチェックボックスをオンにします。これで、大きなテーブルからの読み込みにも大量のメモリを消費せずに済むため、パフォーマンスが最適化されます。

Trim all the String/Char columns (すべての文字列/文字カラムをトリミング)

すべてのStringカラム/Charカラムの先頭や末尾の空白を削除する場合は、このチェックボックスをオンにします。

[Trim column] (カラムをトリミング)

定義されたカラムから先頭や末尾の空白を削除します。

注:

[Trim column] (カラムをトリミング)を有効にするには、[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)をオフにします。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

QUERY: 処理されているクエリーステートメント。これはFlow変数で、文字列を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

[Usage rule] (使用ルール)

このコンポーネントは、開始または中間ステップとして使用できます。出力フローが必要です。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データ構造が同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスが選択されている場合にのみ使用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは使用できなくなります。

動的パラメーターの使用サンプルは、コンテキストベースの動的接続によるデータベースからのデータの読み取りおよび動的に読み込まれた接続パラメーターを使用した異なるMySQLデータベースからのデータの読み取りを参照してください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、『Talend Studioユーザーガイド』を参照してください。