tMultiPatternCheckの標準プロパティ - Cloud - 8.0

Pattern validation

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > パターン検証コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > パターン検証コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > パターン検証コンポーネント
Last publication date
2024-02-28

これらのプロパティは、標準ジョブのフレームワークで実行されているtMultiPatternCheckを設定するために使われます。

標準tMultiPatternCheckコンポーネントは、データクオリティファミリーに属しています。

このコンポーネントは、Talend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricで使用できます。

基本設定

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

 

[Built-In] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。[Basic settings] (基本設定)タブにあるコンポーネントスキーマの詳細は、[Basic settings] (基本設定)をご覧ください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保存されており、さまざまなプロジェクトやジョブデザインで再利用できます。[Basic settings] (基本設定)タブにあるコンポーネントスキーマの詳細は、[Basic settings] (基本設定)をご覧ください。

[Logical operator used to combine check conditions] (チェック条件の結合に使用する論理演算子)

カラムに設定した条件を組み合わる場合は、このリストから使用する結合モードを選択します。

[Columns To Check] (チェックするカラム)

分析済みの各カラムに対して正規表現を設定するために使われます。

  • [Column] (カラム): 分析済みカラムのリスト。
  • [Property] (プロパティ): データチェックのベースとするパターンは、[Built-in] (組み込み)か、または[Repository] (リポジトリー)にリモートで保管されています。
  • [Pattern Selection] (パターン選択): [Property] (プロパティ)リストから[Repository] (リポジトリー)を選択した場合にのみ、このカラムのフィールドをクリックできます。[Pattern Selector] (パターンセレクター)からカラムデータをチェックするパターンを選択するには、対応するフィールドの[...]ボタンをクリックします。これらのパターンは、Talend Studio[DQ Repository] (DQリポジトリー)から取得されます。リストには、システムおよびユーザー定義のパターンが含まれています。
  • [Pattern Regex] (パターン正規表現): [Property] (プロパティ)カラムで[Built-in] (組み込み)を選択した場合は、独自にカスタマイズした正規表現を入力できます。
  • [Is Case sensitive] (大文字と小文字を区別する): カラム名のチェックボックスをオンにすると、パターンチェックの際に大文字と小文字の確認が含められます。
  • [Check] (チェック): チェックボックスをオンにすると、定義されたパターンに対してカラムがチェックされます。
  • [Message] (メッセージ): このカラムを空のままにすると、どのパターンでデータ行が無効になり、リジェクトされたかという自動メッセージが表示されます。また、パーソナライズした独自のメッセージを入力して、行のリジェクトの原因となったパターンに関する情報をジョブの結果に付け加えることもできます。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

グローバル変数

グローバル変数

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

NB_LINE_OK: 特定のパターンにマッチングする行の数。これはAfter変数で、整数を返します。

NB_LINE_REJECT: 特定のパターンにマッチングしない行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。

変数の詳細は、コンテキストと変数を使用をご覧ください。

使用方法

使用ルール

このコンポーネントは、通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。

[Limitation] (制限事項)

[DQ Repository] (DQリポジトリー)に保管されているユーザー定義パターンでtMultiPatternCheckを使用してジョブをエクスポートする場合は、そのジョブを使用してパターンをエクスポートする必要があります。あるいは、別のプロジェクトにジョブをインポートする場合は、パターンは組み込みモードに切り替わります。

システムパターンでtMultiPatternCheckを使用してジョブをインポートすると、パターンは組み込みモードに切り替わります。

Talend Studio内のパターンと共にジョブをインポートするオペレーションについては、「データプロファイリング項目またはプロジェクトのインポート」をご覧ください。