tMultiPatternCheck標準プロパティ - 7.2

Pattern validation

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > パターン検証コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > パターン検証コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > パターン検証コンポーネント

このプロパティは[Standard] (標準)ジョブフレームワークで実行するtMultiPatternCheckの設定で使用されます。

[Standard] (標準)tMultiPatternCheckコンポーネントはデータクオリティファミリーのコンポーネントです。

このコンポーネントは、Talend Data Management PlatformTalend Big Data PlatformTalend Real Time Big Data PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricで使用できます。

基本設定

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

 

[Built-In] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。関連項目: Talend Studioユーザーガイドを参照してください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。関連項目: 『 Talend Studioユーザーガイド』を参照してください。

[Logical operator used to combine check conditions] (チェック条件の結合に使用する論理演算子)

カラムに設定した条件を組み合わる場合は、このリストから使用する結合モードを選択します。

[Columns To Check] (チェックするカラム)

分析対象の各カラムに対して正規表現を設定します。

  • [Column] (カラム): 分析対象カラムのリスト。
  • [Property] (プロパティ): データチェックのベースとするパターンは、[Built-in] (組み込み)か、または[Repository] (リポジトリー)にリモートで保管されています。
  • [Pattern Selection] (パターン選択): [Property] (プロパティ)リストから[Repository] (リポジトリー)を選択した場合にのみ、このカラムのフィールドをクリックできます。[Pattern Selector] (パターンセレクター)からカラムデータをチェックするパターンを選択するには、対応するフィールドの[...]ボタンをクリックします。これらのパターンは、Talend Studio[DQ Repository] (DQリポジトリー)から取得されます。リストには、システムおよびユーザー定義のパターンが含まれています。
  • [Pattern Regex] (パターン正規表現): [Property] (プロパティ)カラムで[Built-in] (組み込み)を選択した場合は、独自にカスタマイズした正規表現を入力できます。
  • [Is Case sensitive] (大文字と小文字を区別する): カラム名のチェックボックスをオンにすると、パターンチェックの際に大文字と小文字の確認が含められます。
  • [Check] (チェック): チェックボックスをオンにすると、定義されたパターンに対してカラムがチェックされます。
  • [Message] (メッセージ): このカラムを空のままにすると、どのパターンでデータ行が無効になり、リジェクトされたかという自動メッセージが表示されます。また、パーソナライズした独自のメッセージを入力して、行のリジェクトの原因となったパターンに関する情報をジョブの結果に付け加えることもできます。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

NB_LINE_OK: 特定のパターンに一致する行の数。これはAfter変数で、整数を返します。

NB_LINE_REJECT: 特定のパターンに一致しない行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントは通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。

[Limitation] (制限事項)

[DQ Repository] (DQリポジトリー)に保管されているユーザー定義パターンでtMultiPatternCheckを使用してジョブをエクスポートする場合は、そのジョブを使用してパターンをエクスポートする必要があります。あるいは、別のプロジェクトにジョブをインポートする場合は、パターンは組み込みモードに切り替わります。

システムパターンでtMultiPatternCheckを使用してジョブをインポートすると、パターンは組み込みモードに切り替わります。

Talend Studioのデータプロファイリングアイテムを使用してジョブをインポートする方法は、Talend Help Centerのマニュアルを参照してください(https://help.talend.com)。

Talend Studio内のパターンと共にジョブをインポートするオペレーションについては、「データプロファイリングアイテムまたはプロジェクトのインポート」を参照してください。