tVerifyEmailの標準プロパティ - Cloud - 8.0

Email validation

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > メール検証コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > メール検証コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 評価検証 > メール検証コンポーネント
Last publication date
2024-02-28

これらのプロパティは、標準ジョブのフレームワークで実行されているtVerifyEmailを設定するために使われます。

標準tVerifyEmailコンポーネントは、データクオリティファミリーに属しています。

このフレームワーク内のコンポーネントは、Talend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend Data Services Platform、およびTalend Data Fabricで使用できます。

基本設定

[Schema] (スキーマ)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

 

[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

Edit Schema (スキーマを編集)

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。変更を加えると、スキーマは自動的に組み込みになります。

tVerifyEmailの出力スキーマには、コンポーネントの[Basic settings] (基本設定)ビューで選択するオプションに応じて、異なる複数の読み取り専用カラムがあります。読み取り専用の出力カラムは次のとおりです。

VerificationLevel: 処理済みのメールアドレスの検証ステータスを次のように表示します。

-VALID: メールアドレスが定義済みのルールに準拠していることを意味します。

-INVALID: メールアドレスが定義済みのルールに準拠していないことを意味します。

-CORRECTED: 入力メールが定義済みのルールに準拠しておらず、選択したカラムのコンテンツを使用して訂正されたことを意味します。このカラムは、[LOCAL Part Options] (ローカルパートオプション)セクションで[Use column content] (カラムコンテンツを使用)オプションが選択されている場合のみ利用できます。

-VERIFIED: メールアドレスがドメインに存在しないことを意味します。このカラムは、[Check with mail server callback] (メールサーバーのコールバックを確認)オプションが選択されている場合のみ利用できます。

-REJECTED: メールアドレスがドメインに存在しないことを意味します。このカラムは、[Check with mail server callback] (メールサーバーのコールバックを確認)オプションが選択されている場合のみ利用できます。

Suggested_Email: メールアドレスの@記号の前に使用するコンテンツの推奨です。メールの文字列が、[Use column content] (カラムコンテンツを使用)ビューから選択するカラムで構築されます。

検証するカラム

tVerifyEmailを使用して検証するカラムをリストから選択してください。

正規表現のあるメール全体を確認

完全なメールアドレスを特定の正規表現と照合してマッチングする場合は、このチェックボックスをオンにします。

[Complete regular expression] (完全な正規表現): メールアドレスのマッチングのベースとする正規表現を入力します。

このマッチングは、メールアドレスのローカルおよびドメイン部分のマッチングへ進む前に、マッチングプロセスを最適化し、問題のあるアドレスを除外するための最初のステップとして行われます。

ローカルパートオプション

このセクションのフィールドは、選択するオプションに応じて異なります。メールアドレスの"ローカルパート"とは、@記号の前の文字列のことをいいます。

-[Use regular expression] (正規表現を使用): メールアドレスのローカルパートをチェックするベースとする表現を[Pattern] (パターン)フィールドに入力します。

-[Use simplified pattern] (simplified patternを使用): メールアドレスのローカルパートをチェックするベースとするsimplified patternを[Pattern] (パターン)フィールドに入力します。[Show syntax of simplified pattern] (simplified patternの構文を表示)オプションを選択して、simplified patternに使用する構文を表示します。構文の詳細は、tVerifyEmailの簡単なパターン構文をご覧ください。

-[Use column content] (カラムコンテンツを使用): このビューのフィールドを使用して、メールのローカルパートをチェックするベースとするコンテンツを決定します。ローカルパートが定義したものと一致しない場合は、フィールドのコンテンツを使用して書き換えられます。

-[Enable case-sensitive pattern matching] (大文字小文字判別のパターンマッチングを有効化): メールアドレスのローカルパートの大文字と小文字が区別されるパターンマッチングを有効にする場合は、このチェックボックスをオンにします。大文字と小文字が区別されるパターンマッチングは、上記の各オプションで使用できます。

ドメインパートオプション

このビューのフィールドは、選択するオプションに応じて異なります。

-[Check the Top-level Domains and the following ones] (トップレベルドメインと以下を確認): メールアドレスの最後のドットに続く部分を検証する場合は、このチェックボックスをオンにします。[Additional Top-level Domains] (追加トップレベルドメイン)テーブルを使用して、メールアドレスを検証するベースとするトップレベルドメインを追加します。

-[Check domains with a black list] ( ブラックリストを使ってドメインを確認): [Domain list] (ドメインリスト)テーブルで定義したドメインをブラックリスト記載として検証するには、このオプションを選択します。

-[Check domains with a white list] (ホワイトリストを使ってドメインを確認): [Domain List] (ドメインリスト)テーブルで定義したドメインをホワイトリスト記載として検証するには、このオプションを選択します。

メールサーバーのコールバックを確認

SMTPサーバーによるメールアドレスの検証を有効にするには、このチェックボックスをオンにします。

この手法では、メールサーバーは完全なアドレス(@記号の前後の部分)を検証します。メールアドレスのメールエクスチェンジャ (MX) へのSMTP接続を確立します。次に、エクスチェンジャにクエリーを実行し、そのアドレスが有効なアドレスであることを確認します。これは、アドレスにメールを送信するのと同じ方法で行われますが、メールエクスチェンジャがアドレスを受け入れるか拒否した後、プロセスは停止します。

メールサーバーによっては正しく応答しないことがあり、IPアドレスをブラックリストに載せることもあるため、異なるドメインを持つ多数のメールアドレスをチェックする場合、SMTP検証を有効にすることはお勧めできません。

以下は、SMTP検証が正しく機能しない場合のリストです。
  • メールサーバーが認証を要求する場合、
  • メールサーバーにセキュリティポリシーがあり、IPアドレスをブラックリストに入れてクエリーを拒否する可能性がある場合、
  • メールサーバーが返信に時間がかかりすぎる場合(タイムアウト)、
  • メールサーバーによって生成されたその他の予期しない例外。

メールサーバーがドメインからのすべてのメールを受け入れる場合、コンポーネントは、そのメールアドレスが存在するのかどうかを検証できません。

いずれの場合も、コンポーネントの結果は、コンポーネント設定で設定した他のルールの結果のみが考慮されます。

[Mail server connection timeout (s)] (メールサーバーのコールバックを確認 (秒)) このフィールドは、[Check with mail server callback] (メールサーバーのコールバックを確認)が選択されている時のみ利用できます。

サポートされているのは正の整数のみです。デフォルト値は10です。

パフォーマンス上の理由により、0を入力するとタイムアウトは10秒に設定されます。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

グローバル変数

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。

変数の詳細は、コンテキストと変数を使用をご覧ください。

使用方法

使用ルール

このコンポーネントは、通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。