tPersonator標準プロパティ - 7.3

Melissa Data address standardization

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Melissaデータアドレス標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Melissaデータアドレス標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Melissaデータアドレス標準化コンポーネント

このプロパティは標準ジョブフレームワークで実行されているtPersonatorを設定するために使います。

標準tPersonatorコンポーネントはデータクオリティファミリーのコンポーネントです。

基本設定

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。

ジョブで接続されている先行コンポーネントからスキーマを取得するには、[Sync columns] (カラムの同期)をクリックします。

[Schema] (スキーマ)のタイプを選択します。
  • [Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

[View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

[Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

[Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

サポートされているデータ型は文字列のみです。

出力スキーマには、読み取り専用カラムが含まれています。詳細は、出力カラムのリストを参照してください。

[Input mapping] (入力マッピング) [Personator] (なりすまし者)フィールドを[Input column] (入力カラム)に関連付けます。

重要: [Input mapping] (入力マッピング)テーブルで入力カラムが定義されていない場合、対応する出力カラムは空です。

アクション 実行するアクションを選択します。
  • [Check action] (チェックアクション): データを標準化し、それが有効であることを確認します。このアクションは、各データを個別に分析します。たとえば、郵便番号が都市と一致しない場合、[Check action] (チェックアクション)は他のデータに影響を与えることなくそれを修正します。
  • [Verify action] (確認アクション): 異なるデータが互いに関連付けられるようにします。このアクションは、データ全体を分析します。たとえば、住所に対してこのアクションを実行すると、 [Verify action] (確認アクション)は、住所が他のデータベース内の同じ名前、電話番号、メールに関連付けられているかどうかを確認します。
  • [Move action] (移動アクション): 最後の住所を取得します。データベースには、少なくとも姓または会社名と住所が含まれている必要があります。
  • [Append action] (追加アクション): 不足しているデータを追加します。
アクションにより、一部の入力は必須です。
[Centric hint] (Centricヒント) [Append action] (追加アクション)または[Verify action] (確認アクション)を選択した場合に利用できます。
1つの参照データを選択します。
  • [Auto] (自動): 住所を参照データとして使う場合に選択します。利用できない場合は、電話番号が使われます。利用できない場合は、メールが使われます。利用できない場合、SSN (社会保障番号)が使われます。
  • 住所
  • Phone
  • Email (メール)
  • SSN

    この参照データは、[Verify action] (確認アクション)を選択した場合に利用できます。

[Append options] (追加オプション) [Append action] (追加アクション)を選択した場合に利用できます。
1つのアクションを選択します。
  • [Blank] (空白): データベースに住所、電話番号、メール、名前、または会社のいずれも含まれていない場合に、データを追加することを選択します。
  • [Check error] (エラーをチェック): エラーが発生した時に住所、電話、メール、名前、または会社のいずれかにデータを追加する場合に選択します。
    • 住所エラーは、データベースに住所が見つからない、部分的に検証されていない、または修正できない場合に発生します。コンポーネントは結果コードを返しません: AS01、AS02、AS03。結果コードについては、この説明テーブルを参照してください。

    • 電話番号に7桁または10桁が含まれていない場合は、電話エラーが発生します。コンポーネントは結果コードを返しません: PS01またはPS02。結果コードについては、この説明テーブルを参照してください。

    • メールエラーは、メールがデータベースに見つからない場合、またはメールが未確認の場合に発生します。コンポーネントは結果コードを返しません: ES01またはES03。結果コードについては、この説明テーブルを参照してください。

    • 名前が正しく解析されなかった場合、名前エラーが発生します。コンポーネントは結果コードを返しません: NS01。結果コードについては、この説明テーブルを参照してください。
    • 会社名が指定されていない場合は、会社エラーが発生します。
  • [Always] (常時): データベースの住所、電話番号、メール、名前、または会社が空白か間違っているかに関係なく、データを追加する場合に選択します。
[Address options] (住所オプション) [Diacritics] (発音区別符号): [auto] (自動)[on] (オン)、または[off] (オフ)。フランス語の文字を返すには、[on] (オン)に設定します。[auto] (自動)に設定すると、それらの文字がデータベースに存在する場合に返されます。

[Advanced address correction] (高度な住所修正): 住所の高度な修正を実行する場合に選択します。氏名または会社名を使い、家屋番号、番地、市、州、郵便番号を修正または追加できます。

[Use preferred city] (優先都市を使う): 郵便局が優先する都市名を使う場合に選択します。

[Name options] (名前オプション) [Name hint] (名前のヒント)
  • [Definitely full] (必ずフル): 形式、句読点に関係なく、ファーストネーム、ミドルネーム、ラストネームの順で名前を処理する場合に選択します。
  • [Very likely full] (フルの可能性大): フォーマットまたは句読点で順序が示されていない限り、ファーストネーム、ミドルネーム、ラストネームの順で名前を処理する場合に選択します。
  • [Probably full] (おそらくフル): 選択すると、統計ロジックが名前の順序を決定し、ファーストネーム、ミドルネーム、ラストネームの順でバイアスがかかります。
  • [Varying] (変動): 選択すると、統計ロジックが名前の順序を決定し、どの名前の順序にもバイアスがかかりません。
  • [Probably inverse] (おそらく逆): 選択すると、統計ロジックが名前の順序を決定し、ラストネーム、ミドルネーム、ファーストネームの順でバイアスがかかります。
  • [Very likely inverse] (逆の可能性大): フォーマットまたは句読点で順序が示されていない限り、ラストネーム、ミドルネーム、ファーストネームの順で名前を処理する場合に選択します。
  • [Definitely inverse] (必ず逆): 形式、句読点に関係なく、ラストネーム、ミドルネーム、ファーストネームの順で名前を処理する場合に選択します。
  • [Mixed first name] (ファーストネームの混在): ラストネームが見つからない場合に選択します。名前フィールドには、接頭辞、ファーストネーム、ミドルネームのみを含めてください。
  • [Mixed last name] (ラストネームの混在): ファーストネームとミドルネームが見つからない場合に選択します。名前フィールドには、ラストネームとサフィックスのみを含めてください。
[Middle name logic] (ミドルネームロジック)
  • [Parse logic] (解析ロジック): ミドルネームをラストネームの一部と見なす場合に選択します。ミドルネームが一般的なラストネームである場合、これを考慮できます。この場合、ラストネームはハイフンでつながれます。
  • [Hyphenated last] (ハイフン付きラストネーム): 2番目の単語をラストネームの一部と見なす場合に選択します。
  • [Middle name] (ミドルネーム): 2番目の単語をミドルネームと見なす場合に選択します。
[Salutation format] (挨拶文の形式): 挨拶文の形式を選択します。たとえば、John Smith:
  • [Formal] (フォーマル): Mr. Smith
  • [Informal] (インフォーマル): John
  • [First/Last] (ファーストネーム/ラストネーム): John Smith
[Gender population] (ジェンダー人口): [Mixed] (混合)[Male] (男性)[Female] (女性)。データベースで主な性別を選択します。

[Genderization policy] (ジェンダー化ポリシー): [Neutral] (ニュートラル)[Conservative] (保守的)[Aggressive] (アグレッシブ)。このオプションの詳細は、結果テーブルを参照してください。

上記の[Name options] (名前オプション)情報を出力カラムに表示するには、[Miscellaneous outputs] (その他の出力)[Name details] (名前の詳細)チェックボックスをオンにします 。

[Correct first name] (ファーストネームを修正): ファーストネームのスペルを修正する場合に選択します。

[Standardize company] (会社の標準化): タイトルケースを適用し、会社名を短縮する場合に選択します。たとえば、melissa data corporationMelissa Data Corp.に置き換えられます。
[Email options] (メールオプション) [Database lookup] (データベースルックアップ): 有効なドメインのデータベースを使ってドメイン名を確認する場合に選択します。

[Standardize case] (ケーシングの標準化):アクションを実行する前にメールの文字を小文字にする場合に選択します。

[Correct syntax] (構文の修正): メールの構文を修正する場合に選択します。このオプションは、シンプルなメール構文をサポートします: local part + @ + domain + ‘.’ + top-level domain たとえば、jsmith@domain,cojjsmith@domain.comに置き換えられます。

[Update domain] (ドメインを更新): 古くなったドメイン名を更新する場合に選択します。

[Address outputs] (住所出力) [Basic (Default)] (基本(デフォルト)): 基本的な住所を返す場合に選択します。 この設定は常に有効になっています。

[Address details] (住所の詳細): 住所の詳細を返す場合に選択します。

Plus4: +4コードを返す場合に選択します。

[Private mailbox] (私書箱): 私書箱番号を返す場合に選択します。これらのメールボックスは、私設私書箱の私書箱です。

[Suite] (スイート): アパート番号を返す場合に選択します。

[Parsed address] (解析済み住所): 住所の詳細を返す場合に選択します。

[Geographic outputs] (地理的出力) [Census] (国勢調査): 国勢調査情報を返す場合に選択します。

[Census 2] (国勢調査2): 追加の国勢調査情報を返す場合に選択します。

[Geocode] (ジオコード): ジオコードを返す場合に選択します。

[Miscellaneous outputs] (その他の出力) [Demographic details] (人口統計の詳細): 人口統計のすべての結果を含む文字列を返す場合に選択します。コンマで結果を区切ります。

[Name details] (名前の詳細): 性別、挨拶文などの名前の詳細を返す場合に選択します。

[Parsed email] (解析済みメール): ドメイン名、メールボックス名などのメールの詳細を返す場合に選択します。

[Parsed phone] (解析済み電話): 内線番号、プレフィックスなどの電話番号の詳細を返す場合に選択します。

アクションにより、一部の入力は必須です。
アクション 必須の入力
チェック データベースには、少なくとも次のいずれかが含まれている必要があります。
  • 住所と郵便番号
  • 住所と市または州
  • Phone number
  • Email (メール)
  • 氏名
  • ファーストネームとラストネーム
確認 データベースには、少なくとも次のうちの2つが含まれている必要があります。
  • 住所と郵便番号、または住所、都市、および州
  • Phone number
  • Email (メール)
  • フルネームまたはラストネーム、またはファーストネームとラストネーム
  • 会社名
データベースに名前と会社名のみが含まれている場合は、検証アクションを実行できません。十分に正確な結果が得られません。
移動 データベースには、少なくとも次のいずれかが含まれている必要があります。
  • 住所およびフルネーム
  • 住所およびファーストネームとラストネーム
  • 住所および会社名
[Append] (追加) 必須入力は、追加するデータによって異なります。
名前または会社名を追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • 住所、市と州、または住所と郵便番号
  • Phone number
  • Email (メール)
住所を追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • Phone number
  • Email (メール)
電話番号を追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • 住所、市と州、または住所と郵便番号
  • Email (メール)
メールを追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • 住所、市と州、または住所と郵便番号
  • Phone number

Advanced settings (詳細設定)

[tStatCatcher statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

ライセンスキー

キーを入力し、フィールドの横にある[…]ボタンをクリックします。

ライセンスキーがない場合はMelissa Dataにお問い合わせください。
[Number of retries] (再試行回数) ジョブが失敗するまでの再試行回数を定義します。
[Timeout in seconds] (タイムアウトの秒数) タイムアウト時間を定義します。
[Cache directory] (キャッシュディレクトリー) キャッシュディレクトリーを参照します。
[Batch request size (1-100)] (バッチリクエストサイズ(1-100)) 各バッチで配信されるメッセージの数を定義します。
[Multithreading] (マルチスレッド) 同じジョブで複数のスレッドを使って、Melissaデータサービスからの応答を処理する場合に選択します。
[Thead count (1-10)] (スレッドカウント(1-10)) スレッドの最大数を定義します。
[Show debug console output] (デバッグコンソールの出力を表示) デバッグコンソールの出力を表示する場合に選択します。