tPersonatorの標準プロパティ - Cloud - 8.0

Melissa Data address standardization

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Melissaデータアドレス標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Melissaデータアドレス標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Melissaデータアドレス標準化コンポーネント

このプロパティは標準ジョブフレームワークで実行されているtPersonatorを設定するために使います。

標準tPersonatorコンポーネントは、データクオリティファミリーに属しています。

基本設定

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。

[Sync columns] (カラムを同期)をクリックすると、ジョブで接続している先行コンポーネントからスキーマが取得されます。

[Schema] (スキーマ)のタイプを選択します。
  • [Built-in] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

[View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

[Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

[Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

サポートされているデータ型は文字列のみです。

出力スキーマには、読み取り専用カラムが含まれています。詳細は、出力カラムのリストをご覧ください。

[Input mapping] (入力マッピング) [Personator] (なりすまし者)フィールドを[Input column] (入力カラム)に関連付けます。
サポートされているデータ型は:
  • 日付
  • Long
  • 文字列
アクション 実行するアクションを選択します。
  • [Check action] (チェックアクション): データを標準化し、それが有効であることを確認します。このアクションは、各データを個別に分析します。たとえば、郵便番号が都市と一致しない場合、[Check action] (チェックアクション)は他のデータに影響を与えることなくそれを修正します。
  • [Verify action] (確認アクション): 異なるデータが互いに関連付けられるようにします。このアクションは、データ全体を分析します。たとえば、住所に対してこのアクションを実行すると、 [Verify action] (確認アクション)は、住所が他のデータベース内の同じ名前、電話番号、メールに関連付けられているかどうかを確認します。
  • [Move action] (移動アクション): 最後の住所を取得します。データベースには、少なくとも姓または会社名と住所が含まれている必要があります。
  • [Append action] (追加アクション): 不足しているデータを追加します。
アクションにより、一部の入力は必須です。
[Centric hint] (Centricヒント) [Append action] (追加アクション)または[Verify action] (確認アクション)を選択した場合に利用できます。
参照データを1つ選択します。
  • [Auto] (自動): 住所を参照データとして使う場合に選択します。利用できない場合は、電話番号が使われます。利用できない場合は、メールが使われます。利用できない場合、SSN (社会保障番号)が使われます。
  • Address
  • Phone
  • Email
  • SSN

    この参照データは、[Verify action] (確認アクション)を選択した場合に利用できます。

[Append options] (追加オプション) [Append action] (追加アクション)を選択した場合に利用できます。
アクションを1つ選択します。
  • [Blank] (空白): データベースに住所、電話番号、メール、名前、または会社のいずれも含まれていない場合に、データを追加することを選択します。
  • [Check error] (エラーをチェック): エラーが発生した時に住所、電話、メール、名前、または会社のいずれかにデータを追加する場合に選択します。
    • 住所エラーは、データベースに住所が見つからない、部分的に検証されていない、または修正できない場合に発生します。コンポーネントは結果コードを返しません: AS01、AS02、AS03。結果コードについては、この説明テーブルをご覧ください。

    • 電話番号に7桁または10桁が含まれていない場合は、電話エラーが発生します。コンポーネントは結果コードを返しません: PS01またはPS02。結果コードについては、この説明テーブルをご覧ください。

    • メールエラーは、メールがデータベースに見つからない場合、またはメールが未確認の場合に発生します。コンポーネントは結果コードを返しません: ES01またはES03。結果コードについては、この説明テーブルをご覧ください。

    • 名前が正しく解析されなかった場合、名前エラーが発生します。コンポーネントは結果コードを返しません: NS01。結果コードについては、この説明テーブルをご覧ください。
    • 会社名が指定されていない場合は、会社エラーが発生します。
  • [Always] (常時): データベースの住所、電話番号、メール、名前、または会社が空白か間違っているかに関係なく、データを追加する場合に選択します。
[Address options] (住所オプション) [Diacritics] (発音区別符号): [auto] (自動)[on] (オン)、または[off] (オフ)。フランス語の文字を返すには、[on] (オン)に設定します。[auto] (自動)に設定すると、それらの文字がデータベースに存在する場合に返されます。

[Advanced address correction] (高度な住所修正): 住所の高度な修正を実行する場合に選択します。氏名または会社名を使い、家屋番号、番地、市、州、郵便番号を修正または追加できます。

[Use preferred city] (優先都市を使う): 郵便局が優先する都市名を使う場合に選択します。

[Name options] (名前オプション) [Name hint] (名前のヒント)
  • [Definitely full] (必ずフル): 形式、句読点に関係なく、ファーストネーム、ミドルネーム、ラストネームの順で名前を処理する場合に選択します。
  • [Very likely full] (フルの可能性大): フォーマットまたは句読点で順序が示されていない限り、ファーストネーム、ミドルネーム、ラストネームの順で名前を処理する場合に選択します。
  • [Probably full] (おそらくフル): 選択すると、統計ロジックが名前の順序を決定し、ファーストネーム、ミドルネーム、ラストネームの順でバイアスがかかります。
  • [Varying] (変動): 選択すると、統計ロジックが名前の順序を決定し、どの名前の順序にもバイアスがかかりません。
  • [Probably inverse] (おそらく逆): 選択すると、統計ロジックが名前の順序を決定し、ラストネーム、ミドルネーム、ファーストネームの順でバイアスがかかります。
  • [Very likely inverse] (逆の可能性大): フォーマットまたは句読点で順序が示されていない限り、ラストネーム、ミドルネーム、ファーストネームの順で名前を処理する場合に選択します。
  • [Definitely inverse] (必ず逆): 形式、句読点に関係なく、ラストネーム、ミドルネーム、ファーストネームの順で名前を処理する場合に選択します。
  • [Mixed first name] (ファーストネームの混在): ラストネームが見つからない場合に選択します。名前フィールドには、接頭辞、ファーストネーム、ミドルネームのみを含めてください。
  • [Mixed last name] (ラストネームの混在): ファーストネームとミドルネームが見つからない場合に選択します。名前フィールドには、ラストネームとサフィックスのみを含めてください。
[Middle name logic] (ミドルネームロジック)
  • [Parse logic] (解析ロジック): ミドルネームをラストネームの一部と見なす場合に選択します。ミドルネームが一般的なラストネームである場合、これを考慮できます。この場合、ラストネームはハイフンでつながれます。
  • [Hyphenated last] (ハイフン付きラストネーム): 2番目の単語をラストネームの一部と見なす場合に選択します。
  • [Middle name] (ミドルネーム): 2番目の単語をミドルネームと見なす場合に選択します。
[Salutation format] (挨拶文の形式): 挨拶文の形式を選択します。たとえば、John Smith:
  • [Formal] (フォーマル): Mr. Smith
  • [Informal] (インフォーマル): John
  • [First/Last] (ファーストネーム/ラストネーム): John Smith
[Gender population] (ジェンダー人口): [Mixed] (混合)[Male] (男性)[Female] (女性)。データベースで主な性別を選択します。

[Genderization policy] (ジェンダー化ポリシー): [Neutral] (ニュートラル)[Conservative] (保守的)[Aggressive] (アグレッシブ)。このオプションの詳細は、結果テーブルをご覧ください。

上記の[Name options] (名前オプション)情報を出力カラムに表示するには、[Miscellaneous outputs] (その他の出力)[Name details] (名前の詳細)チェックボックスをオンにします 。

[Correct first name] (ファーストネームを修正): ファーストネームのスペルを修正する場合に選択します。

[Standardize company] (会社の標準化): タイトルケースを適用し、会社名を短縮する場合に選択します。たとえば、melissa data corporationMelissa Data Corp.に置き換えられます。
[Email options] (メールオプション) [Database lookup] (データベースルックアップ): 有効なドメインのデータベースを使ってドメイン名を確認する場合に選択します。

[Standardize case] (ケーシングの標準化):アクションを実行する前にメールの文字を小文字にする場合に選択します。

[Correct syntax] (構文の修正): メールの構文を修正する場合に選択します。このオプションは、シンプルなメール構文をサポートします: local part + @ + domain + ‘.’ + top-level domain たとえば、jsmith@domain,cojjsmith@domain.comに置き換えられます。

[Update domain] (ドメインを更新): 古くなったドメイン名を更新する場合に選択します。

[Address outputs] (住所出力) [Basic (Default)] (基本(デフォルト)): 基本的な住所を返す場合に選択します。 この設定は常に有効になっています。

[Address details] (住所の詳細): 住所の詳細を返す場合に選択します。

Plus4: +4コードを返す場合に選択します。

[Private mailbox] (私書箱): 私書箱番号を返す場合に選択します。これらのメールボックスは、私設私書箱の私書箱です。

[Suite] (スイート): アパート番号を返す場合に選択します。

[Parsed address] (解析済み住所): 住所の詳細を返す場合に選択します。

[Geographic outputs] (地理的出力) [Census] (国勢調査): 国勢調査情報を返す場合に選択します。

[Census 2] (国勢調査2): 追加の国勢調査情報を返す場合に選択します。

[Geocode] (ジオコード): ジオコードを返す場合に選択します。

[Miscellaneous outputs] (その他の出力) [Demographic details] (人口統計の詳細): 人口統計のすべての結果を含む文字列を返す場合に選択します。コンマで結果を区切ります。

[Name details] (名前の詳細): 性別、挨拶文などの名前の詳細を返す場合に選択します。

[Parsed email] (解析済みメール): ドメイン名、メールボックス名などのメールの詳細を返す場合に選択します。

[Parsed phone] (解析済み電話): 内線番号、プレフィックスなどの電話番号の詳細を返す場合に選択します。

[IP Address] (IPアドレス): IPアドレスの接続速度、国などのような詳細を返す場合に選択します。

[Occupation] (職業): 個人の職業を返す場合に選択します。

アクションにより、一部の入力は必須です。
アクション 必須の入力
チェック データベースには、少なくとも次のいずれかが含まれている必要があります。
  • 住所と郵便番号
  • 住所と市または州
  • Phone number
  • [Email] (メール)
  • 氏名
  • ファーストネームとラストネーム
確認 データベースには、少なくとも次のうちの2つが含まれている必要があります。
  • 住所と郵便番号、または住所、都市、および州
  • Phone number
  • [Email] (メール)
  • フルネームまたはラストネーム、またはファーストネームとラストネーム
  • 会社名
データベースに名前と会社名のみが含まれている場合は、検証アクションを実行できません。十分に正確な結果が得られません。
移動 データベースには、少なくとも次のいずれかが含まれている必要があります。
  • 住所およびフルネーム
  • 住所およびファーストネームとラストネーム
  • 住所および会社名
[Append] (追加) 必須入力は、追加するデータによって異なります。
名前または会社名を追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • 住所、市と州、または住所と郵便番号
  • Phone number
  • [Email] (メール)
住所を追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • Phone number
  • [Email] (メール)
電話番号を追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • 住所、市と州、または住所と郵便番号
  • [Email] (メール)
メールを追加するには、データベースに少なくとも次のいずれかが含まれている必要があります。
  • 住所、市と州、または住所と郵便番号
  • Phone number

[Advanced settings] (詳細設定)

[tStatCatcher statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

ライセンスキー

キーを入力し、フィールドの横にある[…]ボタンをクリックします。

ライセンスキーがない場合はMelissa Dataにお問い合わせください。
[Number of retries] (再試行回数) ジョブが失敗するまでの再試行回数を定義します。
[Timeout in seconds] (タイムアウトの秒数) タイムアウト時間を定義します。
[Cache directory] (キャッシュディレクトリー) キャッシュディレクトリーを参照します。
[Batch request size (1-100)] (バッチリクエストサイズ(1-100)) 各バッチで配信されるメッセージの数を定義します。
[Multithreading] (マルチスレッド) 同じジョブで複数のスレッドを使って、Melissaデータサービスからの応答を処理する場合に選択します。
[Thead count (1-10)] (スレッドカウント(1-10)) スレッドの最大数を定義します。
[Show debug console output] (デバッグコンソールの出力を表示) デバッグコンソールの出力を表示する場合に選択します。