アドレス検証プロバイダーからの検証コードを編集してTalend検証レベルにマッピング - Cloud - 8.0

Address standardization

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント

tAddressRowCloudコンポーネントとtBatchAddressRowCloudコンポーネントを使えば、Melissa DataやLoqateなどのオンラインサービスを使ってアドレスを検証できます。melissaVerifLevelConf.xmlファイルとloqateVerifLevelConf.xmlファイルを編集して、検証コードのマッピングをMelissa DataとLoqateのレベルからTalendの検証レベルに変更します。

tAddressRowCloudコンポーネントを使い、Melissa Dataに基づいてアドレスを解析するジョブでは、出力内のVerificationLevelカラムの値は次のようになります。

この例では、melissaVerifLevelConf.xmlの値はデフォルトです。
<Provider name="melissadata">
  <VerifyLevel>
    <Verified match="startsWith">AV2</Verified>
    <PartiallyVerified match="startsWith">AV1</PartiallyVerified>
    <Unverified match="startsWith">AE01,AE02,AE03</Unverified>
    <Ambiguous match="startsWith">AE05,AE09,AE11,AE13,AE14,AE17</Ambiguous>
    <Conflict match="startsWith">AE08,AE10,AE12</Conflict>
    <Reverted></Reverted>
  </VerifyLevel>
</Provider>

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

手順

  1. <StudioPath>\plugins\org.talend.designer.components.tdqprovider\components\tAddressRowCloudに移動します。<StudioPath>Talend Studioのインストールディレクトリーです。
  2. org.talend.dataquality.address.jarファイルからデータを抽出します。
  3. melissaVerifLevelConf.xmlまたはloqateVerifLevelConf.xmlを開いて手動で編集します。
  4. 別の検証レベルにマッピングされた検証コードを変更します。検証コードの値はコンマで区切られています。
    たとえば、BBBで始まる検証コードを検証レベルPartiallyVerifiedにマッピングする場合は、melissaVerifLevelConf.xmlファイルのPartiallyVerifiedノードでAV1BBBに置き換えます。
    <PartiallyVerified match="startsWith">BBB</PartiallyVerified>
  5. org.talend.dataquality.address.jarを変更された設定ファイルで更新します。この例ではmelissaVerifLevelConf.xmlです。
  6. <StudioPath>/configuration/.m2/repository/org/talend/libraries/org.talend.dataquality.address/6.0.0<StudioPath>/workspace/.Javaにあるキャッシュされたorg.talend.dataquality.address.jarファイルを削除します。

タスクの結果

Talend Studioを再起動すると、tAddressRowCloudコンポーネントを使ってMelissa Dataに基づいてアドレスを解析したジョブの出力結果は次のようになります。

3番目と6番目の行では、AmbiguousがVerificationLevelカラム内に返されています。これは、AddressVerificationCodeカラム内に返されたAE05検証コードがmelissaVerifLevelConf.xml内ではAmbiguousにマッピングされているためです。

4番目の行では、ConflictがVerificationLevelカラム内に返されています。これは、AddressVerificationCodeカラム内に返されたAE08検証コードがmelissaVerifLevelConf.xml内ではConflictにマッピングされているためです。

これらの行に返されたその他の検証コードは、Talendのどの検証レベルにもマッピングされていません。