検証コードのマッピングを住所検証プロバイダーからTalendの検証レベルまで編集する - 7.3

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント

アドレス検証プロバイダーからの検証コードを編集してTalend検証レベルにマッピング

tAddressRowCloudコンポーネントとtBatchAddressRowCloudコンポーネントを使えば、Melissa DataやLoqateなどのオンラインサービスを使って住所を検証できます。melissaVerifLevelConf.xmlファイルとloqateVerifLevelConf.xmlファイルを編集して、検証コードのマッピングをMelissa DataとLoqateのレベルからTalendの検証レベルに変更します。

tAddressRowCloudコンポーネントを使い、Melissa Dataに基づいて住所を解析するジョブでは、出力内のVerificationLevelカラムの値は次のようになります。

この例では、melissaVerifLevelConf.xmlの値はデフォルトです。
<Provider name="melissadata">
  <VerifyLevel>
    <Verified match="startsWith">AV2</Verified>
    <PartiallyVerified match="startsWith">AV1</PartiallyVerified>
    <Unverified match="startsWith">AE01,AE02,AE03</Unverified>
    <Ambiguous match="startsWith">AE05,AE09,AE11,AE13,AE14,AE17</Ambiguous>
    <Conflict match="startsWith">AE08,AE10,AE12</Conflict>
    <Reverted></Reverted>
  </VerifyLevel>
</Provider>

手順

  1. <StudioPath>\plugins\org.talend.designer.components.tdqprovider\components\tAddressRowCloudに移動します。<StudioPath>Talend Studioのインストールディレクトリーです。
  2. org.talend.dataquality.address.jarファイルからデータを抽出します。
  3. melissaVerifLevelConf.xmlまたはloqateVerifLevelConf.xmlを開いて手動で編集します。
  4. 別の検証レベルにマッピングされた検証コードを変更します。検証コードの値はコンマで区切られています。
    たとえば、BBBで始まる検証コードを検証レベルPartiallyVerifiedにマッピングする場合は、melissaVerifLevelConf.xmlファイルのPartiallyVerifiedノードでAV1BBBに置き換えます。
    <PartiallyVerified match="startsWith">BBB</PartiallyVerified>
  5. org.talend.dataquality.address.jarを変更された設定ファイルで更新します。この例ではmelissaVerifLevelConf.xmlです。
  6. <StudioPath>/configuration/.m2/repository/org/talend/libraries/org.talend.dataquality.address/6.0.0<StudioPath>/workspace/.Javaにあるキャッシュされたorg.talend.dataquality.address.jarファイルを削除します。

タスクの結果

Talend Studioを再起動すると、tAddressRowCloudコンポーネントを使ってMelissa Dataに基づいて住所を解析したジョブの出力結果は次のようになります。

3番目と6番目の行では、AmbiguousがVerificationLevelカラム内に返されています。これは、AddressVerificationCodeカラム内に返されたAE05検証コードがmelissaVerifLevelConf.xml内ではAmbiguousにマッピングされているためです。

4番目の行では、ConflictがVerificationLevelカラム内に返されています。これは、AddressVerificationCodeカラム内に返されたAE08検証コードがmelissaVerifLevelConf.xml内ではConflictにマッピングされているためです。

これらの行に返されたその他の検証コードは、Talendのどの検証レベルにもマッピングされていません。