Modifier le mapping des codes de vérification retournés par les fournisseurs d'outils de validation d'adresses vers les niveaux de vérification Talend - Cloud - 8.0

Standardisation d'adresses

Version
Cloud
8.0
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Last publication date
2024-02-21

Les composants tAddressRowCloud et tBatchAddressRowCloud vous permettent de vérifier des adresses à l'aide de services en ligne, comme Melissa Data et Loqate. Vous pouvez modifier les fichiers melissaVerifLevelConf.xml et loqateVerifLevelConf.xml afin de changer le mapping des codes de vérification de Melissa Data et Loqate aux niveaux de vérifications Talend.

Dans un Job utilisant un composant tAddressRowCloud pour parser des adresses par rapport à Melissa Data, les valeurs de la colonne VerificationLevel ressemblent à ceci en sortie :

Dans cet exemple, les valeurs dans melissaVerifLevelConf.xml sont celles par défaut :
<Provider name="melissadata">
  <VerifyLevel>
    <Verified match="startsWith">AV2</Verified>
    <PartiallyVerified match="startsWith">AV1</PartiallyVerified>
    <Unverified match="startsWith">AE01,AE02,AE03</Unverified>
    <Ambiguous match="startsWith">AE05,AE09,AE11,AE13,AE14,AE17</Ambiguous>
    <Conflict match="startsWith">AE08,AE10,AE12</Conflict>
    <Reverted></Reverted>
  </VerifyLevel>
</Provider>

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Procédure

  1. Allez à <StudioPath>\plugins\org.talend.designer.components.tdqprovider\components\tAddressRowCloud, où <StudioPath> est le répertoire d'installation de votre Studio Talend.
  2. Décompressez le fichier org.talend.dataquality.address.jar.
  3. Ouvrez melissaVerifLevelConf.xml or loqateVerifLevelConf.xml pour le modifier manuellement.
  4. Modifiez les codes de vérification mappés vers les différents niveaux de vérification. Les valeurs des codes de vérification sont séparées par une virgule.
    Par exemple, pour mapper les codes de vérification commençant par BBB au niveau de vérification PartiallyVerified, remplacez AV1 par BBB dans le nœud PartiallyVerified du fichier melissaVerifLevelConf.xml :
    <PartiallyVerified match="startsWith">BBB</PartiallyVerified>
  5. Mettez à jour le fichier org.talend.dataquality.address.jar avec le fichier de configuration modifié, melissaVerifLevelConf.xml dans cet exemple.
  6. Supprimez les fichiers en cache org.talend.dataquality.address.jar situés dans <StudioPath>/configuration/.m2/repository/org/talend/libraries/org.talend.dataquality.address/6.0.0 et <StudioPath>/workspace/.Java.

Résultats

Après redémarrage du Studio Talend, les résultats en sortie du Job utilisant le composant tAddressRowCloud pour parser les adresses par rapport à Melissa Data ressemblent à ceci :

Pour la troisième et la sixième lignes, la valeur Ambiguous est retournée dans la colonne VerificationLevel car le code de vérification AE05 retourné dans la colonne AddressVerificationCode et mappé à Ambiguous dans melissaVerifLevelConf.xml.

Pour la quatrième ligne, la valeur Conflict est retournée dans la colonne VerificationLevel car le code de vérification retourné AE08 dans la colonne AddressVerificationCode est mappé à Conflict dans melissaVerifLevelConf.xml.

Les autres codes de vérification retournés pour ces lignes ne sont mappés à aucun niveau de vérification Talend.