Configurer le filtrage et l'extraction des données - 7.1

Standardization

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Pour définir un espace de nommage :

Procédure

  1. Dans l'espace de modélisation graphique, reliez le tStandardizeRow au tFilterColumns à l'aide d'un lien Row > Main.
  2. Dans la vue Basic settings du tFilterColumns, cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma.
  3. Cliquez sur la colonne STANDARDIZED_FIELD, puis cliquez sur la première flèche, afin de filtrer cette colonne. Cliquez sur OK pour fermer l'éditeur et valider les modifications.
  4. Dans l'espace de modélisation graphique, reliez le tFilterColumns au tExtractXMLField à l'aide d'un lien Row > Main.
  5. Double-cliquez sur le tExtractXMLField afin d'afficher sa vue Basic settings.
  6. Cliquez sur le bouton [...] à côté du champ Edit schema afin d'ouvrir l'éditeur du schéma. Ajoutez quatre colonnes et nommez-les respectivement number, street, zip et city, puis cliquez sur OK pour valider et fermer l'éditeur.
  7. Dans le champ XML field, vérifiez que la colonne STANDARDIZED_FIELD est sélectionnée.
    Le contenu de la colonne STANDARDIZED_FIELD est un champ XML avec la balise <record> comme racine. Sous cette balise, la structure définie par les normes des règles configurées dans le composant tStandardizeRow permet d'extraire chaque élément de l'adresse tel que vous pouvez le voir dans l'exemple ci-dessous.
  8. Dans le champ Loop XPath query, saisissez "/record/Address".
  9. Dans le tableau Mapping, dans le champ XPath query, saisissez "INT" pour la colonne number, "StreetName" pour la colonne street, "Zip" pour la colonne zip et "City" pour la colonne city.

Résultats

Vous pouvez maintenant exécuter votre Job.