Configurer les composants - Cloud - 8.0

Rapprochement de données à l'aide des outils Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Last publication date
2024-02-07

Procédure

  1. Double-cliquez sur le composant tFileInputDelimited afin d'afficher sa vue Basic settings.
    Important : La fonctionnalité de schéma dynamique est supportée uniquement un mode Built-In et nécessite que le fichier d'entrée ait une ligne d'en-tête.
  2. Cliquez sur le bouton [...] près du champ File Name/Stream pour parcourir votre système jusqu'à votre fichier d'entrée.
  3. Définissez les lignes d'en-tête et de pied de page.
    Dans cet exemple, la première ligne du fichier d'entrée est la ligne d'en-tête.
  4. Cliquez sur Edit schema pour définir le schéma de ce composant.
    Dans cet exemple, le fichier d'entrée contient cinq colonnes : FirstName, LastName, HouseNo, Street et City. Toutefois, comme vous allez profiter de l'option de schéma dynamique, vous n'aurez à définir qu'une seule colonne, ici nommée Dyna.
    1. Ajoutez une nouvelle ligne en cliquant sur le bouton [+].
    2. Dans le champ Column, saisissez Dyna.
    3. Dans la liste Type, choisissez Dynamic.
    4. Cliquez sur OK.
  5. Double-cliquez sur le composant tExtractDynamicFields afin d'afficher sa vue Basic settings.
    Ce composant vous servira à séparer la colonne du schéma d'entrée en deux colonnes : une pour le prénom et l'autre pour les informations concernant la famille. Pour cela :
    1. Cliquez sur Edit schema pour ouvrir la boîte de dialogue Schema.
    2. Dans le panneau Output, sur la droite, cliquez sur le bouton [+] pour ajouter deux colonnes dans le schéma de sortie et appelez-les respectivement FirstName et FamilyInfo.
    3. Sélectionnez String dans la liste déroulante Type pour la colonne FirstName.
      Cela va extraire cette colonne du schéma d'entrée pour prendre en compte le nom de chaque personne sur la liste des noms.
    4. Sélectionnez Dynamic dans la liste déroulante Type pour la colonne FamilyInfo.
      Cette colonne s'occupe des autres informations de chaque personne présente sur la liste des noms : nom de famille, adresse, rue et ville identifieront une famille.
    5. Cliquez sur OK pour propager le schéma et fermer la boîte de dialogue Schema.
  6. Double-cliquez sur le composant tUniqRow afin d'afficher sa vue Basic settings.
  7. Dans la zone Unique key, cochez la case Key attribute pour la colonne FamilyInfo.
    Cela permet de dédoublonner les informations concernant la famille.
  8. Double-cliquez sur le composant tFileOutputDelimited afin d'afficher sa vue Basic settings.
  9. Définissez le chemin d'accès au fichier et cochez la case Include header.
  10. Laissez les autres paramètres tels qu'ils sont.
  11. Dans la vue Basic settings du composant tLogRow, sélectionnez l'option Table pour afficher les résultats d'exécution du Job sous forme de tableau.