Configurer le processus de fusion - 7.1

Deduplication

Version
7.1
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage

Procédure

  1. Double-cliquez sur le tUnite pour ouvrir sa vue Basic settings.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour vérifier que le schéma de sortie correspond à celui des composants tFileInputDelimited en entrée.
  3. Double-cliquez sur le premier tFileOutputDelimited pour ouvrir sa vue Basic settings et définir ses propriétés.
    Vous avez déjà accepté la propagation du schéma aux composants de sortie lorsque vous avez configuré le composant d'entrée.
  4. Décochez la case Define a storage configuration component pour utiliser le système local comme votre système de fichiers cible.
  5. Dans le champ Folder, configurez le chemin d'accès au dossier où vous souhaitez générer les fichiers de sortie.
  6. Dans la liste Action sélectionnez l'opération d'écriture de données :
    • sélectionnez Create lorsque vous exécutez votre Job pour la première fois ;

    • sélectionnez Overwrite afin de remplacer les fichiers à chaque exécution du Job.

  7. Configurez les séparateurs de lignes et de champs dans les champs correspondants.
  8. Cochez la case Merge results to single file, puis dans le champ Merge file path configurez le chemin d'accès où le fichier du jeu de données nettoyées et dédoublonnées sera produit en sortie.