Configurer les composants d'entrée - 7.0

Deduplication

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le premier tFileInputDelimited pour ouvrir sa vue Basic settings.

    Les données d'entrée doivent être les représentants uniques résultant du premier subjob de ce scénario.

  2. Cliquez sur le bouton [...] à côté du champ Edit schema et utilisez le bouton [+] dans la boîte de dialogue pour ajouter des colonnes.

    Le schéma d'entrée doit être identique à celui des représentants uniques générés dans le premier subjob.

  3. Cliquez sur OK dans la boîte de dialogue et acceptez la propagation des modifications lorsqu'elle vous est proposée.
  4. Dans le champ Folder/File, définissez le chemin d'accès aux fichiers d'entrée.
  5. Configurez les séparateurs de lignes et de champs dans les champs correspondants, puis les en-têtes et pieds de page, s'il y en a.
  6. Double-cliquez sur le deuxième tFileInputDelimited pour ouvrir sa vue Basic settings et définir ses propriétés.

    Les données d'entrée doivent être les enregistrements uniques calculés par le tMatchPairing.

    Le schéma d'entrée doit être identique à celui des représentants uniques résultant du premier subjob de ce scénario.