Configurer le Job - 7.0

Deduplication

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage

Procédure

  1. Configurez le premier sous-Job :
    1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFileInputDelimited, deux tFilterRow et un tFileOutputDelimited.

      Utilisez un lien Main pour relier les composants.

    2. Reliez le tFileInputDelimited au premier tFilterRow.
    3. Reliez le premier tFilterRow au tRuleSurvivorship.
    4. Reliez le tRuleSurvivorship au deuxième tFilterRow.
    5. Reliez le tFilterRow au tFileOutputDelimited.
  2. Configurez le deuxième sous-Job :
    1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : eux tFileInputDelimited, un tFilterColumns, un tUnite et un tFileOutputDelimited

      Utilisez un lien Main pour relier les composants.

    2. Reliez le premier tFileInputDelimited au tFilterColumn.
    3. Reliez le tFilterColumn au tUnite.
    4. Reliez le deuxième tFileInputDelimited au tUnite.
    5. Reliez le tUnite au tFileOutputDelimited.
  3. Reliez le tFileInputDelimited du premier sous-Job au tFileInputDelimited du deuxième sous-Job à l'aide d'un lien de type Trigger > OnSubjobOk.

Résultats