Configurer les enregistrements d'entrée - 7.0

Deduplication

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tFixedFlowInput pour ouvrir sa vue Component.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur de schéma.
  3. Cliquez cinq fois sur le bouton [+] pour ajouter cinq lignes.
    Renommez respectivement ces lignes : Record_ID, File, Acctname, GRP_ID et GRP_SIZE.
    Les données d'entrée contiennent des informations concernant un ID de groupe, ainsi que la taille du groupe. Dans un scénario réel, ces informations peuvent être rassemblées par le composant tMatchGroup comme dans le scénario 1. Le tMatchGroup regroupe les doublons des données d'entrée et donne à chaque groupe un ID et une taille. Ces deux colonnes sont requises par le tRuleSurvivorship.
  4. Dans la colonne Type, sélectionnez les types de données pour les colonnes. Dans cet exemple, configurez le type à Integer pour Record_ID et GRP_SIZE et configurez à String pour les autres colonnes.
    Remarque :

    Assurez-vous de configurer le bon type de date afin de pouvoir définir les règles de validation sans message d'erreur.

  5. Cliquez sur OK pour valider ces modifications et accepter la propagation lorsque celle-ci est proposée par la boîte de dialogue.
  6. Dans la zone Mode de la vue Basic settings, sélectionnez Use Inline Content (delimited file).
  7. Dans le champ Content, saisissez les données d'entrée à traiter.
    Ces données doivent correspondre au schéma défini. Dans cet exemple, les données d'entrée se présentent comme suit :
    1;2;AcmeFromFile2;1;2
    2;1;AcmeFromFile1;1;0
    3;1;AAA;2;1
    4;2;BBB;3;1
    5;1;  ;4;2
    6;2;NotNull;4;0
  8. Dans les champs Row Separator et Field Separator, saisissez respectivement le séparateur de lignes et le séparateur de champs.