Configurer les composants de sortie pour écrire des paires suspectes, un échantillon suspect et des lignes uniques - 7.0

Matching with machine learning

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
EnrichPlatform
Studio Talend
Talend Data Stewardship

Procédure

  1. Double-cliquez sur le premier composant tFileOutputDelimited pour afficher sa vue Basic settings et configurer ses propriétés.
    Vous devez avoir accepté la propagation du schéma aux composants de sortie lors de la définition du composant d'entrée.
  2. Décochez la case Define a storage configuration component pour utiliser le système local comme système de fichiers cible.
  3. Dans le champ Folder, configurez le chemin d'accès au dossier qui contiendra les données de sortie.
  4. Dans la liste Action sélectionnez l'opération d'écriture de données :
    • sélectionnez Create lorsque vous exécutez votre Job pour la première fois ;
    • sélectionnez Overwrite afin de remplacer les fichiers à chaque exécution du Job.
  5. Configurez les séparateurs de lignes et de champs dans les champs correspondants.
  6. Cochez la case Merge results to single file et, dans le champ Merge file path, configurez le chemin vers l'emplacement où écrire le fichier des paires d'enregistrements suspects.
  7. Double-cliquez sur les autres tFileOutputDelimited pour afficher leur vue Basic settings et configurer les propriétés des composants.

    Par exemple, configurez le chemin d'accès à l'emplacement où écrire l'échantillon de données à C:/tmp/tmp/pairsSample et paramétrez l'emplacement où écrire le fichier contenant l'échantillon suspect à C:/tmp/pairing/SampleToLabel.csv.

    Par exemple, configurez le chemin d'accès à l'emplacement où écrire les lignes uniques à C:/tmp/tmp/uniqueRows et paramétrez l'emplacement où écrire le fichier contenant l'échantillon de paires suspectes à C:/tmp/pairing/uniqueRows.csv.