Configurer le composant d'entrée - 7.1

Matching with machine learning

Version
7.1
Language
Français (France)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Talend Data Stewardship
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique

Procédure

  1. Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Basic settings.
    Les données d'entrée doivent contenir des enregistrements en doublon, sinon, le modèle généré ne donnera pas de résultat authentique lorsqu'il sera utilisé sur des paires suspectes.
  2. Cliquez sur [...] à côté du bouton Edit schema et utilisez le bouton [+] dans la boîte de dialogue pour ajouter des colonnes de type String : Original_Id, Source, Site_name et Address.
  3. Cliquez sur OK dans la boîte de dialogue et acceptez la propagation des modifications lorsqu'elle vous est proposée.
  4. Dans le champ Folder/File, configurez le chemin d'accès au fichier d'entrée.
  5. Configurez les séparateurs de lignes et de champs dans les champs correspondants, puis les en-têtes et pieds de page, s'il y en a.