Configurer le Job - 7.0

Matching with machine learning

EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
Talend Data Stewardship
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique

Procédure

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFileInputDelimited, un tMatchPredict et un tFileOutputDelimited.
  2. Reliez le composant tMatchPredict au tFileOutputDelimited à l'aide d'un lien Main.
  3. Reliez le composant tMatchPredict au tFileOutputDelimited à l'aide d'un lien Suspect duplicates.
  4. Vérifiez que vous avez défini la connexion au cluster Spark et activé le checkpoint dans la vue Run > Spark Configuration comme décrit dans Calculer des paires suspectes et un échantillon suspect à partir des données source.

Résultats