Configurer le Job - 7.0
Matching with machine learning
- EnrichVersion
- 7.0
- EnrichProdName
- Talend Big Data Platform
- Talend Data Fabric
- Talend Data Management Platform
- Talend Data Services Platform
- Talend MDM Platform
- Talend Real-Time Big Data Platform
- EnrichPlatform
- Studio Talend
- Talend Data Stewardship
- task
- Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
- Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
- Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Procédure
-
Déposez les composants suivants de la Palette dans l'espace de modélisation graphique
: un tFileInputDelimited, un tMatchPredict et un
tFileOutputDelimited.
-
Reliez le composant tMatchPredict au composant
tFileOutputDelimited à l'aide d'un lien Main.
-
Reliez le tMatchPredict au tLogRow à l'aide d'un lien Suspect duplicates.
-
Vérifiez que vous avez défini la connexion au cluster Spark
dans la vue Run > Spark Configuration comme décrit dans Sélectionner le mode Spark.