Indexer des données nettoyées et dédoublonnées dans Elasticsearch
Avant de commencer
-
Le cluster Elasticsearch et le front-end Elasticsearch-head doivent être lancés avant l'exécution du Job.
Pour plus d'informations sur Elasticsearch-head, qui est un plug-in utilisé pour parcourir un cluster Elasticsearch, consultez https://mobz.github.io/elasticsearch-head/ (uniquement en anglais) (en anglais).
Procédure
Résultats
Le tMatchIndex a créé l'index education-agencies-chicago dans Elasticsearch, l'a alimenté avec les données nettoyées et a calculé les meilleurs suffixes basés sur les valeurs des clés de bloc.
Vous pouvez utiliser le plug-in Elasticsearch-head afin de parcourir l'index créé par le tMatchIndex.
![](/fr-FR/data-matching/7.3/Content/Resources/images/use_case_tmatchindex4.png)
![](/fr-FR/data-matching/7.3/Content/Resources/images/use_case_tmatchindex5.png)
Vous pouvez maintenant utiliser les données indexées en tant que jeu de données de référence avec le composant tMatchIndexPredict.
Pour un exemple de rapprochement continu, consultez Rapprochement continu à l'aide du tMatchIndexPredict (uniquement en anglais).
Vous trouverez un exemple de rapprochement continu à l'aide du tMatchIndexPredict sur Talend Help Center (https://help.talend.com (uniquement en anglais)).
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !