Configurer le composant tMatchIndexPredict - 6.5

Continuous matching

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
EnrichPlatform
Studio Talend
Talend Data Stewardship
Le tMatchIndexPredict utilise le modèle de rapprochement généré par le tMatchModel afin de calculer les doublons suspects et les enregistrements uniques. Le tMatchIndexPredict utilise également le modèle permettant d'appairer les données généré par le tMatchPairing afin de libeller les enregistrements uniques.

Procédure

  1. Double-cliquez sur le tMatchIndexPredict pour afficher sa vue Basic settings.
  2. Dans la zone ElasticSearch configuration, saisissez l'emplacement du cluster hébergeant le système Elasticsearch à utiliser dans le champ Nodes, par exemple :

    "localhost:9200"

  3. Dans la zone ElasticSearch configuration, saisissez le nom de l'index Elasticsearch où les données de références sont stockées, dans le champ Index, par exemple :

    "education-agencies-chicago"

  4. Dans la zone Models, saisissez les données relatives au modèle permettant de constituer des paires d'enregistrements et au modèle de rapprochement :
    1. Saisissez le chemin d'accès au dossier contenant les fichiers de modèles générés par le tMatchPairing dans le champ Pairing model folder.
    2. Sélectionnez dans la liste Matching model location l'emplacement du fichier modèle généré par le tMatchModel.

      Dans cet exemple, sélectionnez from file system car le Job de classification avec le composant tMatchModel n'est pas intégré au Job actuel.

    3. Saisissez le chemin d'accès au dossier contenant les fichiers de modèles générés par le tMatchModel dans le champ Matching model folder.
    4. Saisissez le libellé utilisé pour les enregistrements uniques écrits en sortie dans le champ No-match label.