Extraction de correspondances exactes à l'aide des règles d'Index - 7.3

Standardisation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Last publication date
2024-02-22

Ce composant est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Dans ce scénario, vous allez standardiser des descriptions longues de produits clients en mettant en correspondance le flux d'entrée et les données contenues dans un index. Ce scénario vous explique comment utiliser les règles d'Index afin de mettre en jetons les données produit, puis de vérifier chaque jeton par rapport à un index, afin d'extraire les correspondances exactes.

Pour ce scénario, vous devez d'abord créer un index en utilisant un Job contenant un composant tSynonymOutput. Vous devez créer des index pour la marque, la finition, la couleur et l'unité de mesure des produits clients. Utilisez le composant tSynonymOutput afin de générer les index et de les alimenter par des entrées et des synonymes. La capture d'écran suivante illustre le Job :

Ci-dessous se trouve un exemple d'index générés pour ce scénario :

Chaque index généré a des chaînes de caractères (séquences de mots) dans une colonne et leurs synonymes correspondants dans une autre colonne. Ces chaînes de caractères sont utilisées en tant que données de référence par rapport auxquelles les données produits, générées par le tFixedFlowInput, vont être mises en correspondance. Pour plus d'informations concernant la création d'index, consultez tSynonymOutput.

Dans ce scénario, les index générés sont définis comme variables de contexte. Pour plus d'informations concernant les variables de contexte, consultez le Guide d'utilisation du Studio Talend.