Procédure
- Configurez les paramètres du premier tFileInputDelimited dans sa vue Basic settings. Parcourez votre système jusqu'au fichier d'entrée à analyser.
- Définissez le schéma du composant. Dans cet exemple, le schéma d'entrée possède deux colonnes, firstname et gender.
-
Configurez le second tFileInputDelimited de la même façon.
Avertissement :
Assurez-vous que la colonne de référence a bien été définie comme colonne clé dans le schéma du flux de référence (lookup).
-
Double-cliquez sur le tFuzzyMatch pour ouvrir sa vue Basic settings et vérifiez son schéma.
Le Schema doit correspondre à celui du flux d'entrée principal (Main) afin que le flux principal soit comparé au flux de référence.Notez que deux colonnes : Value et Matching sont ajoutées au schéma de sortie. Elles correspondent à des informations standards de correspondance et sont en lecture seule.
- Sélectionnez la méthode à utiliser pour la vérification des données entrantes. Dans ce scénario, la correspondance à sélectionner dans le champ Matching type est de type Levenshtein.
-
Ensuite définissez la distance. Dans cette méthode, la distance est le nombre de caractères modifiés (insertion, suppression ou substitution) pour que l'entrée principale corresponde exactement à l'entrée de référence.
Dans ce scénario, configurez la distance à 0 au minimum et au maximum dans les champs Min. distance et Max. distance. Ce qui signifie que seule une correspondance exacte sera redirigée en flux de sortie.
- Décochez la case Case sensitive.
- Vérifiez que la colonne de correspondance et la colonne de référence sont bien sélectionnées.
- Laissez les autres paramètres par défaut.