Procédure
-
Double-cliquez sur le tFileInputDelimited
pour ouvrir sa vue Basic settings dans l'onglet
Component.
Les données d'entrée à utiliser avec le tMatchPredict sont les paires suspectes générées par tMatchPairing, comme expliqué dans Calculer des paires suspectes et écrire un échantillon dans Talend Data Stewardship et Calcul de paires suspectes et d'un échantillon de paires suspectes à partir d'un jeu de données.
-
Cliquez sur le bouton [...] à côté de Edit
schema pour ouvrir une boîte de dialogue, puis ajoutez des
colonnes au schéma d'entrée : Original_Id,
Source, Site_name,
Address, PAIR_ID et
SCORE.
SCORE est une colonne de type Double. Les autres colonnes sont de type String.
- Cliquez sur le bouton [+] et ajoutez les colonnes du schéma comme indiqué dans l'image ci-dessus. Cliquez sur OK.
- Dans le champ Folder/File, configurez le chemin d'accès au fichier source.
- Configurez les séparateurs de lignes et de champs dans les champs correspondant, puis limitez l'en-tête à 1.