Accéder au contenu principal Passer au contenu complémentaire

Configurer le Job

Procédure

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFileInputDelimited, un tMatchPredict et un tFileOutputDelimited.
  2. Reliez le composant tMatchPredict au tFileOutputDelimited à l'aide d'un lien Main.
  3. Reliez le composant tMatchPredict au tFileOutputDelimited à l'aide d'un lien Suspect duplicates.
  4. Vérifiez que vous avez défini la connexion au cluster Spark et activé les points de validation dans la vue Run > Spark Configuration comme décrit dans Calcul de paires suspectes et d'un échantillon suspect à partir de données source.

Résultats

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !