Procédure
-
Dans l'espace de modélisation graphique, sélectionnez le tDataprepRun et cliquez sur son onglet Componentafin de configurer ses paramètres simples.
-
Dans le champ URL, saisissez l'URL de l'application Web Talend Data Preparation ou Talend Cloud Data Preparation, entre guillemets doubles. Le port
9999
est le port par défaut pour Talend Data Preparation. -
Dans les champs Username et Password, saisissez vos informations de connexion à Talend Data Preparation ou Talend Cloud Data Preparation, entre guillemets doubles.
Si vous travaillez avec Talend Cloud Data Preparation et si :
- Si l'authentification multifacteur (MFA) est activée, saisissez un jeton d'accès dans le champ.
- Si l'authentification multifacteur (MFA) n'est pas activée mais que le SSO (Single Sign-On) est configuré, saisissez un jeton d'accès ou votre mot de passe dans le champ.
Il est recommandé d'utiliser des jetons, car les mots de passe seront bientôt obsolètes et ne seront plus utilisés.
- Si l'authentification multifacteur n'est pas activée et que le SSO n'est pas configuré, saisissez un jeton d'accès ou votre mot de passe dans le champ.
-
Cliquez sur Choose an existing preparation pour afficher une liste des préparations disponibles dans Talend Data Preparation, puis sélectionnez datapreprun_spark.
Ce scénario part du principe qu'une préparation avec un schéma compatible a été créée au préalable.
Un avertissement s'affiche près des préparations contenant des actions incompatibles, affectant uniquement une ligne ou une cellules.
-
Cliquez sur le bouton Fetch Schema afin de récupérer le schéma de la préparation.
Le schéma de sortie du tDataprepRun reflète à présent les modifications effectuées à chaque étape de la préparation. Le schéma prend en compte les colonnes ayant été ajoutées ou supprimées, par exemple. Par défaut, le schéma de sortie utilise le type
String
pour toutes les colonnes, pour ne pas écraser les opérations de formatage effectuées sur les dates ou les valeurs numériques au cours de la préparation.