Appliquer une préparation sur les données - Cloud - 8.0

Azure Data Lake Store

Version
Cloud
8.0
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Data Lake Store
Gouvernance de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Data Lake Store
Qualité et préparation de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Data Lake Store

Procédure

  1. Dans l'espace de modélisation graphique, sélectionnez le tDataprepRun et cliquez sur son onglet Component pour configurer ses paramètres simples.
  2. Dans le champ URL, saisissez l'URL de l'application Web Talend Data Preparation ou Talend Cloud Data Preparation, entre guillemets doubles. Le port 9999 est le port par défaut pour Talend Data Preparation.
  3. Dans les champs Username et Password, saisissez vos informations de connexion à Talend Data Preparation ou Talend Cloud Data Preparation, entre guillemets doubles.
    Si vous utilisez Talend Cloud Data Preparation et que :
    • Si le SSO est activé, saisissez un jeton d'accès dans le champ.
    • Si le SSO n'est pas activé, saisissez un jeton d'accès ou votre mot de passe dans le champ.
  4. Cliquez sur Choose an existing preparation pour afficher la liste des préparations disponibles dans Talend Data Preparation ou Talend Cloud Data Preparation et sélectionnez preparation_adlsgen2.

    Ce scénario part du principe qu'une préparation avec un schéma compatible a été créée au préalable.


  5. Cliquez sur Fetch Schema pour récupérer le schéma de la préparation, preparation_adlsgen2 dans ce scénario.

    Le schéma de sortie du tDataprepRun reflète à présent les modifications effectuées à chaque étape de la préparation. Le schéma prend en compte les colonnes ayant été ajoutées ou supprimées, par exemple. Par défaut, le schéma de sortie utilise le type String pour toutes les colonnes, afin de ne pas écraser toute opération de formatage effectuée sur les valeurs de dates ou numériques au cours de la préparation.