Se connecter à un fichier - 6.1

Talend Data Management Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Data Management Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Avant de commencer à analyser des données dans un fichier délimité ou dans un fichier Excel, vous devez d'abord configurer la connexion à ce fichier.

Se connecter à un fichier délimité

Avant de pouvoir commencer à profiler des données dans un fichier délimité, vous devez d'abord configurer la connexion à ce fichier.

Prérequis : Vous devez avoir sélectionné la perspective Profiling dans le studio.

Pour créer une connexion à un fichier délimité, procédez comme suit :

  1. Dans la vue DQ Repository, développez le nœud Metadata.

  2. Cliquez-droit sur FileDelimited connections puis sélectionnez Create File Delimited Connection pour ouvrir l'assistant [New Delimited File].

  3. Suivez les procédures de l'assistant afin de créer une connexion à un fichier délimité.

    Vous pouvez ensuite créer une analyse de colonnes et déposer les colonnes que vous souhaitez analyser à partir de la métadonnée du fichier délimité dans la vue DQ Repository afin d'ouvrir l'éditeur d'analyse. Pour plus d'informations, consultez Analyser des colonnes dans un fichier délimité.

    Pour plus d'informations concernant la configuration d'une connexion à une base de données, consultez Se connecter à une base de données.

    Vous pouvez créer une connexion à un fichier délimité dans la perspective Integration ou dans la perspective Profiling. Une fois créée, cette connexion apparaîtra simultanément dans les deux perspectives.

    Vous pouvez exporter votre connexion en tant que contexte et la centraliser sous le nœud Context dans la perspective Integration de votre Studio. Cela vous permet de réutiliser le contexte dans les analyses de qualité de données utilisant la connexion courante. Vous pouvez également créer différents paramètres de contexte pour la même connexion et choisir d'exécuter une analyse dans un contexte spécifique. Pour plus d'informations, consultez Utilisation des variables de contexte pour se connecter aux sources de données.

Se connecter à un fichier Excel

Avant de pouvoir profiler des données dans un fichier Excel, vous devez créer votre source de données, puis configurer la connexion à cette source.

Prérequis : Vous avez sélectionné la perspective Profiling dans le studio.

Note

L'exemple ci-dessous utilise ODBC générique pour se connecter à la source de données. Dans le Studio, vous pouvez utiliser ODBC pour vous connecter au fichier Excel. Cependant, ODBC fonctionne uniquement avec Java 7.

Pour créer la source de données, procédez comme suit :

  1. Dans la barre des tâches, cliquez sur le bouton Démarrer et sélectionnez Panneau de configuration afin d'ouvrir la page correspondante.

  2. Double-cliquez sur Outils d'administration.

  3. Double-cliquez sur Sources de données (ODBC).

    Une boîte de dialogue s'affiche.

  4. Dans la vue Source de données utilisateur, cliquez sur Ajouter afin d'ouvrir une boîte de dialogue dans laquelle vous pouvez sélectionner le pilote ODBC, Microsoft Excel dans cet exemple, pour la source de données (base de données) à laquelle vous souhaitez vous connecter.

  5. Cliquez sur Terminer pour passer à l'étape de configuration de la source de données.

  6. Dans le champ Nom de la source de données, saisissez un nom pour la source de données, puis cliquez sur l'onglet Sélectionner un classeur... afin de passer à l'étape dans laquelle vous liez la source de données au fichier Excel que vous souhaitez profiler.

  7. Parcourez votre répertoire jusqu'au fichier Excel à lier à votre source de données.

    Note

    Pour pouvoir définir une connexion ODBC à la source de données sans problème, vérifiez que les fichiers Excel que vous souhaitez profiler sont dans un dossier, c'est-à-dire qu'ils ne sont pas à la racine de votre système.

  8. Sélectionnez le fichier Excel et cliquez sur OK pour fermer la boîte de dialogue [Sélectionner un classeur].

  9. Cliquez sur OK pour fermer la boîte de dialogue [Installation ODBC pour Microsoft Excel].

    La source de données créée est répertoriée dans la liste Source de données utilisateur.

  10. Cliquez sur OK pour fermer la boîte de dialogue.

Vous pouvez maintenant créer une analyse de colonnes et déposer les colonnes à analyser à partir de la métadonnée du fichier Excel dans la vue DQ Repository afin d'ouvrir l'éditeur d'analyse. Pour plus d'informations, consultez Analyser des colonnes dans un fichier Excel.

Pour plus d'informations concernant la configuration d'une connexion à une base de données, consultez Se connecter à une base de données.