Centraliser les métadonnées d'un fichier LDIF - 7.0

Guide utilisateur de Talend Data Management Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Management Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Les fichiers LDIF sont des fichiers annuaires distincts par leurs attributs. Si vous devez souvent lire un fichier LDIF, vous pouvez centraliser les informations de connexion et les attributs de ce fichier dans le Repository afin de les réutiliser facilement. Ainsi, vous n'aurez pas à définir ces métadonnées manuellement pour chaque composant à chaque fois que vous souhaitez utiliser ce fichier.

Vous pouvez centraliser une connexion à un fichier LDIF depuis un fichier LDIF existant ou depuis les propriétés de ce fichier définies dans un Job.

Pour centraliser une connexion ainsi que le schéma d'un fichier LDIF, développez le nœud Metadata du Repository, cliquez-droit sur File ldif et sélectionnez Create file ldif depuis le menu contextuel afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour centraliser les paramètres de connexion à la base de données définis dans un Job, cliquez sur l'icône dans la vue Basic settings du composant de base de données correspondant. Sa propriété Property Type doit être Built-in afin d'ouvrir l'assistant de configuration de connexion à une base de données.

Suivez ensuite les étapes suivantes dans l'assistant :

Avertissement :

Pour plus d'informations, consultez le Guide d'installation Talend.

Procédure

  1. Afin d'identifier la métadonnées LDIF, renseignez les informations génériques, notamment Name, Purpose et Description
    Le champ Name est obligatoire et les informations que vous renseignez dans le champ Description apparaissent en tant qu'info-bulle lorsque vous placez le pointeur de votre souris sur la connexion.
  2. Si nécessaire, définissez la version et le statut de la connexion dans les champs Version et Status, respectivement. Vous pouvez également gérer la version et le statut d'un élément du Repository dans la boîte de dialogue Project Settings. Pour plus d'informations, consultez Gestion des versions et Gestion du statut respectivement.
  3. Si nécessaire, cliquez sur le bouton Select à côté du champ Path afin de sélectionner un dossier sous le nœud File ldif. Ce dossier contient la connexion au fichier juste créée.
    Cliquez sur Next pour passer aux paramètres du fichier.
  4. Cliquez sur le bouton Browse... afin de parcourir votre système vers le fichier ou saisissez son chemin dans le champ File.
    Passez cette étape si vous sauvegardez la connexion à un fichier LDIF définie dans un composant car son chemin est déjà défini dans le champ File.
  5. La zone File Viewer affiche les 50 premières lignes du fichier. Cliquez sur Next pour continuer.
  6. Dans la liste d'attributs du fichier chargé, sélectionnez les attributs que vous souhaitez utiliser et cliquez sur Refresh Preview afin d'obtenir un aperçu des attributs sélectionnés.
    Cliquez sur Next pour passer à la finalisation du schéma.
  7. Si besoin, personnalisez le schéma généré.
    • Renommer le schéma (par défaut metadata) et laisser un commentaire.

    • Ajouter, supprimer ou déplacer les colonnes du schéma, exporter le schéma dans un fichier XML ou remplacer le schéma en important une définition de schéma depuis un fichier XML à l'aide de la barre d'outils.
    Assurez-vous que le type de données dans la colonne Type est correctement défini.
    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).
    Les types de données Talend les plus utilisés sont les suivants :
    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées ‘Column<X>’ ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  8. Si le fichier LDIF sur lequel est basé le schéma a changé, cliquez sur le bouton Guess afin de générer à nouveau le schéma. Notez que, si vous avez personnalisé le schéma, la fonctionnalité Guess ne retient pas ces modifications.
  9. Cliquez sur Finish. Le nouveau schéma apparaît dans le Repository, sous le nœud File ldif correspondant.

Résultats

Vous pouvez à présent déposer la connexion au fichier, ou son schéma, depuis le Repository dans l'espace de modélisation graphique en tant que nouveau composant. Pour plus d'informations sur l'utilisation des métadonnées centralisées, consultez Comment utiliser les métadonnées centralisées dans un Job et Paramétrer un schéma du Repository dans un Job.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Edit file ldif afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour éditer un schéma de fichier existant, cliquez-droit sur le schéma dans le Repository et sélectionnez Edit Schema dans le menu contextuel.