Centraliser les métadonnées d'un fichier LDIF - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06

Pourquoi et quand exécuter cette tâche

Les fichiers LDIF sont des répertoires de fichiers distincts par leurs attributs. Si vous devez souvent lire un fichier LDIF, vous pouvez centraliser les informations de connexion et les attributs de ce fichier dans le Repository afin de les réutiliser facilement. Ainsi, vous n'aurez pas à définir ces métadonnées manuellement pour chaque composant à chaque fois que vous souhaitez utiliser ce fichier.

Vous pouvez centraliser une connexion à un fichier LDIF depuis un fichier LDIF existant ou depuis les propriétés de ce fichier définies dans un Job.

Pour centraliser une connexion LDIF et son schéma depuis un fichier LDIF, développez le nœud Metadata de la vue Repository, cliquez-droit sur File ldif et sélectionnez Create file ldif depuis le menu contextuel afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour centraliser une connexion à un fichier et son schéma depuis un fichier défini dans un Job, cliquez sur l'icône dans la vue Basic settings du composant correspondant. Sa propriété Property Type doit être configurée à Built-in afin d'ouvrir l'assistant de configuration du fichier.

Suivez les étapes suivantes dans l'assistant :

Procédure

  1. Afin d'identifier les métadonnées du fichier LDIF, renseignez les informations génériques dans les champs correspondants notamment Name, Purpose et Description.
    Le champ Name est obligatoire et les informations que vous renseignez dans le champ Description s'affichent dans une infobulle lorsque vous placez votre souris sur la connexion au fichier.
  2. Si nécessaire, définissez la version et le statut de la connexion dans les champs Version et Status, respectivement. Vous pouvez également gérer la version et le statut d'un élément du référentiel dans la boîte de dialogue Project Settings. Pour plus d'informations, consultez Mettre à niveau la version des éléments de projets et Gestion du statut, respectivement.
  3. Si nécessaire, cliquez sur le bouton Select à côté du champ Path afin de sélectionner un dossier sous le nœud File ldif. Ce dossier contient la connexion au fichier juste créée.
    Cliquez sur Next pour passer aux paramètres du fichier.
  4. Spécifiez le chemin entier de votre fichier source dans le champ File, ou cliquez sur le bouton Browse... pour rechercher le fichier.
    Remarque : La notation de chemin Convention Universelle de Nommage (UNC) n'est pas supportée. Si votre fichier source est sur un hôte LAN, vous pouvez d'abord mapper le dossier du réseau dans un lecteur local.
    Passez cette étape si vous sauvegardez la connexion à un fichier LDIF définie dans un composant car son chemin est déjà défini dans le champ File.
  5. Vérifiez les 50 premières lignes du fichier dans la zone File Viewer puis cliquez sur Next pour continuer.
  6. Dans la liste d'attributs du fichier chargé, sélectionnez les attributs que vous souhaitez inclure dans le schéma du fichier puis cliquez sur Refresh Preview afin d'obtenir un aperçu des attributs sélectionnés.
    Cliquez sur Next pour passer à la finalisation du schéma.
  7. Si besoin, personnalisez le schéma généré :
    • Renommez le schéma (par défaut metadata) et laissez un commentaire.

    • Ajoutez, supprimez ou déplacez les colonnes du schéma, exportez le schéma dans un fichier XML ou remplacez le schéma en important une définition de schéma depuis un fichier XML à l'aide de la barre d'outils.
    Assurez-vous que le type de données dans la colonne Type est correctement défini.
    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).
    Les types de données Talend les plus utilisés sont les suivants :
    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées ‘Column<X>’ ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  8. Si le fichier LDIF sur lequel est basé le schéma a changé, cliquez sur le bouton Guess afin de générer à nouveau le schéma. Notez que, si vous avez personnalisé le schéma, la fonctionnalité Guess ne retient pas ces modifications.
  9. Cliquez sur Finish (Terminer). Le nouveau schéma apparaît sous le nœud de connexion au fichier LDIF correspondant dans la vue Repository.

Résultats

Vous pouvez à présent déposer la connexion au fichier, ou son schéma, depuis le Repository dans l'espace de modélisation graphique en tant que nouveau composant. Pour plus d'informations concernant l'utilisation des métadonnées centralisées, consultez Comment utiliser les métadonnées centralisées dans un Job et Paramétrer un schéma du Repository dans un Job.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Edit file ldif afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour modifier un schéma de fichier existant, cliquez-droit sur le schéma dans la vue Repository et sélectionnez Edit Schema dans le menu contextuel.