Centraliser les métadonnées d'un fichier LDIF - 6.5

Talend Real-Time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement
Qualité et préparation de données

Les fichiers LDIF sont des répertoires de fichiers distincts par leurs attributs. Si vous devez souvent lire un fichier LDIF, vous pouvez centraliser les informations de connexion et les attributs de ce fichier dans le Repository afin de les réutiliser facilement. Ainsi, vous n'aurez pas à définir ces métadonnées manuellement pour chaque composant à chaque fois que vous souhaitez utiliser ce fichier.

Vous pouvez centraliser une connexion à un fichier LDIF depuis un fichier LDIF existant ou depuis les propriétés de ce fichier définies dans un Job.

Pour centraliser une connexion LDIF et son schéma depuis un fichier LDIF, développez le nœud Metadata de la vue Repository, cliquez-droit sur File ldif et sélectionnez Create file ldif depuis le menu contextuel afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour centraliser un schéma ainsi qu'une connexion à un fichier que vous avez définis dans un Job, cliquez sur l'icône dans la vue Basic settings du composant correspondant afin d'ouvrir l'assistant de configuration des métadonnées du fichier. Notez que Built-in doit être sélectionné dans la liste Property Type.

Suivez les étapes suivantes dans l'assistant :

Avertissement

Assurez-vous d'avoir installé les modules tiers requis, comme indiqué dans le Guide d'installation Talend.

  1. Afin d'identifier les métadonnées du fichier LDIF, renseignez les informations génériques dans les champs correspondants notamment Name, Purpose et Description.

    Le champ Name est obligatoire et les informations que vous renseignez dans le champ Description s'affichent dans une infobulle lorsque vous placez votre souris sur la connexion au fichier.

  2. Si nécessaire, définissez la version et le statut de la connexion dans les champs Version et Status, respectivement. Vous pouvez également gérer la version et le statut d'un élément du référentiel dans la boîte de dialogue Project Settings. Pour plus d'informations, consultez Gestion des versions et Gestion du statut, respectivement.

  3. Si nécessaire, cliquez sur le bouton Select à côté du champ Path pour sélectionner un dossier sous le nœud File ldif afin de maintenir votre connexion au fichier.

    Cliquez sur Next pour passer aux paramètres du fichier.

  4. Spécifiez le chemin entier de votre fichier source dans le champ File, ou cliquez sur le bouton Browse... pour rechercher le fichier.

    Note

    La notation de chemin Convention Universelle de Nommage (UNC) n'est pas supportée. Si votre fichier source est sur un hôte LAN, vous pouvez d'abord mapper le dossier du réseau dans un lecteur local.

    Passez cette étape si vous sauvegardez la connexion à un fichier LDIF définie dans un composant car son chemin est déjà défini dans le champ File.

  5. Vérifiez les 50 premières lignes du fichier dans la zone File Viewer puis cliquez sur Next pour continuer.

  6. Dans la liste d'attributs du fichier chargé, sélectionnez les attributs que vous souhaitez inclure dans le schéma du fichier puis cliquez sur Refresh Preview afin d'obtenir un aperçu des attributs sélectionnés.

    Cliquez sur Next pour passer à la finalisation du schéma.

  7. Si besoin, personnalisez le schéma généré :

    • Renommez le schéma (par défaut metadata) et laissez un commentaire.

    • Ajoutez, supprimez ou déplacez les colonnes du schéma, exportez le schéma dans un fichier XML ou remplacez le schéma en important une définition de schéma depuis un fichier XML à l'aide de la barre d'outils.

    Assurez-vous que le type de données dans la colonne Type est correctement défini.

    Pour plus d'informations concernant les types de données Java, y compris le modèle de date, consultez Java API Specification (en anglais).

    Les types de données Talend les plus utilisés sont les suivants :

    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définie à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées 'Column<X>' ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML complet sans tenir compte de son contenu.

  8. Si le fichier LDIF sur lequel est basé le schéma a changé, cliquez sur le bouton Guess afin de générer à nouveau le schéma. Notez que, si vous avez personnalisé le schéma, la fonctionnalité Guess ne retient pas ces modifications.

  9. Cliquez sur Finish. Le nouveau schéma apparaît sous le nœud de connexion au fichier LDIF correspondant dans la vue Repository.

Vous pouvez à présent déposer la connexion au fichier, ou son schéma, depuis la vue Repository dans l'espace de modélisation graphique en tant que nouveau composant ou dans un composant existant pour réutiliser les métadonnées. Pour plus d'informations concernant l'utilisation des métadonnées centralisées, consultez Utiliser les métadonnées centralisées dans un Job et Paramétrer un schéma du Repository dans un Job.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans la vue Repository et sélectionnez Edit file ldif afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion de fichier existante, cliquez-droit sur la connexion dans la vue Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour éditer un schéma de fichier existant, cliquez-droit sur le schéma dans la vue Repository et sélectionnez Edit Schema dans le menu contextuel.