Définir les propriétés des composants - 6.1

Talend Open Studio for Data Integration Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Data Integration
task
Création et développement
EnrichPlatform
Studio Talend

Les propriétés de chacun des composants formant un Job ou un sous-job permettent de paramétrer l'exécution technique du Job actif.

Les propriétés de chaque composant sont définies dans la vue Component, dans l'onglet Basic settings pour les propriétés de base et dans l'onglet Advanced settings pour les propriétés avancées. La vue Component regroupe aussi les vues View et Documentation qui contiennent des informations secondaires sur le composant sélectionné.

Pour plus d'informations concernant les composants présents dans la Palette, consultez le Guide de référence des Composants Talend Open Studio.

Onglet Basic settings

L'onglet Basic settings fait partie de la vue Component, qui est située en bas de la fenêtre de la perspective Integration du Studio Talend.

Les paramètres de base des composants sont différents en fonction de ces exigences fonctionnelles dans le Job. Pour une description détaillée des propriétés et de l'utilisation de chaque composant, consultez le Guide de référence des Composants Talend Open Studio.

Note

Certains composants sont paramétrés à l'aide de code ou de fonctions. Veillez à bien utiliser le code Java dans les propriétés en Java.

Pour les composants File (Fichier) et Database (Base de données), vous pouvez centraliser leurs propriétés dans les métadonnées stockées dans le dossier Metadata du Repository. Dans l'onglet Basic settings, vous pouvez paramétrer vous même les propriétés en sélectionnant l'option Built-In dans la liste déroulante Property Type ou vous pouvez utiliser les propriétés stockées dans le dossier Metadata du Repository en sélectionnant l'option Repository dans la liste déroulante Property Type. Cette dernière option vous permet de gagner du temps si vous utilisez souvent ces paramètres.

Sélectionnez Repository dans le champ Property type et désignez les métadonnées comportant les paramètres appropriés. Voir également : Gestion des métadonnées.

Vous avez aussi la possibilité de cliquer sur la métadonnée souhaitée sous le nœud Metadata de la vue Repository et de la glisser jusqu'à votre composant déjà présent dans l'espace de modélisation, ainsi ces propriétés seront renseignées automatiquement.

Si vous avez sélectionné le mode Built-in et que vous avez paramétré manuellement les propriétés de votre composant, vous avez encore la possibilité de sauvegarder ces propriétés sous forme de métadonnée dans le Repository. Pour cela :

  1. Cliquez sur l'icône de disquette. L'assistant de création de métadonnée correspondant à votre composant s'ouvre.

  2. Suivez les étapes de l'assistant. Pour plus d'informations sur la création de métadonnées, consultez Gestion des métadonnées.

  3. La métadonnée apparaît alors sous le nœud Metadata du Repository.

Pour tous les composants traitant des flux de données (la plupart des composants), vous pouvez définir un schéma Talend afin de décrire et sélectionner les données à traiter. Comme pour les propriétés, ce schéma peut être en local (Built-in ) ou stocké dans le Repository dans les métadonnées que vous avez créées. Vous trouverez une description détaillée d'un schéma dans la section suivante.

Paramétrer un schéma built-in

Un schéma est dit ponctuel, et donc défini comme built-in dans les paramètres de propriétés lorsqu'il ne sert généralement qu'une fois dans un Job.

Sélectionnez Built-in dans la liste, puis cliquez sur Edit Schema. Ensuite, créez votre schéma en y ajoutant des colonnes et en décrivant leur contenu selon la structure du fichier d'entrée.

Vous pouvez récupérer le schéma ponctuel d'un fichier d'entrée pour alimenter le schéma de sortie. Pour ce faire, cliquez sur le bouton Sync columns dans les propriétés du composant Output.

Avertissement

Lorsque vous créez une table de base de données, il est recommandé de spécifier une longueur dans le champ Length pour toutes les colonnes de type String, Integer ou Long et de renseigner le champ Precision pour les colonnes de type Double, Float ou BigDecimal dans le schéma du composant utilisé. Sinon, des erreurs inattendues peuvent survenir.

Note

Des informations supplémentaires sont nécessaires. Pour plus d'informations sur les formats de date par exemple, visitez le site : http://docs.oracle.com/javase/6/docs/api/index.html.

Paramétrer un schéma du Repository

Si vous utilisez fréquemment des connexions à des bases de données ou des fichiers spécifiques lorsque vous créez vos Jobs d'intégration de données, vous pouvez éviter d'avoir à définir toujours les mêmes propriétés en créant des fichiers de métadonnées que vous pouvez centraliser dans le répertoire Metadata du référentiel (Repository) de la perspective Integration.

Pour rappeler un fichier de métadonnées dans votre Job, sélectionnez Repository dans la liste déroulante Schema type et sélectionnez le fichier approprié dans la liste Repository. Ou bien, cliquez sur la métadonnée sous le nœud Metadata du Repository et glissez-la jusqu'au composant que vous avez préalablement déposé dans l'espace de modélisation. Puis cliquez sur Edit Schema pour vérifier que les données sont appropriées.

Vous pouvez apporter des modifications au schéma Repository que vous utilisez pour votre Job. Cependant, notez que le schéma devient alors ponctuel, ses propriétés changent automatiquement en built-in, il sera attaché au Job courant.

Vous pouvez également utiliser partiellement un schéma du référentiel. Pour plus d'informations, consultez Utiliser partiellement un schéma du Repository.

Note

Vous ne pouvez pas modifier le schéma stocké dans le référentiel à partir de cette fenêtre. Pour éditer ce schéma stocké, cliquez-droit sur le nœud Metadata et sélectionnez l'option d'édition correspondante (Edit connection ou Edit file) dans le menu contextuel.

Consultez également Gestion des métadonnées.

Utiliser partiellement un schéma du Repository

Lorsque vous utilisez un schéma du référentiel, si vous ne souhaitez pas utiliser toutes les colonnes prédéfinies, vous pouvez sélectionner des colonnes précises, sans modifier le schéma et le passer en mode Built-In.

La procédure suivante décrit l'utilisation partielle d'un schéma du référentiel pour un composant de base de données, d'entrée. Les étapes peuvent varier selon le composant que vous utilisez.

  1. Cliquez sur le bouton [...] à côté du champ Edit schema, dans l'onglet Basic settings. La boîte de dialogue [Edit parameter using repository] s'ouvre. Par défaut, l'option View schema est sélectionnée.

  2. Cliquez sur OK. La boîte de dialogue [Schema] s'ouvre et affiche toutes les colonnes du schéma. La case Used Column devant chaque colonne indique si la colonne est utilisée.

  3. Sélectionnez les colonnes à utiliser.

  4. Cliquez sur OK. Un message s'ouvre et vous demande de cliquer sur le bouton Guess Query.

    Note

    L'opération Guess Query est nécessaire uniquement pour les métadonnées de base de données.

  5. Cliquez sur OK pour fermer le message. La fenêtre [Propagate] apparaît. Cliquez sur Yes pour propager les modifications.

  6. Dans la zone Basic settings, cliquez sur Guess Query. Le nom des colonnes sélectionnées s'affiche dans la zone Query comme attendu.

Pour plus d'informations concernant la définition d'un schéma dans le référentiel, consultez Paramétrer un schéma du Repository.

Afficher un champ de manière dynamique (Ctrl+Espace)

Dans tous les champs de l'onglet Component, vous pouvez accéder à la liste des variables globales et de contexte et afficher de manière dynamique les valeurs contenues dans chaque champ à l'aide du raccourci clavier Ctrl+Barre d'espace.

  1. Placez le curseur de votre souris dans n'importe quel champ de l'onglet Component.

  2. Appuyez sur Ctrl+Barre d'espace pour accéder à la liste des variables.

  3. Sélectionnez les paramètres adéquats dans la liste. En plus de la liste des variables, un panneau d'information fournit des détails sur les paramètres sélectionnés.

Les paramètres affichés peuvent être : des messages d'erreur, le nombre de lignes traitées, etc. La liste varie en fonction des composants sélectionnés ou du contexte sur lequel vous travaillez.

Voir également : Utiliser les contextes et les variables.

Onglet Advanced settings

Certains composants, notamment les composants File et Database, offrent de nombreuses fonctions avancées.

Le contenu de l'onglet Advanced settings change en fonction du composant sélectionné.

Généralement, cet onglet regroupe les paramètres qui ne sont pas requis pour une utilisation de base ou habituelle du composant, mais ils sont requis pour les utilisations avancées.

Mesurer les flux de données

L'onglet Advanced settings propose aussi les fonctionnalités de statistiques avec l'option tStatCatcher. Si vous sélectionnez cette option, elle vous permet d'afficher les statistiques et les données de log sur le Job en cours sans avoir recours aux composants dédiés. Pour plus d'informations concernant les fonctionnalités Stats & Log, consultez Automatiser l'utilisation des statistiques & logs.

Onglet Dynamic settings

Les vues Basic et Advanced settings de tous les composants comportent divers cases à cocher et listes déroulantes permettant de paramétrer chaque composant. D'une manière générale, les valeurs de ces types de paramètres ne peuvent être éditées qu'au moment de la création.

L'onglet Dynamic settings, dans la vue Component, vous permet de personnaliser ces paramètres sous la forme de code ou de variable.

Cette fonctionnalité vous permet par exemple de configurer ces paramètres comme des variables qui deviendront donc dépendant des contextes, alors qu'ils ne sont pas censés être par défaut.

Un autre avantage de cette fonctionnalité réside dans le fait que vous êtes maintenant capable de changer les paramètres de contexte au moment de l'exécution, ce qui est très utile lorsque vous exportez votre Job script afin de le déployer sur un serveur d'exécution par exemple.