Propriétés du tFileOutputARFF Standard - Cloud - 8.0

ARFF

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants ARFF
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants ARFF
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants ARFF
Last publication date
2024-02-21

Ces propriétés sont utilisées pour configurer le tFileOutputARFF s'exécutant dans le framework de Jobs Standard.

Le composant tFileOutputARFF Standard appartient à la famille Fichier.

Le composant de ce framework est disponible dans tous les produits Talend.

Basic settings

Property type

Peut être Built-in ou Repository.

 

Built-In : propriétés utilisées ponctuellement sans stockage dans le référentiel.

 

Repository : Sélectionnez le fichier de propriétés du composant. Les champs suivants sont alors remplis automatiquement à l'aide des données collectées.

Cliquez sur cette icône pour ouvrir l'assistant connexion de base de données et enregistrer les paramètres de connexion que vous avez définis dans la vue Basic settings du composant.

Pour plus d'informations concernant la configuration et le stockage des paramètres de connexion à un fichier, consultez Configurer les paramètres de connexion.

Nom de fichier

Chemin d'accès et nom du fichier de sortie et/ou variable à utiliser.

Pour plus d'informations concernant la définition et l'utilisation d'une variable dans un Job, consultez Utiliser les contextes et les variables.

Avertissement : Utilisez un chemin absolu (au lieu d'un chemin relatif) dans ce champ pour éviter des erreurs.

Attribute Define

Reflète le schéma tel qu'il est défini dans la boîte de dialogue Edit schema.

Column : nom de la colonne.

Type : type des données de la colonne.

Pattern : saisissez le modèle (pattern) de la donnée si nécessaire.

Relation

Saisissez le nom de la relation.

Append

Cochez cette option pour ajouter de nouvelles lignes à la fin du fichier.

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champ qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

 

Built-in : le schéma est créé et stocké localement pour ce composant seulement. Pour plus d'informations concernant les schémas des composants dans l'onglet Basic settings (Paramètres simples), consultez Onglet Basic settings.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs designs. Pour plus d'informations concernant les schémas des composants dans l'onglet Basic settings (Paramètres simples), consultez Onglet Basic settings.

Create directory if not exists

Cette case est cochée par défaut. Cette option permet de créer le dossier contenant le fichier de sortie s'il n'existe pas déjà.

Advanced settings

Don't generate empty file

Cochez cette case si vous ne souhaitez pas générer de fichier vide.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job au niveau du Job ainsi qu'au niveau de chaque composant.

Variables globales

Variables globales

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables.

Utilisation

Règle d'utilisation

Utilisez ce composant pour écrire dans un fichier ARFF des données récupérées d'autres composants à l'aide d'une connexion de type Row.

Dynamic settings

Cliquez sur le bouton [+] pour ajouter une ligne à la table. Dans le champ Code, saisissez une variable de contexte afin de sélectionner dynamiquement votre connexion SCP parmi celles prévues dans votre Job. Cette fonctionnalité est utile si vous devez accéder à des fichiers dans différents systèmes HDFS ou dans différentes distributions, en particulier lorsque vous travaillez dans un environnement dans lequel vous ne pouvez pas changer les paramètres de votre Job, par exemple lorsque votre Job doit être déployé et exécuté dans un Studio Talend indépendant.

La table Dynamic settings est disponible uniquement lorsque la case Use an existing connection est cochée dans la vue Basic settings. Lorsqu'un paramètre dynamique est configuré, la liste Component List de la vue Basic settings devient inutilisable.

Pour des exemples d'utilisation de paramètres dynamiques, consultez Lire des données dans des bases de données MySQL à l'aide de connexions dynamiques basées sur les variables de contexte et Lire des données à partir de différentes bases de données MySQL à l'aide de paramètres de connexion chargés dynamiquement. Pour plus d'informations concernant les Paramètres dynamiques et les variables de contexte, consultez Schéma dynamique et Créer un groupe de contextes et définir les variables de contexte.

Connections

Liens de sortie (de ce composant à un autre) :

Row : Main.

Trigger : OnSubjobOk, OnSubjobError, Run if.

Liens d'entrée (d'un autre composant à celui-ci) :

Row : Main; Reject; Iterate.

Trigger : On Subjob Ok; On Subjob Error; Run if; On Component Ok; On Component Error; Synchronize; Parallelize.

Pour plus d'informations concernant les connexions, consultez Utilisation des connexions dans un Job.

Limitation

Du fait d'une incompatibilité de licence, un ou plusieurs Jar requis pour utiliser ce composant ne sont pas fournis. Vous pouvez installer les Jar manquants pour ce composant en cliquant sur le bouton Install dans l'onglet Component. Vous pouvez également trouver les JAR manquants et les ajouter dans l'onglet Modules de la perspective Integration de votre Studio Talend. Pour plus d'informations, consultez la page Installation de modules externes.