tAddCRCRow - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Fonction

Ce composant calcule une clé de substitution basée sur une ou plusieurs colonne(s) et l'ajoute au schéma défini.

Objectif

Fournir un ID unique afin d'améliorer la qualité des données traitées.

Propriétés du tAddCRCRow

Famille du composant

Data Quality

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Peut être Built-in ou Repository

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-in : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisable dans divers projets et Job designs. Voir également le Guide utilisateur du Studio Talend.

 

Implication

Cochez la case correspondant aux colonnes à définir comme clé de substitution et vérifier l'intégrité de leurs données.

Advanced settings

CRC type

Sélectionnez la longueur CRC. Plus le CRC est long, moins il y aura de risque d'erreur.

 

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de process du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est une étape intermédiaire. Il requiert un flux entrant et une sortie.

Limitation

Du fait d'une incompatibilité de licence, un ou plusieurs Jar requis pour utiliser ce composant ne sont pas fournis. Vous pouvez installer les Jar manquants pour ce composant en cliquant sur le bouton Install dans l'onglet Component. Vous pouvez également trouver les Jar manquants et les ajouter dans l'onglet Modules de la perspective Integration de votre studio. Pour plus d'informations, consultez l'article Installation de modules externes sur Talend Help Center (https://help.talend.com) ou la section décrivant comment configurer le studio, dans le Guide d'installation et de migration Talend.

Scénario : Ajouter une clé de substitution à un fichier

Ce scénario décrit un Job ajoutant une clé de substitution à un schéma de fichier délimité.

Construire le Job

  1. Glissez les composants suivants dans l'espace de modélisation : tFileInputDelimited, tAddCRCRow et tLogRow.

  2. Connectez-les en utilisant un lien de type Main row.

Configurer le composant d'entrée

  1. Dans la vue Component du tFileInputDelimited, renseignez le champ File Name en saisissant le chemin d'accès à votre fichier, ainsi que toutes les propriétés en rapport, au cas où elles ne soient pas stockées dans le Repository.

  2. Créez le schéma en cliquant sur le bouton Edit Schema, si le schéma n'est pas encore stocké dans le Repository. Vérifiez la colonne du type de données, et pour remplir le modèle de date (Date pattern), visitez http://docs.oracle.com/javase/6/docs/api/index.html (en anglais).

Configurer le composant tAddCRCRow

  1. Dans la vue Component du composant tAddCRCRow, sélectionnez les cases de la colonne du flux entrant à utiliser pour calculer le CRC.

  2. Notez qu'une colonne CRC (en lecture seule) a été ajoutée à la fin du schéma.

  3. Dans l'onglet Advanced settings, sélectionnez CRC32 comme CRC Type pour avoir une clé de substitution plus longue.

  4. Dans la vue Basic settings du tLogRow, sélectionnez l'option Table (print values in cells of a table) pour afficher les données de sortie sous forme de tableau dans la Console.

Exécuter le Job

Sauvegardez votre Job et appuyer sur F6 pour l'exécuter.

Une colonne CRC supplémentaire a été ajoutée au schéma, calculée d'après toutes les colonnes précédemment sélectionnées (dans ce cas toutes les colonnes du schéma).