tStandardizeRow

Ce composant normalise les données d'entrée dans un flux de données XML ou JSON distinct, afin de séparer ou standardiser les données conformes à la règle des données non conformes.

Le tStandardizeRow segmente le flux de données reçu du composant précédent et applique des règles personnalisées pour analyser les données. En se fondant sur cette analyse, ce composant normalise et écrit les données analysées dans un flux de données séparé. Il ne modifie pas vos données brutes.

L'option de standardisation ajoute une colonne supplémentaire au flux de sortie dans laquelle les données sont standardisées après normalisation.

ANTLR est utilisé pour analyser et segmenter les données d'entrée. Pour plus d'informations concernant ANTLR, consultez le site

http://www.antlr.org/ (en anglais).

En mode local, les versions 1.6, 2.0, 2.3, 2.4 et 3.0 d'Apache Spark sont supportées.

Restriction : Ce composant a été amélioré dans le Studio à partir de la version 7.3. Si vos index ont été créés avec une version 7.2 ou antérieure, vous devez les mettre à jour. L'emplacement de la procédure de migration dépend de l'installation de votre Studio :

Avec l'installer : /addons/scripts/Lucene_Migration_Tool/README.md
Sans l'installer : Dans l'e-mail de licence, cliquez sur le lien dans Migration tool for Lucene Indexes from version 4 to version 8.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :

Standard : consultez Propriétés du tStandardizeRow Standard.

Le composant de ce framework est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform et dans Talend Data Fabric.
MapReduce : consultez Propriétés du tStandardizeRow MapReduce (déprécié).

Le composant de ce framework est disponible dans tous les produits Talend Platform avec Big Data et dans Talend Data Fabric.
Spark Batch : consultez Propriétés du tStandardizeRow pour Apache Spark Batch.

Le composant de ce framework est disponible dans tous les produits Talend Platform avec Big Data et dans Talend Data Fabric.
Spark Streaming : consultez Propriétés du tStandardizeRow pour Apache Spark Streaming.

Ce composant est disponible dans Talend Real Time Big Data Platform et dans Talend Data Fabric.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici

tStandardizeRow

Dans cette section

Cette page vous a-t-elle aidé ?