tStandardizeRow
Ce composant normalise les données d'entrée dans un flux de données XML ou JSON distinct, afin de séparer ou standardiser les données conformes à la règle des données non conformes.
Le tStandardizeRow segmente le flux de données reçu du composant précédent et applique des règles personnalisées pour analyser les données. En se fondant sur cette analyse, ce composant normalise et écrit les données analysées dans un flux de données séparé. Il ne modifie pas vos données brutes.
L'option de standardisation ajoute une colonne supplémentaire au flux de sortie dans laquelle les données sont standardisées après normalisation.
ANTLR est utilisé pour analyser et segmenter les données d'entrée. Pour plus d'informations concernant ANTLR, consultez le site
http://www.antlr.org/ (en anglais).
En mode local, les versions 1.6, 2.0, 2.3, 2.4 et 3.0 d'Apache Spark sont supportées.
- Avec l'installer : /addons/scripts/Lucene_Migration_Tool/README.md
- Sans l'installer : Dans l'e-mail de licence, cliquez sur le lien dans Migration tool for Lucene Indexes from version 4 to version 8.
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :
-
Standard : consultez Propriétés du tStandardizeRow Standard.
Le composant de ce framework est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform et dans Talend Data Fabric.
-
MapReduce : consultez Propriétés du tStandardizeRow MapReduce (déprécié).
Le composant de ce framework est disponible dans tous les produits Talend Platform avec Big Data et dans Talend Data Fabric.
-
Spark Batch : consultez Propriétés du tStandardizeRow pour Apache Spark Batch.
Le composant de ce framework est disponible dans tous les produits Talend Platform avec Big Data et dans Talend Data Fabric.
-
Spark Streaming : consultez Propriétés du tStandardizeRow pour Apache Spark Streaming.
Ce composant est disponible dans Talend Real Time Big Data Platform et dans Talend Data Fabric.