Accéder au contenu principal

tStandardizeRow

Ce composant normalise les données d'entrée dans un flux de données XML ou JSON distinct, afin de séparer ou standardiser les données conformes à la règle des données non conformes.

Le tStandardizeRow segmente le flux de données reçu du composant précédent et applique des règles personnalisées pour analyser les données. En se fondant sur cette analyse, ce composant normalise et écrit les données analysées dans un flux de données séparé. Il ne modifie pas vos données brutes.

L'option de standardisation ajoute une colonne supplémentaire au flux de sortie dans laquelle les données sont standardisées après normalisation.

ANTLR est utilisé pour analyser et segmenter les données d'entrée. Pour plus d'informations concernant ANTLR, consultez le site

http://www.antlr.org/ (en anglais).

En mode local, les versions 1.6, 2.0, 2.3, 2.4 et 3.0 d'Apache Spark sont supportées.

Note InformationsRestriction : Ce composant a été amélioré dans le Studio à partir de la version 7.3. Si vos index ont été créés avec une version 7.2 ou antérieure, vous devez les mettre à jour. L'emplacement de la procédure de migration dépend de l'installation de votre Studio :
  • Avec l'installer : /addons/scripts/Lucene_Migration_Tool/README.md
  • Sans l'installer : Dans l'e-mail de licence, cliquez sur le lien dans Migration tool for Lucene Indexes from version 4 to version 8.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !