Configurer la normalisation des lignes - 7.1

Standardization

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Pour ce faire, procédez comme suit :

Procédure

  1. Cliquez sur le tStandardizeRow pour ouvrir l'onglet Basic settings de sa vue Component.
  2. Dans le champ Column to parse, sélectionnez SKU_Description_Size_Weight. C'est l'unique colonne que contient le schéma d'entrée.
  3. Sous le tableau Conversion rules, cliquez sur le bouton [+] à huit reprises pour ajouter huit lignes à ce tableau.
  4. Pour remplir ces lignes, saisissez les règles déterminées lors de l'analyse des données brutes effectuée au début de ce scénario.
    Les deux règles Size sont exécutées par ordre descendant puisqu'elles font partie du même type de règle. Dans ce scénario, l'ordre des règles permet au composant de mettre d'abord en correspondance la règle Size composée de trois nombres puis celles de deux nombres. Si vous inversez cet ordre, le composant met en correspondance les deux premiers nombres avec la première règle Size (Length BY Length) et traite ensuite le dernier nombre de la chaîne est ignoré car il ne correspondant pas.
  5. Cliquez sur le bouton Generate parser code in routines afin de générer le code d'analyse syntaxique dans des routines.
  6. Dans la vue Advanced settings, laissez les options par défaut dans la zone Output format.
    Le paramètre Max edits for fuzzy match est configuré à 1 par défaut.