Configurer la normalisation des lignes - 7.3

Standardisation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Last publication date
2024-02-22

Pourquoi et quand exécuter cette tâche

Pour ce faire, procédez comme suit :

Procédure

  1. Cliquez sur le tStandardizeRow pour ouvrir sa vue Component.
  2. Dans le champ Column to parse, sélectionnez SKU_Description_Size_Weight. C'est l'unique colonne que contient le schéma d'entrée.
  3. Sous le tableau Conversion rules, cliquez sur le bouton [+] à huit reprises pour ajouter huit lignes à ce tableau.
  4. Pour remplir ces lignes, saisissez les règles déterminées lors de l'analyse des données brutes effectuée au début de ce scénario.
    Les deux règles Size sont exécutées par ordre décroissant. Dans ce scénario, l'ordre des règles permet au composant de mettre d'abord en correspondance la règle Size composée de trois nombres puis celles de deux nombres. Si vous inversez cet ordre, le composant met en correspondance les deux premiers nombres avec la première règle Size (Length BY Length) et traite ensuite le dernier nombre de la chaîne est ignoré car il ne correspondant pas.
  5. Cliquez sur le bouton Generate parser code in routines.
  6. Dans la vue Advanced settings, laissez les options par défaut dans la zone Output format.
    Le paramètre Max edits for fuzzy match est configuré à 1 par défaut.