Configurer les composants - 7.1

Validation

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de validation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de validation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de validation
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tFileInputDelimited afin d'afficher sa vue Basic settings. Configurez ses propriétés, notamment le nom du fichier d'entrée et le nombre de lignes d'en-tête à ignorer.
  2. Cliquez sur le bouton [...] à côté du champ Edit Schema pour décrire la structure de données de ce fichier d'entrée. Dans ce scénario, le schéma est composé de cinq colonnes : ID, Name, BirthDate, State et City.
  3. Renseignez le champ Length des colonnes Name, State et City : respectivement 7, 10 et 10. Cliquez sur OK pour propager les changements et fermer la boîte de dialogue Schema.
  4. Double-cliquez sur le composant tSchemaComplianceCheck pour afficher sa vue Basic settings et configurer les paramètres de validation.
  5. Cochez l'option Custom defined dans la zone Mode pour effectuer des validations personnalisées.
    Dans cet exemple, le tableau Checked columns permet de configurer les paramètres de validations. Cependant, vous pouvez aussi cocher la case Check all columns from schema si vous souhaitez vérifier tous les paramètres de toutes les colonnes (type, valeurs nulles et longueur), en fonction du schéma de base défini, ou encore cocher l'option Use another schema for compliance check et définir le schéma de la structure des données souhaité.
  6. Dans le tableau Checked Columns, définissez les vérifications à effectuer. Pour ce scénario :
    - Le type de la colonne ID doit être Int.
    - La longueur des colonnes Name, State and City doit être vérifiée.
    - Le type de la colonne BirthDate doit être Date et le modèle de date attentu est dd-MM-yyyy.
    - Toutes les colonnes doivent être cochées pour les valeurs null, vous devez donc décocher la case Nullable de toutes les colonnes.
    Remarque :

    Pour rejeter les champs dont les données sont supérieures à la longueur maximum définie, assurez-vous que la case Trim the excess content of column when length checking chosen and the length is greater than defined length est décochée.

  7. Dans la vue Advanced settings du composant tSchemaComplianceCheck, cochez la case Treat all empty string as NULL afin de rejeter toutes les lignes contenant des champs vides.
  8. Pour visualiser le résultat du processus de validation sous forme de tableau dans la console Run, double-cliquez sur chaque composant tLogRow et cochez la case Table dans leur vue Basic settings.