Définir un modèle de données pour la campagne - Cloud

Guide de prise en main de Talend Cloud Data Stewardship

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Stewardship
Content
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Dédoublonnage de données
Qualité et préparation de données > Gestion des tâches

Créez un modèle de données pour déterminer la structure des données à gérer dans la campagne Reconciling client data. Cette campagne permet aux data stewards de fusionner les données clients redondantes provenant des différents systèmes.

Data Stewardship permet de gérer des modèles de données, rendant possible la validation syntaxique et sémantique des données. Ainsi, une campagne s'appuie sur un modèle de données, pour s'assurer que les données correspondent à la structure et au format attendus.

Pourquoi et quand exécuter cette tâche

Définissez les attributs dans le modèle de données et sélectionnez leurs types parmi des types standards ou sémantiques prédéfinis.

Procédure

  1. Connectez-vous en tant que gestionnaire de campagne.
    Vous pouvez également créer des modèles de données si le rôle qui vous est assigné dans Talend Cloud Management Console a le droit d'ajouter et de gérer les modèles de données.
  2. Sélectionnez DATA MODELS > ADD DATA MODEL.
  3. Saisissez un nom et une description pour le nouveau modèle de données, dans les champs Name et Description respectivement. Les champs facultatifs ont (optional) à côté de leur nom.
  4. Dans la zone Attributes, définissez les colonnes à avoir dans le modèle de données, comme suit :
    1. Dans le champ IDENTIFIER, saisissez l'identifiant technique pour la première colonne.
    2. Saisissez un nom et une description pour la colonne dans les champs correspondants, si nécessaire.
      Ce que vous avez saisi dans le champ NAME est le nom affiché dans la liste des tâches. Si aucun nom n'est configuré, l'identifiant technique sera affiché.
    3. Dans la liste des types d'attributs, sélectionnez le type de la colonne.

      Les types standard et sémantiques sont intégrés dans l'application par défaut.

      • Pour les types standards, les champs supplémentaires s'affichent selon le type sélectionné. Ces champs sont facultatifs et vous permettent de définir certaines contraintes sur l'attribut, comme une longueur minimale et/ou maximale ou définir un modèle par rapport auquel valider l'attribut.

        Pour vous assurer que la valeur entière corresponde à votre modèle de validation, il est recommandé d'entourer le modèle de validation de ^ et de $.

        Quelques exemples :
        • [A-Z] correspond à A et ABC.
        • ^[A-Z]$ correspond à A mais ne correspond pas à ABC.

        Pour les colonnes Date et Timestamp, vous avez accès à un sélecteur de date et heure permettant de configurer la date et l'heure automatiquement dans le bon format.

      • Pour les types sémantiques, vous pouvez utiliser Talend Dictionary Service pour gérer les types sémantiques. Cependant, la disponibilité de ce service dépend de votre licence.
  5. Activez l'option DEFINE LIST OF VALUES pour afficher les champs dans lesquels vous pouvez configurer des valeurs spécifiques pour l'attribut.
    Les valeurs qui ne sont pas dans cette liste sont marquées comme invalides dans la liste des tâches.
  6. De manière facultative, activez l'option ALLOW EMPTY VALUES pour désactiver le chargement des champs vides. Cette option est activée par défaut.
  7. Cliquez sur ADD ATTRIBUTE et répétez les étapes ci-dessus pour créer toutes les colonnes nécessaires dans le modèle de données.
    Conseil : Dans l'onglet Rules (Règles), vous pouvez appliquer des règles de qualité de données. Une règle de qualité de données est un ensemble de prérequis métier vous permettant de détecter des anomalies dans les campagnes. Elle définit les valeurs que vos données doivent respecter. Une condition peut être ajoutée pour rendre la règle de qualité de données applicable à certaines données uniquement. Pour plus d'informations, consultez le Guide d'utilisation de Talend Cloud Data Stewardship.