Définir un modèle de données pour la campagne de regroupement - 7.0

Exemples de Talend Data Stewardship

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring > Gestion des utilisateurs
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
EnrichPlatform
Talend Data Stewardship

Dans cet exemple, vous créez un modèle de données pour déterminer la structure des données à gérer dans la campagne Site deduplication. Cette campagne permet aux arbitres de données de libeller des quasi doublons dans un échantillon de données extrait par un Job Talend.

Talend Cloud Data Stewardship permet de gérer des modèles de données, ce qui rend possible la validation syntaxique et sémantique des données. Vous pouvez définir les attributs dans le modèle de données et sélectionner leurs types parmi des types standard ou sémantique prédéfinis.

Procédure

  1. Dans la page d'accueil, cliquez sur DATA MODELS > ADD DATA MODEL.
  2. Saisissez un nom et une description pour le nouveau modèle de données.
  3. Dans la zone Attributes, définissez les colonnes à avoir dans le modèle de données, comme suit :
    1. Dans le champ IDENTIFIER, saisissez l'identifiant technique pour la première colonne.
    2. Saisissez un nom et une description pour la colonne dans les champs correspondants, si nécessaire.
      Ce que vous avez saisi dans le champ NAME est le nom affiché dans la liste des tâches. Si aucun nom n'est configuré, l'identifiant technique sera affiché.
    3. Dans la liste des types d'attributs, sélectionnez le type de la colonne.
      Les types standard et sémantiques sont intégrés dans Talend Cloud Data Stewardship par défaut.
      • Pour les types standard, des champs supplémentaires sont affichés ou masqués selon le type d'attribut sélectionné. Ces champs sont facultatifs et vous permettent de définir certaines contraintes sur l'attribut, comme une longueur minimale et/ou maximale ou définir un modèle par rapport auquel valider l'attribut.
      • Pour les types sémantiques, vous pouvez utiliser Talend Dictionary Service pour gérer les types sémantiques. Cependant, la disponibilité de ce service dépend de votre licence.
  4. Si nécessaire, cliquez sur l'option ALLOW EMPTY VALUES pour désactiver le chargement des champs vides dans Talend Cloud Data Stewardship. Cette option est activée par défaut.
  5. Cliquez sur ADD ATTRIBUTE dans le panneau de gauche et répétez les étapes ci-dessus pour créer toutes les colonnes nécessaires dans le modèle de données.

    Exemple

    Les colonnes définies pour la campagne Site deduplication utilisée dans cet exemple contiennent des informations concernant les centres d'éducation à Chicago.