Filtrer et agréger les données d'entrée - Cloud - 8.0

CombinedSQL

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants ELT > Composants CombinedSQL
Gouvernance de données > Systèmes tiers > Composants ELT > Composants CombinedSQL
Qualité et préparation de données > Systèmes tiers > Composants ELT > Composants CombinedSQL
Last publication date
2024-02-21

Procédure

  1. Dans l'espace de modélisation graphique, double-cliquez sur le composant tCombinedSQLFilter afin d'afficher sa vue Component et définir ses propriétés.
  2. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent, ou configurez manuellement le schéma en sélectionnant Built-in dans la liste Schema et en cliquant sur le bouton [...] à côté du champ Edit schema.
    Lorsque vous définissez la structure des données du composant tCombinedSQLFilter, le nom des colonnes s'affichent automatiquement dans la liste Input column dans la table Conditions.
    Dans ce scénario, le composant tCombinedSQLFilter instancie quatre colonnes : id, state, date_of_birth et salary.
  3. Dans la table Conditions, configurez les paramètres d'entrée, les opérateurs et les valeurs attendues pour extraire uniquement les enregistrements correspondant aux critères spécifiés.
    Cliquez deux fois sur le bouton [+] sous la table Conditions et dans Input column, sélectionnez state et date_of_birth dans la liste déroulante.
    Dans ce scénario, le composant tCombinedSQLFilter filtre les colonnes state et date_of_birth dans la table source afin d'extraire uniquement les employés nés après le 19 octobre 1960, habitant dans les États UtahOhio et Iowa.
  4. Pour la colonne state, choisissez l'opérateur IN depuis la liste déroulante, puis saisissez ('Utah','Ohia','Iowa') en tant que valeur.
  5. Pour la colonne date_of_birth, choisissez l'opérateur > depuis la liste déroulante, puis saisissez ('1960-10-19') en tant que valeur.
  6. Sélectionnez And dans la liste Logical operator between conditions afin d'appliquer les deux conditions à la fois. Vous pouvez également personnaliser les conditions en cochant la case Use custom SQL et en modifiant les conditions dans le champ de texte.
  7. Dans l'espace de modélisation graphique, double-cliquez sur le composant tCombinedSQLAggregate afin d'afficher sa vue Component et définir ses propriétés de base.
  8. Cliquez sur le bouton [...] à côté du champ Edit schema pour définir la structure suivante : .
    Le composant tCombinedSQLAggregate instancie quatre colonnes : id, state, date_of_birth et salary, provenant du composant précédent.
  9. Le tableau Group by vous permet de définir les ensembles de données à traiter à partir d'une colonne définie. Dans cet exemple : State.
    Dans le tableau Group by, cliquez sur le bouton [+] pour ajouter une ligne.
  10. Dans la liste déroulante Output column, sélectionnez State. Cette colonne sera utilisée pour stocker les données filtrées de la colonne State.
  11. Le tableau Operations vous permet de configurer le type d'agrégation à effectuer. La liste disponible dans la colonne Output column dépend du schéma que vous souhaitez écrire en sortie (via le composant tCombinedSQLOutput). Dans ce scénario, l'objectif est de grouper des employés en fonction de l’État dans lequel ils vivent. Il faut ensuite compter le nombre d'employés par État, calculer les salaires moyens, les plus bas, les plus élevés ainsi que les employés les plus âgés, les plus jeunes par État.
  12. Dans le tableau Operations, cliquez sur le bouton [+] pour ajouter une ou plusieurs ligne(s), puis cliquez dans la liste Output column afin de sélectionner la colonne de sortie qui contiendra les données calculées.
  13. Cliquez dans la ligne Function et sélectionnez l'opération à effectuer.