Tirer parti des fonctionnalités sémantiques afin de convertir des dates en jours de la semaine à l'aide du remplissage par magie - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-02-21

En se basant sur l'exemple que vous allez saisir, le remplissage par magie peut également reconnaître et formater les données correspondant à certains types sémantiques : pays, adresses e-mail, URL, codes postaux, États et dates.

Prenez l'exemple d'une petite entreprise de commerce de détail ayant plusieurs magasins dans une ville. Le jeu de données suivant indique comment le nombre total de ventes est enregistré avec la date correspondante chaque jour. Le format utilisé pour saisir des dates est dd/MM/yyyy, mais vous pouvez également afficher le jour de la semaine correspondant, afin de faire des analyses statistiques et déterminer les jours les plus rentables. Ce scénario vous présente comment utiliser la fonctionnalité de remplissage par magie afin d'extraire cette information.

Jeu de données contenant le nombre de ventes enregistrées.

Procédure

  1. Cliquez sur l'en-tête de la colonne date pour sélectionner son contenu.
  2. Dans le panneau des fonctions, saisissez Magic fill (remplir par magie) et cliquez sur le résultat pour afficher les options de la fonctionnalité associée.
  3. Dans le champ Input 1, saisissez l'une des valeurs de la colonne date que vous souhaitez transformer, 17/01/2018 par exemple.
  4. Dans le champ Output 1, saisissez le jour de la semaine que vous savez correspondre : Wednesday (mercredi).
    Pour que la fonction puisse fonctionner, vous devez saisir au moins deux exemples complets de la transformation à appliquer. Vous pouvez ajouter jusqu'à trois autres exemples. Les exemples peuvent provenir de votre jeu de données, ou vous pouvez utiliser d'autres paires de dates/jours valides. Plus vous saisissez d'exemples, plus la transformation sera identifiée précisement par la fonction.
  5. Saisissez plus d'exemples avant-après dans les champs restant :
    • 02/11/2018 comme Input 2 et Friday comme Output 2
    • 06/12/2018 comme Input 3 et Thursday comme Output 3
    • 22/09/2019 comme Input 4 et Sunday comme Output 4
    • 13/07/2019 comme Input 5 et Saturday comme Output 5

    En se basant sur ces exemples, la fonction comprendra que toutes les entrées (Input) saisies sont des dates au format dd/MM/yyyy, que les sorties indiquent les jours de la semaine correspondants et va appliquer la transformation correspondante au reste de la colonne.

  6. Cliquez sur Submit.

Résultats

Une nouvelle colonne est créée, affichant le jour de la semaine pour chaque date de votre colonne initiale. Vous pouvez voir que la plupart des ventes semble se faire les mercredi et samedi, c'est une information nouvelle. Partant de là, vous pouvez facilement filtrer sur n'importe quel jour de la semaine ou essayer des fonctions d'agrégation via le panneau des diagrammes, pour obtenir la moyenne des ventes de chaque jour de la semaine.
Jeu de données contenant le nombre de ventes enregistrées avec une nouvelle colonne.