Scénario : Créer une dimension avec des éléments - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le Job de ce scénario crée une dimension de date avec une hiérarchie d'éléments simple, composée de trois niveaux : Year, Month, Date (Année, mois, date).

Pour reproduire ce scénario, procédez comme suit :

Construire le Job

  1. Déposez un composant tPaloConnection, un tRowGenerator, un tMap, et un tPaloDimension de la Palette dans l'espace de modélisation graphique.

  2. Cliquez-droit sur le tPaloConnection afin d'ouvrir le menu contextuel et sélectionnez Trigger > On Subjob Ok pour le relier au tRowGenerator.

  3. Cliquez-droit sur le tRowGenerator afin d'ouvrir le menu contextuel et sélectionnez Row > Main pour le relier au tMap.

    Note

    Le tRowGenerator est utilisé pour générer des lignes au hasard afin de simplifier ce processus. Dans un cas réel d'utilisation, vous pouvez utiliser un autre composant d'entrée afin de charger vos données.

  4. Cliquez-droit sur le tMap pour ouvrir le menu contextuel et sélectionnez Row > *New output* pour le relier au tPaloDimension. Nommez ce lien out1 dans la boîte de dialogue qui s'ouvre.

Paramétrer la connexion à une base de données

  1. Double-cliquez sur le composant tPaloCube afin d'ouvrir sa vue Component.

  2. Dans le champ Host name, saisissez le nom de l'hôte ou l'adresse IP du serveur hôte, localhost dans cet exemple.

  3. Dans le champ Server Port, saisissez le numéro du port d'écoute du serveur Palo. Dans ce scénario, le numéro est 7777.

  4. Dans les champs Username (identifiant) et Password (mot de passe), saisissez les informations d'authentification. Dans cet exemple, les deux sont admin.

Configurer le composant Input

  1. Double-cliquez sur le tRowGenerator pour ouvrir son éditeur.

  2. Dans la partie supérieure de l'éditeur, cliquez sur le bouton [+] pour ajouter une colonne, et renommez-la random_date dans la colonne Column.

  3. Dans la ligne nouvellement ajoutée, sélectionnez Date pour la colonne Type, et getRandomDate dans la colonne Functions.

  4. Dans la vue Function parameters de la partie inférieure de l'éditeur, saisissez les nouvelles valeurs des dates minimum et maximum de la colonne Value. Dans cet exemple, le minimum est 2010-01-01, le maximum est 2010-12-31.

  5. Cliquez sur OK afin de valider vos modifications et fermer l'éditeur.

  6. Dans la boîte de dialogue qui s'ouvre, cliquez sur OK pour propager les modifications.

Configurer le tMap editor

  1. Double-cliquez sur le tMap afin d'ouvrir son éditeur.

  2. Dans la vue Schema editor de la partie inférieure de la fenêtre, sous la table out1, cliquez sur le bouton [+] afin d'ajouter trois lignes.

  3. Dans la colonne Column de la table out1 saisissez de nouveaux noms pour les trois lignes ajoutées, Year, Month et Date (année, mois et date). Ces lignes sont ajoutées automatiquement à la table out1 dans la partie inférieure du tMap editor.

  4. Dans la table out1 de la partie supérieure de l'éditeur, cliquez sur la colonne Expression de la ligne Year.

  5. Appuyez sur les touches Ctrl+Espace afin d'ouvrir la liste d'auto-complétion.

  6. Double-cliquez sur TalendDate.formatDate pour la sélectionner. L'expression pour obtenir la date s'affiche dans la ligne Year. L'expression est la suivante :

    TalendDate.formatDate("yyyy-MM-dd HH:mm:ss",myDate).

  7. Remplacez l'expression par défaut par TalendDate.formatDate("yyyy",row1.random_date).

  8. Répétez l'opération pour les lignes Month et Date pour ajouter l'expression par défaut et remplacez-la respectivement par TalendDate.formatDate("MM",row1.random_date)et par TalendDate.formatDate("dd-MM-yyyy", row1.random_date).

  9. Cliquez sur OK afin de valider cette modification et acceptez la propagation des modifications en cliquant sur OK dans la boîte de dialogue qui s'ouvre.

Configurer le composant tPaloDimension

  1. Dans l'espace de modélisation graphique, double-cliquez sur le tPaloDimension afin d'ouvrir sa vue Component.

  2. Cochez la case Use an existing connection. Le tPaloConnection_1 s'affiche automatiquement dans le champ Connection configuration.

  3. Dans le champ Database, saisissez le nom de la base de données dans laquelle la nouvelle dimension est créée, talendDatabase dans cet exemple.

  4. Dans le champ Dimension, saisissez le nom que vous souhaitez utiliser pour la dimension à créer, Date, par exemple.

  5. Dans le champ Action on dimension, sélectionnez l'action à effectuer. Dans ce scénario, sélectionnez Create dimension if not exist.

  6. Sélectionnez la case Create dimension elements.

  7. Dans la zone Consolidation Type, sélectionnez le bouton Normal.

  8. Sous le tableau de la hiérarchie des éléments, cliquez trois fois sur le bouton [+] pour ajouter trois lignes au tableau.

  9. Dans la colonne Input column du tableau, sélectionnez Year dans la liste déroulante de la première ligne, Month dans la deuxième et Date dans la troisième. Cela détermine le niveau des éléments des différentes colonnes du schéma d'entrée.

Exécuter le Job

Appuyez sur F6 pour exécuter le Job.

Une nouvelle dimension a été créée dans la base de données Palo talendDatabase.