tMondrianInput - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Fonction

Le composant tMondrianInput lit des données à partir de bases relationnelles et produit des groupes de données multidimensionnels reposant sur une requête MDX.

Objectif

Le tMondrianInput exécute une expression multi-dimensionnelle (MDX) correspondant à la structure du groupe de données et au schéma défini. Puis il passe les données multidimensionnelles obtenues au composant suivant à l'aide d'un lien de type Row Main.

Propriétés du tMondrianInput

Famille du composant

Business Intelligence/OLAP Cube

 

Basic settings

Mondrian Version

Sélectionnez la version de Mondrian que vous utilisez.

 

DB type

Sélectionnez le type de relation approprié pour relier les bases de données.

 

Property type

Peut être Built-in ou Repository.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier de propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

Datasource

Chemin d'accès et nom du fichier contenant les données.

 

Username et Password

Informations d'authentification de l'utilisateur de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Le schéma est créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé. Consultez également le Guide utilisateur du Studio Talend.

 

Catalog

Chemin d'accès au catalogue (structure de l'entrepôt de données).

 

MDX Query

Saisissez votre requête MDX en faisant attention à ce que l'ordre des champs corresponde à celui défini dans le schéma et dans la structure de l'entrepôt de données.

 

Encoding

Sélectionnez le type d'encodage à partir de la liste ou choisissez l'option Custom pour le définir manuellement. Ce champ doit obligatoirement être renseigné.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable Flow et retourne un entier.

QUERY : requête traitée. Cette variable est une variable Flow et retourne une chaîne de caractères.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant couvre toutes les possibilités des requêtes MDX pour des groupes de données multidimensionnels.

Limitation

Ce composant requiert l'installation des fichiers .jar liés. Pour plus d'informations sur l'installation de ces fichiers .jar manquants, consultez la section décrivant comment configurer le Studio Talend, dans le Guide d'installation Talend.

Scénario : Tables en jointure croisée

Le présent Job permet d'extraire des groupes de données multidimensionnels à partir de tables de bases de données relationnelles stockées dans une base MySQL. Les données sont récupérées à l'aide d'une expression multidimensionnelle (requête MDX). Il est clair que vous devez connaître la structure de vos données, ou du moins disposer d'une description de la structure (catalogue) comme référence du groupe de données à récupérer dans ces différentes dimensions.

Configurer le Job

  1. A partir de la Palette, cliquez-déposez un composant tMondrianInput (famille Business Intelligence) ainsi qu'un composant de sortie tLogRow (famille Logs & Errors).

  2. Reliez le tMondrianInput au composant de sortie à l'aide d'un lien de type Row Main.

Configurer la connexion à la base de données

  • Sélectionnez le composant tMondrianInput puis cliquez sur la vue Component.

  1. Dans le champ DB Type, sélectionnez la base de données relationnelle à utiliser avec Mondrian.

  2. Sélectionnez l'entrée du Repository correspondante dans le champ Property type, dans le cas où vous stockez les détails de connexion à vos bases de données de manière centralisée. Dans cet exemple, les propriétés sont en mode Built-in.

  3. Remplissez les détails de connexion à votre base de données : Host, Port, Database, User Name et Password.

  4. Dans le champ Schema, sélectionnez le schéma correspondant à partir du Repository dans le cas où il est stocké de manière centralisée. Dans cet exemple, le schéma doit reste à définir (mode Built-in).

Configurer la requête sur la base de données

  1. La base de données relationnelle que l'on veut interroger contient cinq colonnes : media, drink, unit_sales, store_cost et store_sales.

  2. La requête doit permettre de récupérer le contenu de unit_sales, store_cost et de store_sales pour les différentes valeur de media / drink en utilisant une requête MDX comme dans l'exemple ci-dessous :

  1. A partir de l'onglet Basic settings du composant tMondrianInput, renseignez le chemin d'accès au catalogue de l'entrepôt de données dans le champ Catalog. Ce catalogue décrit la structure de l'entrepôt.

  2. Entrez ensuite la requête MDX de la manière suivante :

    "select
       {[Measures].[Unit Sales], [Measures].[Store Cost], [Measures].[Store
    Sales]} on columns,
       CrossJoin(
         { [Promotion Media].[All Media].[Radio],
           [Promotion Media].[All Media].[TV],
           [Promotion Media].[All Media].[Sunday Paper],
           [Promotion Media].[All Media].[Street Handout] },
         [Product].[All Products].[Drink].children) on rows
     from Sales
     where ([Time].[1997])"

  3. Sélectionnez enfin le type d'encodage à partir de la liste du champ Encoding Type.

Exécuter le Job

  1. Sélectionnez le composant tLogRow puis cochez l'option Print header pour afficher le nom des colonnes sur la console.

  2. Enregistrez le Job puis appuyez sur F6 pour l'exécuter.

La console affiche le résultat de unit_sales, store_cost et store_sales pour chaque type de Drink (Beverages, Dairy, Alcoholic beverages) croisé avec chaque type de media (TV, Sunday Paper, Street handout) comme illustré ci-dessus.