Scénario : Convertir des mots de différentes langues en un ensemble de caractères standards - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job utilisant :

  • un composant tFixedFlowInput pour générer les données à traiter,

  • un tTransliterate pour encoder les données initiales exprimées en différentes langues en des caractères lisibles, basés sur le répertoire du standard Unicode,

  • un tFileOutputExcel pour écrire en sortie les données converties dans un fichier .xls.

Construire le Job

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFixedFlowInput, un tTransliterate et un tFileOutputExcel.

  2. Reliez ces trois composants à l'aide de liens Row > Main.

Configurer le composant d'entrée

  1. Double-cliquez sur le tFixedFlowInput pour ouvrir sa vue Basic settings.

  2. Créez le schéma en cliquant sur le bouton [...] à côté du champ Edit Schema.

    Dans la boîte de dialogue ouverte, cliquez sur le bouton [+] et ajoutez les colonnes qui contiendront vos données d'entrée. Dans cet exemple, ajoutez column1, column2, column3 et column4. Les deux premières colonnes contiennent des noms écrits dans différentes langues.

  3. Cliquez sur OK.

  4. Dans le champ Number of rows, saisissez 1.

  5. Dans la zone Mode, sélectionnez l'option Use Inline Content.

  6. Dans la table Content, saisissez les données que vous souhaitez convertir en caractères lisibles, basés sur le répertoire du standard Unicode comme dans l'image ci-dessus.

Translittérer les données

  1. Double-cliquez sur le tTransliterate pour afficher sa vue Basic settings et définir ses propriétés.

  2. Si nécessaire, cliquez sur le bouton Sync columns afin de récupérer le schéma défini dans le composant d'entrée.

    Dans cet exemple, seules les deux premières colonnes sont traitées. Vous pouvez cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir le schéma et voir les schémas d'entrée et de sortie.

  3. Dans la table Transliteration de l'onglet Basic settings, cochez les cases à côté des colonnes à convertir en caractères standards.

Configurer le composant de sortie et exécuter le Job

  1. Double-cliquez sur le composant tFileOutputExcel pour afficher sa vue Basic settings et définir ses propriétés.

  2. Configurez le nom du fichier de destination, ainsi que le nom de la feuille, puis cochez la case Define all columns auto size.

  3. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

    Le composant tTransliterate encode des données d'entrée en caractères lisibles en se basant sur le répertoire du standard Unicode.

  4. Cliquez-droit sur le composant et sélectionnez Data Viewer pour afficher les données translittérées.

    Tous les noms écrits en caractères de différentes langues ont été convertis phonétiquement en un ensemble de caractères standards basés sur le jeu de caractères universel, Universal Coded Character Set (UCS). Par exemple, les noms de la première et de la deuxième lignes dans l'image ci-dessous ont été respectivement modifiés à Ragnarr,Lodbrok et Routse,Anna.

    Pour plus d'informations concernant Unicode et le standard Unicode, consultez Unicode et Unicode Standard (en anglais).