Configurer le composant d'entrée - 7.3

Traitement du langage naturel

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Traitement automatique du langage naturel
Gouvernance de données > Systèmes tiers > Traitement automatique du langage naturel
Qualité et préparation de données > Systèmes tiers > Traitement automatique du langage naturel
Last publication date
2024-02-22
Le composant tFileInputXML est utilisé pour charger le texte à traiter.

Procédure

  1. Double-cliquez sur le tFileInputXML pour afficher sa vue Basic settings et définissez ses propriétés.
    1. Cliquez sur le bouton [...] à côté du champ Edit schema pour ajouter les colonnes contenant les données d'entrée.
    2. Dans le champ File name, spécifiez le chemin d'accès au fichier à traiter.
    3. Dans le champ Element to extract, saisissez "row".
    4. Dans le champ Loop XPath query, saisissez la requête XPath entre guillemets doubles pour spécifier sur quel nœud la boucle doit se baser.
    5. Dans la colonne XPath query de la table Mapping, spécifiez entre guillemets doubles les champs sur lesquels effectuer la requête.
  2. Dans la vue Advanced settings du composant, cochez la case Custom encoding si vous rencontrez des problèmes lors du traitement des données.
  3. Dans la liste Encoding, sélectionnez l'encodage à utiliser, UTF-8 dans cet exemple.