Lire et mettre en cache les données d'exemple - 6.5

Machine Learning

Version
6.5
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Machine Learning
Gouvernance de données > Systèmes tiers > Composants Machine Learning
Qualité et préparation de données > Systèmes tiers > Composants Machine Learning

Procédure

  1. Double-cliquez sur le premier tFileInputInput pour ouvrir sa vue Component.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema et, dans la fenêtre qui s'ouvre, définissez le schéma en ajoutant deux colonnes latitude et longitude de type Double.
  3. Cliquez sur OK pour valider ces modifications et acceptez la propagation proposée par la boîte de dialogue qui s'ouvre.
  4. Cochez la case Define a storage configuration component et sélectionnez le composant tHDFSConfiguration à utiliser.
    Le tFileInputDelimited utilise cette configuration pour accéder aux données d'exemple à utiliser comme jeu d'apprentissage.
  5. Dans le champ Folder/File, saisissez le chemin du répertoire où stocker le jeu d'apprentissage.
  6. Double-cliquez sur le composant tReplicate pour ouvrir sa vue Component.
  7. Cochez la case Cache replicated RDD et, dans la liste Storage level, sélectionnez Memory only. Ainsi, les données d'exemple sont répliquées et stockées dans la mémoire pour utilisation en tant que jeu de test.