Lire et mettre en cache les données d'exemple - 6.5

Machine Learning

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Machine Learning
Gouvernance de données > Systèmes tiers > Composants Machine Learning
Qualité et préparation de données > Systèmes tiers > Composants Machine Learning
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le premier tFileInputInput pour ouvrir sa vue Component.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema et, dans la fenêtre qui s'ouvre, définissez le schéma en ajoutant deux colonnes latitude et longitude de type Double.
  3. Cliquez sur OK pour valider ces modifications et acceptez la propagation proposée par la boîte de dialogue.
  4. Cochez la case Define a storage configuration component et sélectionnez le composant tHDFSConfiguration à utiliser.
    Le tFileInputDelimited utilise cette configuration pour accéder aux données d'exemple à utiliser comme jeu d'apprentissage.
  5. Dans le champ Folder/File, saisissez le chemin du répertoire où stocker le jeu d'apprentissage.
  6. Double-cliquez sur le composant tReplicate pour ouvrir sa vue Component.
  7. Cochez la case Cache replicated RDD et, dans la liste Storage level, sélectionnez Memory only. Ainsi, les données d'exemples sont répliquées et stockées dans la mémoire pour utilisation en tant que jeu de test.