Cette section présente comment créer un schéma d'apprentissage des données afin de développer une routine d'apprentissage automatique.
Procédure
-
Cliquez-droit sur la connexion à HDFS précédemment créée et sélectionnez Retrieve Schema.
-
Naviguez jusqu'au fichier de données de formation pré-chargé.
Dans cet exemple, /user/puccini/machinelearning/decisiontrees/marketing/marketing_campaign_train.csv.
-
Cliquez sur Next, nommez le schéma et ajustez les types de données selon vos besoins.
Dans cet exemple, les valeurs par défaut sont correctes.
-
Cliquez sur Finish.
-
Ajoutez un tHDFSConfiguration dans l'espace de modélisation graphique.
-
Dans la liste Property Type, sélectionnez Repository.
-
Sélectionnez la connexion à HDFS créée, MarketingCampaignData.