Trier le flux de données du Job KMeans - 6.5

Machine Learning

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Machine Learning
Gouvernance de données > Systèmes tiers > Composants Machine Learning
Qualité et préparation de données > Systèmes tiers > Composants Machine Learning
EnrichPlatform
Studio Talend

Procédure

  1. Dans la perspective Integration du Studio, créez un Job vide à partir du nœud Job Designs, dans la vue Repository.
    Pour plus d'informations concernant la création d'un Job, consultez Guide de prise en main de Talend Open Studio for Big Data .
  2. Dans l'espace de modélisation graphique, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui s'affiche.
  3. Reliez le tFileInputDelimited au tReplicate à l'aide d'un lien Row > Main.
  4. Répétez l'opération afin de relier le tReplicate au tModelEncoder et le tModelEncoder au tKMeansModel.
  5. Reliez le tReplicate au tPredict et le tPredict au tFileOutputDelimited.
  6. Laissez le tHDFSConfiguration tel qu'il est.