Installer Talend Data Preparation manuellement - 7.2

Guide d'installation de Talend Big Data Platform pour Linux

EnrichVersion
7.2
EnrichProdName
Talend Big Data Platform
EnrichPlatform
Studio Talend
Talend Activity Monitoring Console
Talend Administration Center
Talend Artifact Repository
Talend CommandLine
Talend Data Preparation
Talend Data Stewardship
Talend DQ Portal
Talend Identity and Access Management
Talend Installer
Talend JobServer
Talend Log Server
Talend Repository Manager
Talend Runtime
Talend SAP RFC Server
task
Installation et mise à niveau
Cette procédure contient les étapes nécessaires à l'installation manuelle de Talend Data Preparation sur votre machine.

Avant de commencer

  • Talend Administration Center doit être installé et en cours d'exécution.
  • Talend Identity and Access Management doit être installé et en cours d'exécution.
  • un utilisateur ou une utilisatrice de Talend Data Preparation existe dans Talend Administration Center. Pour plus d'informations, consultez le Guide d'utilisation de Talend Administration Center.
  • Aucune autre instance de MongoDB n'est installée sur votre machine.
  • Pour utiliser Talend Data Preparation avec Big Data, utilisez l'une des distributions Hadoop supportées. Pour plus d'informations, consultez Versions des distributions Hadoop supportées pour Talend Data Preparation avec Big Data.
  • Avant d'installer Talend Data Preparation, assurez-vous que les prérequis matériels et logiciels sont respectés. Pour plus d'informations, consultez Talend Big Data Platform : Prérequis.

Procédure

  1. Téléchargez une instance de MongoDB depuis https://www.mongodb.com/download-center (en anglais) et installez-la.
    Pour plus d'informations concernant les bases de données MongoDB supportées, consultez Bases de données compatibles.
    Pour plus d'informations concernant son installation, consultez le MongoDB documentation (en anglais).
    Si vous souhaitez sécuriser les connexions de MongoDB en utilisant SSL, MongoDB Enterprise Server doit être manuellement installé sur votre machine. Pour plus d'informations, consultez https://docs.mongodb.com/v4.0/security/ (en anglais).
  2. Dézippez le fichier Talend-DataPreparation-Server-VA.B.C.zip à l'emplacement où vous souhaitez installer Talend Data Preparation.
  3. Dézippez le fichier <Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zip à l'endroit où vous souhaitez installer Components Catalog.
  4. Afin d'utiliser Talend Data Preparation dans un contexte Big Data, vous devez installer deux utilitaires supplémentaires : Streams Runner et Spark Job Server.
    Notez que Streams Runner et Spark Job Server doivent être installés sur une machine Linux.
    1. Dézippez le fichier <Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgz, à l'endroit où vous souhaitez installer Streams Runner.
    2. Dézippez le fichier <Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gz, à l'endroit où vous souhaitez installer Spark Job Server. Ce fichier contient Spark Job Server ainsi que toutes les dépendances nécessaires à son utilisation.
      Vous devez également avoir installé Curl, un utilitaire de ligne de commande et une librairie qui permet de transférer des données via des URL. Vous pouvez le télécharger depuis https://curl.haxx.se/ si nécessaire.
  5. Ajoutez mongo à la variable d'environnement PATH.
  6. Créez la base de données dataprep dans MongoDB à l'aide de la commande suivante : use dataprep.
  7. Créez l'utilisateur ou l'utilisatrice suivant pour la base de données dataprep dans MongoDB :
    • nom d'utilisateur ou d'utilisatrice : dataprep-user
    • Mot de passe : duser
    Pour ce faire, vous pouvez utiliser la commande suivante :
    db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
    Vous pouvez automatiquement créer l'utilisateur ou l'utilisatrice et son mot de passe en exécutant le fichier <Data_Preparation_Path>/create_mongo_user.sh.