Installation manuelle de Talend Data Preparation

Guide d'installation de Talend Data Management Platform pour Linux

EnrichVersion
6.5
EnrichProdName
Talend Data Management Platform
task
Installation et mise à niveau
EnrichPlatform
Talend Administration Center
Talend Activity Monitoring Console
Talend Data Stewardship
Talend JobServer
Talend SAP RFC Server
Talend Installer
Talend Artifact Repository
Talend Data Preparation
Talend Repository Manager
Talend CommandLine
Studio Talend
Talend Log Server
Talend Identity and Access Management
Talend DQ Portal
Talend Runtime
Cette procédure contient les étapes nécessaires à l'installation manuelle de Talend Data Preparation sur votre machine. Pour l'installation automatique à l'aide de Talend Installer, consultez Utiliser le mode d'installation graphique de Talend Installer.

Avant de commencer

Procédure

  1. Téléchargez une instance de MongoDB 3 depuis https://www.mongodb.com/download-center (en anglais) et installez-la.
    Pour plus d'informations sur les bases de données MongoDB supportées, consultez Bases de données compatibles.
    Pour plus d'informations sur son installation, consultez la documentation de MongoDB (en anglais).
    Si vous souhaitez sécuriser les connexions de MongoDB en utilisant SSL, MongoDB Enterprise Server doit être manuellement installé sur votre machine. Pour plus d'informations, consultez https://docs.mongodb.com/v3.4/security/ (en anglais).
  2. Dézippez le fichier Talend-DataPreparation-Server-VA.B.C.zip à l'emplacement où vous souhaitez installer Talend Data Preparation.
  3. Extrayez le fichier <Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zip à l'endroit où vous souhaitez installer Components Catalog.
  4. Afin d'utiliser Talend Data Preparation dans un contexte Big Data, vous devez installer deux utilitaires supplémentaires : Streams Runner et Spark Job Server.
    Notez que Streams Runner et Spark Job Server doivent être installés sur une machine Linux.
    1. Extrayez le fichier <Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgz, à l'endroit où vous souhaitez installer Streams Runner.
    2. Extrayez le fichier <Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gz, à l'endroit où vous souhaitez installer Spark Job Server. Ce fichier contient Spark Job Server ainsi que toutes les dépendances nécessaires à son utilisation.
      Vous devez également avoir installé curl, un utilitaire de ligne de commande et une librairie qui permet de transférer des données via des URL. Vous pouvez le télécharger depuis https://curl.haxx.se/ si nécessaire.
  5. Ajoutez mongo à la variable d'environnement PATH.
  6. Créez la base de données dataprep dans MongoDB à l'aide de la commande suivante :
    use dataprep
  7. Créez l'utilisateur suivant pour la base de données dataprep dans MongoDB :
    • Nom d'utilisateur : dataprep-user
    • Mot de passe : duser
    Pour ce faire, vous pouvez utiliser la commande suivante :
    db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
    Vous pouvez automatiquement créer l'utilisateur et son mot de passe en exécutant le fichier <Data_Preparation_Path>/create_mongo_user.sh.