Cette procédure contient les étapes nécessaires à l'installation manuelle de Talend Data Preparation sur votre machine. Pour la procédure d'installation automatique à l'aide de Talend Installer, consultez Utilisation de Talend Installer Utiliser le mode d'installation graphique.
Prérequis :
Talend Administration Center est installé et en cours d'exécution. Pour plus d'informations concernant l'installation de Talend Administration Center, consultez Utilisation de Talend Installer Utiliser le mode d'installation graphique pour l'installation automatique ou Installer et configurer Talend Administration Center pour l'installation manuelle.
Talend Identity and Access Management doit être installé et en cours de fonctionnement. Pour plus d'informations sur l'installation de Talend Identity and Access Management, consultez Installer et configurer Talend Identity and Access Management.
Un utilisateur de Talend Data Preparation existe dans Talend Administration Center. Pour plus d'informations, consultez le Guide utilisateur de Talend Administration Center.
Aucune autre instance de MongoDB n'est installée sur votre machine.
Pour utiliser Talend Data Preparation avec Big Data, utilisez l'une des distributions Hadoop supportées. Pour plus d'informations, consultez Versions des distributions Hadoop supportées par les Jobs Talend Data Preparation avec Big Data.
Avant d'installer Talend Data Preparation, assurez-vous que les prérequis matériels et logiciels sont respectés. Pour plus d'informations, consultez Avant d'installer votre produit Talend ..
Lorsque vous installez manuellement votre produit , les procédures d'installation doivent être effectuées dans un ordre précis.Talend Pour plus d'informations, consultez Installer votre produit Talend manuellement.
Pour installer et configurer manuellement Talend Data Preparation, procédez comme suit :
Téléchargez une instance de MongoDB 3.4 depuis https://www.mongodb.com/download-center (en anglais) et installez-la.
Pour plus d'informations concernant les bases de données MongoDB supportées, consultez Bases de données compatibles.
Pour plus d'informations concernant son installation, consultez le documentation de MongoDB (en anglais).
Si vous souhaitez sécuriser les connexions de MongoDB en utilisant SSL, MongoDB Enterprise Server doit être manuellement installé sur votre machine. Pour plus d'informations, consultez https://docs.mongodb.com/v3.4/security/ (en anglais).
Dézippez le fichier Talend-DataPreparation-Server-VA.B.C.zip à l'emplacement où vous souhaitez installer Talend Data Preparation.
Dézippez le fichier Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zip à l'endroit où vous souhaitez installer Components Catalog.
Afin d'utiliser Talend Data Preparation dans un contexte Big Data, vous devez installer deux utilitaires supplémentaires : Streams Runner et Spark Job Server.
Dézippez le fichier <Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgz, à l'endroit où vous souhaitez installer Streams Runner.
Dézippez le fichier <Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gz, à l'endroit où vous souhaitez installer Spark Job Server. Ce fichier contient Spark Job Server ainsi que toutes les dépendances nécessaires à son utilisation.
Notez que Spark Job Server doit être installé sur une machine Linux.
Vous devez également avoir installé Curl, un utilitaire de ligne de commande et une librairie qui permet de transférer des données via des URL. Vous pouvez le télécharger depuis https://curl.haxx.se/ si nécessaire.
Ajoutez
mongo
à la variable d'environnementPATH
.Créez la base de données
dataprep
dans MongoDB à l'aide de la commande suivante :use dataprep
.Créez l'utilisateur suivant pour la base de données
dataprep
dans MongoDB :exécutez la commande suivante :
db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
.Vous pouvez automatiquement créer l'utilisateur et son mot de passe en exécutant le fichier <Data_Preparation_Path>/create_mongo_user.sh.
Avant d'utiliser Talend Data Preparation pour la première fois, vous devez également effectuer quelques étapes de configuration. Pour plus d'informations, consultez Configurer Talend Data Preparation, Configurer le serveur Components Catalog et, de manière optionnelle, Configurer Streams Runner et Configurer Spark Job Server,