Configuration de Talend Data Preparation

Talend Data Services Platform Guide d'installation pour Windows

EnrichVersion
6.3
EnrichProdName
Talend Data Services Platform
task
Installation et mise à niveau

Cette section contient des informations sur les étapes de configuration obligatoires suite à l'installation, et également sur la manière de sécuriser les connections de Talend Data Preparation et de configurer les logs de l'application.

Configuring Talend Data Preparation after installation

Suite à l'installation de Talend Data Preparation et avant de passer à son utilisation, effectuez les étapes suivantes de configuration :

  1. Ouvrez le fichier <Data_Preparation_Path>/config/application.properties afin de modifier les propriétés suivantes de Talend Data Preparation :

    Note

    Le mot de passe est crypté au lancement de votre instance de Talend Data Preparation.

    Champ

    Action

    tac.url

    Saisissez l'URL vers votre Talend Administration Center suivi d'un caractère /.

    public.ip

    Saisissez l'URL que vous souhaitez utiliser pour accéder à Talend Data Preparation.

    server.port

    Saisissez le port que vous souhaitez utiliser pour l'interface utilisateur de Talend Data Preparation.

    tac.user

    Saisissez le nom d'utilisateur de votre utilisateur de Data Preparation dans Talend Administration Center.

    tac.password

    Saisissez le mot de passe de votre utilisateur de Data Preparation dans Talend Administration Center.
  2. Changez les champs suivants avec vos paramètres MongoDB :

    Champ

    Description

    mongodb.host

    Nom d'hôte de votre instance de MongoDB.

    mongodb.port

    Numéro de port de votre instance de MongoDB.

    mongodb.database

    Nom de la base de données à laquelle Talend Data Preparation est connecté, dataprep par défaut.

    mongodb.user

    Nom d'utilisateur utilisé pour vous connecter à la base de données.

    mongodb.password

    Mot de passe utilisé pour vous connecter à la base de données.

  3. Pour activer l'interaction entre Talend Data Preparation et le service Components Catalog, changez la ligne suivante en utilisant votre nom d'hôte et numéro de port pour le serveur Components Catalog :

    tcomp.server.url=http://<tcomp_host>:<tcomp_port>/tcomp

  4. Pour configurer l'accès à Talend Dictionary Service, changez les lignes suivantes :

    Field

    Description

    spring.cloud.stream.kafka.binder.brokers

    Saisissez le nom d'hôte correspondant à votre broker Kafka.

    spring.cloud.stream.kafka.binder.defaultBrokerPort

    Saisissez le numéro de port correspondant à votre broker Kafka.

    spring.cloud.stream.kafka.binder.zkNodes

    Saisissez le nom d'hôte correspondant à votre nœud Zookeeper.

    spring.cloud.stream.kafka.binder.defaultZkPort

    Saisissez le numéro de port correspondant à votre nœud Zookeeper.

  5. Pour activer l'interaction entre Talend Data Preparation et Talend Dictionary Service, saisissez true comme valeur pour la propriété dataquality.semantic.update.enable.

  6. Exécutez le fichier start.bat afin de démarrer votre instance de Talend Data Preparation.

Configuration d'une connexion HTTPS pour Talend Data Preparation

Pour établir une connexion HTTPS sécurisée entre les différents services, ainsi qu'avec le serveur MongoDB, éditez le fichier application.properties.

Il n'est cependant pas possible d'établir une connexion sécurisée pour MongoDB si vous avez choisi d'utiliser l'instance de MongoDB intégrée lors de l'installation.

Si vous souhaitez sécuriser les connexions de MongoDB en utilisant SSL, MongoDB Enterprise Server doit être manuellement installé sur votre machine. Pour plus d'informations, consultez https://docs.mongodb.com/v3.2/security/ (en anglais).

  1. Ouvrez le fichier <Data_Preparation_Path>/config/application.properties.

  2. Pour définir le chemin et le mot de passe du certificat pour le serveur Data Preparation, modifiez les lignes suivantes :

    # server TLS setup
    tls.key-store=/path/to/key-store.jks
    tls.key-store-password=key-store_password
  3. Pour définir le chemin et le mot de passe de l'autorité de certification qui émet le certificat du serveur, modifiez les lignes suivantes :

    tls.trust-store=/path/to/trust-store.jks
    tls.trust-store-password=trust-store_password
  4. Pour assouplir le contrôle de sécurité entre le nom courant du certificat et son URL, modifiez les lignes suivantes :

    # false to disable hostname verification
    tls.verify-hostname=false
  5. Pour définir le chemin et le mot de passe de l'autorité de certification qui émet le certificat du serveur MongoDB, modifiez les lignes suivantes :

    mongodb.ssl=true
    mongodb.ssl.trust-store=/path/to/trus-store.jks
    mongodb.ssl.trust-store-password=trust-store-password
  6. Dans le fichier application.properties, modifiez les URL des services actuellement au format http, vers le format https.

    dataset.service.url=https://${public.ip}:${server.port}
    transformation.service.url=https://${public.ip}:${server.port}
    preparation.service.url=https://${public.ip}:${server.port}

Talend Data Preparation supporte uniquement le format Java Key Store (.jks) pour stocker les clés et certificats.

Configuration de Talend Data Preparation pour une instance de Talend Administration Center en HTTPS

Pour que Talend Data Preparation puisse se connecter à une instance de Talend Administration Center ouverte en https, Talend Data Preparation doit faire confiance au certificat de Talend Administration Center.

  1. Récupérez le certificat de Talend Administration Center, ou bien son Autorité de Certification et ajoutez-le à un nouveau fichier .jks ou un fichier existant, en utilisant la commande suivante :

    keytool -import -trustcacerts -alias <cert-alias> -file <tac_certificate.crt> -keystore <truststore.jks>

  2. Dans le fichier <Data_Preparation_Path>/config/application.properties, ajoutez les propriétés suivantes pour configurer le truststore :

    tls.trust-store=/path/to/<truststore.jks>
    tls.trust-store-password=<trust-store_password>
    
    false to disable hostname verification
    tls.verify-hostname=false
  3. Redémarrez Talend Data Preparation.

Utiliser le composant tDataprepRun avec une connexion HTTPS

Pour faire fonctionner le composant tDataprepRun lorsque Talend Data Preparation est connecté en https, effectuez la configuration suivante :

  1. Récupérez le certificat de Talend Data Preparation, ou bien son Autorité de Certification et ajoutez-le à un nouveau fichier .jks ou un fichier existant, en utilisant la commande suivante :

    keytool -import -trustcacerts -alias <cert-alias> -file <dp_certificate.crt> -keystore <truststore.jks>

  2. Pour que le Studio fasse confiance au certificat de Talend Data Preparation, modifiez le fichier .ini utilisé pour démarrer le Studio :

    -Djavax.net.ssl.trustStore=/path/to/<trust-store.jks>
    -Djavax.net.ssl.trustStorePassword=<trust-store password>
  3. Au moment de créer votre Job dans le Studio, connectez un composant tSetKeystore au composant qui sert de source de données à l'aide d'un lien OnSubjobOk, pour que le Job fasse confiance au certificat de Talend Data Preparation.

    Pour plus d'informations sur la configuration du composant tSetKeystore, consultez le Guide de Référence des Composants Talend.

    Pour plus d'informations sur l'utilisation du composant tDataprepRun et sur l'opérationnalisation d'une recette dans un Job Talend Job, consultez Talend Help Center (https://help.talend.com).

Créer un live dataset avec un connexion HTTPS

Pour faire fonctionner un live dataset lorsque Talend Data Preparation est connecté en https, effectuez la configuration suivante :

  1. Récupérez le certificat de Talend Data Preparation, ou bien son Autorité de Certification et ajoutez-le à un nouveau fichier .jks ou un fichier existant, en utilisant la commande suivante :

    keytool -import -trustcacerts -alias <cert-alias> -file <dp_certificate.crt> -keystore <truststore.jks>

  2. Au moment de créer votre Job dans le Studio, connectez un composant tSetKeystore au composant qui sert de source de données à l'aide d'un lien OnSubjobOk, pour que le Job fasse confiance au certificat de Talend Data Preparation.

    Pour plus d'informations sur la configuration du composant tSetKeystore, consultez le Guide de Référence des Composants Talend.

    Pour plus d'informations sur la création d'un live dataset, consultez Talend Help Center (https://help.talend.com).

Configurer les logs de Talend Data Preparation

Les logs de Talend Data Preparation vous permettent d'analyser et de déboguer l'activité de Talend Data Preparation.

Les logs de Talend Data Preparation sont enregistrés dans <Data_Preparation_Path>/data/logs/app.log.

Pour configurer les logs, éditez le fichier <Data_Preparation_Path>/config/log4j2.xml :