Configurer Talend Data Preparation après installation - 7.1

Guide d'installation de Talend Big Data Platform pour Linux

EnrichVersion
7.1
EnrichProdName
Talend Big Data Platform
task
Installation et mise à niveau
EnrichPlatform
Studio Talend
Talend Activity Monitoring Console
Talend Administration Center
Talend Artifact Repository
Talend CommandLine
Talend Data Preparation
Talend Data Stewardship
Talend DQ Portal
Talend Identity and Access Management
Talend Installer
Talend JobServer
Talend Log Server
Talend Repository Manager
Talend Runtime
Talend SAP RFC Server

Procédure

  1. Ouvrez le fichier <Data_Preparation_Path>/config/application.properties afin de modifier les propriétés suivantes de Talend Data Preparation :
    Champ Action
    tac.url Saisissez l'URL vers votre Talend Administration Center suivi d'un caractère /.
    public.ip Saisissez l'URL que vous souhaitez utiliser pour accéder à Talend Data Preparation.
    server.port Saisissez le port que vous souhaitez utiliser pour l'interface utilisateur de Talend Data Preparation.
    iam.ip Saisissez l'URL vers votre instance Talend Identity and Access Management.
    tac.user-name Saisissez le nom d'utilisateur de votre utilisateur de Data Preparation dans Talend Administration Center.
    tac.password Saisissez le mot de passe de votre utilisateur de Data Preparation dans Talend Administration Center.
    security.oauth2.client.clientId Saisissez l'identifiant du client OIDC Talend Identity and Access Management.
    security.oauth2.client.clientSecret Saisissez le mot de passe OIDC que vous avez généré pour Talend Identity and Access Management.
    iam.scim.url Assurez-vous que le port de Talend Identity and Access Management est correct.
    app.products[0].id=TDS

    app.products[0].name=Data Stewardship

    app.products[0].url=<place_your_tds_url_here>

    Saisissez l'URL vers votre instance Talend Data Stewardship.

    Tous les mots de passe saisis dans le fichier de propriétés sont cryptés au lancement de votre instance Talend Data Preparation.

  2. Changez les champs suivants avec vos paramètres MongoDB :
    Champ Description
    mongodb.host Nom d'hôte de votre instance de MongoDB.
    mongodb.port Numéro de port de votre instance de MongoDB.
    mongodb.database Nom de la base de données à laquelle Talend Data Preparation est connecté, dataprep par défaut. La base de données est créée lorsque vous démarrez Talend Data Preparation pour la première fois.
    mongodb.user Nom d'utilisateur utilisé pour vous connecter à la base de données.
    mongodb.password Mot de passe utilisé pour vous connecter à la base de données.
  3. Pour activer l'interaction entre Talend Data Preparation et le service Components Catalog, changez la ligne suivante en utilisant votre nom d'hôte et numéro de port pour le serveur Components Catalog :
    tcomp.server.url=http://<tcomp_host>:<tcomp_port>/tcomp
  4. Pour activer le menu Applications après avoir installé Talend Data Preparation et Talend Data Stewardship, décommentez la ligne suivante et ajoutez l'URL vers votre instance de Talend Data Stewardship :
    app.products[0].id=TDS
    app.products[0].name=Data Stewardship
    app.products[0].url=<place_your_tds_url_here>

    Vous devez également ajouter l'URL vers votre instance de Talend Data Preparation au fichier de configuration de Talend Data Stewardship. Pour plus d'informations, consultez Configurer Talend Data Stewardship après installation.

  5. Par défaut, les logs d'audit sont activés. Vous devez spécifier le paramètre appender.http.url dans le fichier audit.properties, ou désactiver les logs d'audit. Pour plus d'informations, consultez Enabling and configuring audit capabilities in Talend Data Preparation.
  6. Pour configurer l'accès à Talend Dictionary Service, changez les lignes suivantes :
    Champ Description
    dataquality.semantic.update.enable Saisissez true comme valeur pour ce paramètre afin d'activer l'interaction entre Talend Data Preparation et Talend Dictionary Service.
    dataquality.semantic.list.enable Saisissez true comme valeur pour ce paramètre afin d'afficher le menu d'enrichissement des types sémantiques dans l'interface de Talend Data Preparation.
    semanticservice.url Saisissez l'URL vers votre instance Talend Dictionary Service.
    spring.cloud.stream.kafka.binder.brokers Saisissez l'hôte correspondant à votre broker Kafka.
    spring.cloud.stream.kafka.binder.defaultBrokerPort Saisissez le port correspondant à votre broker Kafka.
    spring.cloud.stream.kafka.binder.zkNodes Saisissez l'hôte correspondant à votre nœud Zookeeper.
    spring.cloud.stream.kafka.binder.defaultZkPort Saisissez le numéro de port correspondant à votre nœud Zookeeper.
  7. Changez la valeur de la propriété dataquality.indexes.file.location de ${java.io.tmpdir}/org.talend.dataquality.semantic à <other_location>/org.talend.dataquality.semantic.
    Par défaut, les types sémantiques personnalisés créés en utilisant Talend Dictionary Service sont stockés dans un dossier tmp. Pour éviter de perdre les modifications effectuées, il est recommandé de modifier l'emplacement de sauvegarde des types sémantiques personnalisés. Vous pouvez définir l'emplacement de votre choix, tant qu'il ne s'agit pas d'un dossier tmp.
  8. Pour activer l'utilisation du Streams Runner pour Talend Data Preparation, saisissez true comme valeur pour la propriété streams.enable.
  9. Pour configurer l'accès au Streams Runner, changez les lignes suivantes :
    Champ Description
    streams.flow.runner.url Saisissez l'URL pour accéder au Streams Runner. La syntaxe de l'URL est la suivante : http://<local_machine_IP>:<Big_data_preparation_port>/
    streams.kerberos.principal Saisissez votre principal Kerberos.
    streams.kerberos.keytab_path Saisissez le chemin vers votre fichier keytab Kerberos.
    streams.hdfs.server.url Vous pouvez choisir de définir une URL par défaut à afficher dans les champs Path, en import et en export, lorsque vous travaillez avec des jeux de données provenant d'HDFS dans Talend Data Preparation.
    Le fichier <Data_Preparation_Path>/config/tuning.properties contient d'autres paramètres, permettant une configuration plus avancée. Assurez-vous que les paramètres contenus dans ce fichier correspondent au dimensionnement de votre cluster.
  10. Exécutez le fichier start.sh afin de démarrer votre instance de Talend Data Preparation.