Configurer le tSqoopImport - 7.3

Sqoop

Version
7.3
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Outils de bases de données > Composants Sqoop
Gouvernance de données > Systèmes tiers > Outils de bases de données > Composants Sqoop
Qualité et préparation de données > Systèmes tiers > Outils de bases de données > Composants Sqoop

Procédure

  1. Double-cliquez sur le tSqoopImport afin d'ouvrir sa vue Component.
  2. Dans la zone Mode, sélectionnez Use Java API.
  3. Dans la zone Version, sélectionnez la distribution Hadoop à utiliser et sa version. Si vous ne trouvez pas la distribution correspondant à la vôtre dans la liste, sélectionnez Custom afin de vous connecter à une distribution Hadoop non officiellement supportée par le Studio.
    Pour un exemple d'utilisation étape par étape de cette option Custom, consultez Connexion à une distribution Hadoop personnalisée.
  4. Dans le champ NameNode URI, saisissez l'emplacement du nœud maître, le NameNode, de la distribution utilisée. Par exemple, hdfs://talend-cdh4-namenode:8020. Si vous utilisez WebHDFS, l'emplacement doit être webhdfs://masternode:portnumber ; WebHDFS avec SSL n'est pas supporté.
  5. Dans le champ JobTracker Host, saisissez l'emplacement du JobTracker de votre distribution. Par exemple, talend-cdh4-namenode:8021.
    Notez que le mot "Job" dans le terme JobTracker désigne les Jobs MR ou Map/Reduce décrits dans la documentation d'Apache disponible sur le site Internet d'Apache http://hadoop.apache.org/ (en anglais).
  6. Si la distribution utilisée nécessite une authentification Kerberos, cochez la case Use Kerberos authentication et saisissez les informations de connexion. Sinon, laissez cette case décochée.

    Si vous souhaitez utiliser un fichier Kerberos keytab pour vous identifier, cochez la case Use a keytab to authenticate. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un serveur de Jobs Talend.

    l'utilisateur ou l'utilisatrice exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur ou d'utilisatrice que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier keytab à utiliser.

  7. Dans le champ Connection, saisissez l'URI de la base de données MySQL dans laquelle la table source est stockée. Par exemple, jdbc:mysql://10.42.10.13/mysql.
  8. Dans les champs Username et Password, saisissez les informations d'authentification.
  9. Sous la table Driver JAR, cliquez sur le bouton [+] pour ajouter une ligne. Dans cette ligne, cliquez sur le bouton [...] pour afficher la liste déroulante et sélectionnez le fichier Jar à utiliser. Dans ce scénario, sélectionnez mysql-connector-java-5.1.30-bin.jar.
    Si le bouton [...] n'est pas disponible, cliquez dans la ligne pour le faire apparaître.
  10. Dans le champ Table Name, saisissez le nom de la table source. Dans ce scénario, il s'agit de sqoopmerge.
  11. Dans la liste File format, sélectionnez le format correspondant aux données utilisées, textfile dans ce scénario.
  12. Cochez la case Specify target dir et saisissez le nom du dossier dans lequel vous souhaitez importer les données. Par exemple, /user/ychen/target_old.