Versions des distributions de plateformes supportées pour les Jobs Talend avec Big Data - 7.1

Guide d'installation de Talend Data Fabric pour Linux

EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
Installation et mise à niveau
EnrichPlatform
Studio Talend
Talend Activity Monitoring Console
Talend Administration Center
Talend Artifact Repository
Talend CommandLine
Talend Data Preparation
Talend Data Stewardship
Talend DQ Portal
Talend ESB
Talend Identity and Access Management
Talend Installer
Talend JobServer
Talend Log Server
Talend MDM Server
Talend MDM Web UI
Talend Repository Manager
Talend Runtime
Talend SAP RFC Server

En général, Talend certifie une version spécifique pour un vendeur de distribution Big Data (Hadoop). Ces versions sont donc celles qu'il est recommandé d'utiliser. Pour des mises à niveau incrémentales et des service packs d'un vendeur donné, Talend dépend des déclarations de compatibilité des vendeurs pour assurer que les logiciels Talend fonctionnent correctement. Lorsqu'une compatibilité est déclarée, Talend supporte également cette version dans ses accords sur les niveaux de service. Si une incompatibilité est vérifiée par un vendeur Hadoop, Talend considère que de nouveaux tests et une mise à niveau peuvent être nécessaires.

Si le support de la distribution Hadoop que vous souhaitez utiliser n'est pas disponible dans votre Studio Talend, il peut être disponible via une mise à jour. Pour plus d'informations à ce sujet, consultez Talend Help Center (en anglais).

Si vous utilisez une distribution Cloudera ou Hortonworks, vous pouvez également ajouter votre distribution dans les paramètres de distributions dynamiques dans le Studio. Pour plus d'informations, consultez Ajouter dynamiquement la dernière plateforme Big Data. Les distributions dynamiques ainsi ajoutées sont généralement des versions mineures d'une mise à jour majeure certifiée Talend de votre distribution. Talend dépend des déclarations de compatibilité des vendeurs pour assurer la compatibilité du Studio avec ces versions mineures et fournit donc un support officiel pour les cas d'utilisation pouvant être produits dans ces versions mineures ainsi que dans les versions certifiées Talend.
  • Les distributions dynamiques pour HDP 3.x et CDH 6.x sont disponibles en aperçu technique.

  • Sur la liste des versions de distribution, certaines versions ont un libellé Builtin. Ces versions ont été ajoutées par Talend via le mécanisme de distribution dynamique et livrées avec le Studio lors de sa mise à jour. Elles sont certifiées par Talend et sont donc officiellement supportées et prêtes à l'emploi.

Distributions Hadoop

  •  : officiellement supportée.
  •  : non officiellement supportée.
  •  : l'option Kinit de Kerberos est supportée par le Studio.
  •  : l'option Kinit de Kerberos et l'option Keytab de Kerberos sont supportées par le Studio.

1. Permet la connexion entre le Studio et une distribution Hadoop personnalisée qui n'est pas encore officiellement supportée dans le Studio. Pour plus d'informations, consultez les sections décrivant comment se connecter à une distribution Hadoop personnalisée, dans le Guide de prise en main de Talend Big Data, ou la documentation du composant correspondant créant une connexion à une distribution Hadoop, comme le tHDFSConnection.

2. Pour cette version de MapR, le mécanisme de ticket de sécurité de MapR est supporté par le Studio.

3. MapR 6 ne supporte plus HBase mais supporte à présent MapR-DB. Pour plus d'informations, consultez https://maprdocs.mapr.com/home/ReleaseNotes/install_upgrade_notes.html.

4. Les versions d'Amazon EMR supportées par le composant tAmazonEMRManage sont les versions 4.0.0, 4.1.0, 4.2.0, 4.5.0, 4.6.0, 4.9.2 et 5.11.0.

5. Version officiellement supportée de Cloudera. D'autres versions de Cloudera peuvent être compatibles, grâce à la rétrocompatibilité de Cloudera sur les branches Cloudera V5.X .

6. HDFS dans Qubole est éphémère est généralement utilisé pour stocker temporairement les données intermédiaires avant transfert dans un système de stockage persistant, comme S3. Un Job Talend pour Apache Spark peut écrire des données dans ce système HDFS, mais le tHDFSConfiguration ne le supporte pas.

7. Cette plateforme Cloud Big Data n'est pas disponible dans les assistants Metadata dans le Repository mais est supportée dans les composants.

8. La perspective Profiling ne supporte pas le mode de connexion Embedded sur les distributions Hive. Ce mode est disponible pour les développeurs Hadoop principalement à des fins de test. Le Studio peut ne pas s'exécuter correctement en mode Embedded.

Tableau 1. Distributions communes
  HBase HCatalog HDFS Hive 8 Oozie Pig Spark Sqoop Talend MapReduce
Standalone YARN
HDP V2.4.0

V1.6

V2.5.0

V1.6

V2.6.0

V1.6 et V2.1

Cloudera CDH 5.5 (mode YARN)

V1.5 V1.5

CDH 5.6 (mode YARN)

V1.5 V1.5

CDH 5.7 (mode YARN)

V1.6 V1.6

CDH 5.8 (mode YARN)

V1.6 V1.6 et V2.0

CDH 5.10 (mode YARN)

V1.6 et V2.1 V1.6 et V2.1

CDH 5.12.1 (mode YARN)

V2.2 V2.2

CDH 5.13.0

V2.2 V2.2

MapR 5.0.0 (mode YARN) 2

V1.3 V1.3

5.1.0 (mode YARN) 2

V1.5 V1.5

5.2.0 (mode YARN) 2

V1.6 V1.6

6.0.0 (mode YARN) 2 3

V2.1 V2.1

6.0.1 / MEP 5.0 (YARN mode) 2 3

V2.2 V2.2

Amazon EMR 4 EMR 4.5.0 (Apache 2.7.2)

V1.6
EMR 4.6.0 (Apache 2.7.2)

V1.6
EMR 5.0.0 (Apache 2.7.2)

V2.0
EMR 5.5.0 (Apache 2.7.3)

V2.1
EMR 5.8.0 (Apache 2.7.3)

V2.2
EMR 5.15.0 (Hadoop 2.8.3)