Améliorations apportées à la conception de Jobs Spark
Fonctionnalité |
Description |
---|---|
Delta Lake | Les composants tDeltaLakeInput et tDeltaLakeOutput ont été créés afin de tirer parti de cette couche de stockage open source embarquant des transactions ACID dans des projets Big Data sur Apache Spark. Avertissement : Cette fonctionnalité est au stade d'aperçu technique.
|
Apache Spark V2.4 | La nouvelle version d'Apache Spark est supportée dans le mode Local et dans les Jobs Spark Batch et Spark Streaming avec Cloudera CDS V6.1. |
Databricks |
|
Snowflake | Création des composants Snowflake pour Spark Batch. Avertissement : Cette fonctionnalité est au stade d'aperçu technique.
|
Elasticsearch | Les versions V5.6.x et V6.4.x d'Elasticsearch sont supportées. |
Sécurité du Cloud |
|
tFileInputDelimited | les utilisateurs et utilisatrices peuvent cocher une case pour permettre au cluster Spark d'utiliser plusieurs exécuteurs afin de lire des fichiers CSV volumineux en parallèle. |
Support des plateformes Big Data
Fonctionnalité |
Description |
---|---|
Cloudera |
|
MapR | Le support pour MapR a été mis à jour dans MapR V6.1 avec MEP (MapR Ecosystem Pack) V6.1 |
Autres composants
Fonctionnalité |
Description |
---|---|
Google BigQuery |
|
API CouchBase |
|
Intégration et déploiement continus
Fonctionnalité |
Description |
---|---|
Intégration et déploiement continus : CommandLine léger et installation légère |
L'installation de Talend CommandLine n'est plus requise comme le référentiel contenant l'application. Les plug-ins Maven Talendpeuvent à présent être hébergés sur votre serveur local et automatiquement installés durant le processus de build. Pour améliorer les performances et l'utilisation des ressources, la taille de Talend CommandLine a été réduite de moitié. |