Big Data : nouvelles fonctionnalités - Cloud - 7.3

Notes de version de Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud API Services Platform
Talend Cloud Big Data
Talend Cloud Big Data Platform
Talend Cloud Data Integration
Talend Cloud Data Management Platform
Talend Cloud Real-Time Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Talend Cloud API Designer
Talend Cloud API Tester
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Data Preparation
Talend Data Stewardship
Talend Management Console
Content
Installation et mise à niveau
Notes de version
Last publication date
2024-02-08

Améliorations apportées à la conception de Jobs Spark

Fonctionnalité

Description

Disponible dans

ADLS Gen2 Azure Data Lake Storage Generation2 est à présent supporté avec les plateformes Big Data suivantes :
  • Databricks V5.5 LTS
  • Cloudera CDH V6.1
  • Hortonworks Data Platform V3.1

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Snowflake Les composants Snowflake pour Spark Batch sont à présent généralement disponibles.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Jeux de données natifs
Dans les Jobs Spark Batch, le support des jeux de données Spark natifs a été ajouté à d'autres composants, afin d'obtenir de meilleures performances. Pour bénéficier de cette amélioration, les utilisateurs et utilisatrices doivent utiliser Spark V2.0 ou supérieure avec les composants suivants :
  • tFileInputParquet et tFileOutputParquet
  • tFileInputDelimited et tFileOutputDelimited
  • tFileInputFullRow
  • tFileInputPositional et tFileInputRegex
  • tSortRow, tExtractDelimitedFields, tExtractPositionalFields, tExtractRegexFields, tExtractXMLField, tExtractJSONFields, tNormalize, tReplace, tReplicate, tSample, tUnite et tSchemaComplianceCheck.
Les composants suivants nécessitent Spark V2.1 ou supérieure pour supporter les jeux de données Spark.
  • tAggregateRow
  • Jointure Left Outer Join dans le tMap, en plus des fonctionnalités du tMap ayant le support des jeux de données depuis la version 7.2 du Studio Talend.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Delta Lake Les composants tDeltaLakeInput et tDeltaLakeOutput sont à présent généralement disponibles.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Apache Spark V2.4 Cette nouvelle version d'Aparch Spark est supportée avec plus de plateformes Big Data dans des Jobs Spark Batch et Spark Streaming. Les plateformes supportant Spark V2.4 sont :
  • Cloudera CDH6.1.1
  • Databricks V5.5
  • Google Cloud Dataproc V1.4

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Statut du Job Avec Databricks, les utilisateurs et utilisatrices peuvent configurer la fréquence à laquelle le Studio demande au cluster Spark le statut des Jobs.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

tS3Configuration Avec Amazon EMR, les utilisateurs et utilisatrices peuvent appliquer une politique de bucket S3.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

tAggregateRow Dans les Jobs Spark Batch, la fonction de compte distinct (Count) et la fonction Sample Standard Deviation Algorithm function ont été ajoutées.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Nouvelles versions des pilotes
Le support des versions suivantes des pilotes a été ajouté dans les composants associés :
  • Pilote Redshift JDBC 1.23.7.1061
  • Pilote MySQL V8.0.18
  • Pilote Teradata JDBC 16.20.00.13
  • Pilote JDBC MariaDB V2.5.3 dans les composants JDBC
  • Pilote JDBC Snowflake 3.11.x

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Nouveaux composants disponibles

Deux nouveaux composants sont disponibles : le tAzureAdlsGen2Input et le tAzureAdlsGen2Output.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Support des plateformes Big Data

Fonctionnalité

Description

Disponible dans

Databricks
  • Databricks V5.5 LTS est à présent supporté par les Jobs Spark.
  • Le support des clusters transitoires Azure Databricks a été ajouté.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Hortonworks Data Platform
  • Hortonworks Data Platform V3.1 est à présent supporté.
  • Les versions V3.x d'Hortonworks Data Platform sont maintenant généralement disponibles parmi les distributions dynamiques.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Google Cloud Dataproc

  • Google Cloud Dataproc V1.4 est supporté.
  • Dans les Jobs Standard, le tGoogleDataprocManage supporte toutes les régions.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Configurations Hadoop personnalisées Lorsqu'ils définissent des connexions à Cloudera ou Hortonworks dans le Repository, les utilisateurs et utilisatrices peuvent à présent spécifier un fichier Jar personnalisé fournissant les paramètres de connexion à l'environnement Hadoop à utiliser.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Autres composants

Fonctionnalité

Description

Disponible dans

Kafka Kafka V2.2.1 est à présent officiellement supporté avec :
  • Cloudera CDH V6.1
  • Hortonworks Data Platform V3.1
  • Les composants Kafka dans les Jobs Standard

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Google BigQuery
  • Dans le tBigQueryBulkExec, les utilisateurs et utilisatrices peuvent à présent déposer des tables avec un compte de service ou leurs identifiants OAuth 2.0.
  • Les composants BigQuery supportent à présent l'API client Google Cloud 1.25.10.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

Couchbase
  • Le tCouchbaseOutput permet à présent aux utilisateurs et utilisatrices d'effectuer des requêtes N1QL avec des paramètres.
  • Les documents non JSON sont supportés.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

CXF

CXF V3.3.4 est à présent supporté dans les composants suivants :

  • tDBFSConnection, tDBFSGet, tDBFSPut
  • tHCatalogInput, tHCatalogLoad, tHCatalogOperation, tHCatalogOutput

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data

MongoDB

Le support de MongoDB V4.2.x a été ajouté aux composants MongoDB dans les Jobs Standard.

Disponible dans :

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Tous les produits Talend incluant Big Data