Big Data - Cloud - 8.0

Talendリリースノート

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud API Services Platform
Talend Cloud Big Data
Talend Cloud Big Data Platform
Talend Cloud Data Integration
Talend Cloud Data Management Platform
Talend Cloud Real-Time Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Cloud API Designer
Talend Cloud API Tester
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Data Preparation
Talend Data Stewardship
Talend Management Console
Talend Studio
Content
インストールとアップグレード
リリースノート
Last publication date
2024-04-16

機能

説明

対象製品

Spark Universal 3.2.xでAmazon EMR 6.6.0と6.7.0をサポート

YarnクラスターモードでSpark 3.2.xと共にSpark Universalを使い、Amazon EMRクラスターでSparkジョブを実行できるようになりました。Sparkジョブの[Spark configuration] (Spark設定)ビューまたは[Hadoop Cluster Connection] (Hadoopクラスター接続)メタデータウィザードのどちらかで設定できます。

このモードを選択すると、Talend Studioは Amazon EMRのバージョン6.6.0および6.7.0と互換性を持つようになります。

対象製品:

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

サブスクリプションベースであり、Big Dataを伴うTalendの全製品

Spark Universal 3.3.xでDatabricksランタイム11.xをサポート

Google Cloud Platform (GCP)、AWS、Azureで、Spark 3.3.xと共にSpark Universalを使い、Databricksのジョブクラスターと汎用クラスターでSpark BacthジョブやStreamingジョブを実行できるようになりました。Sparkジョブの[Spark configuration] (Spark設定)ビューまたは[Hadoop Cluster Connection] (Hadoopクラスター接続)メタデータウィザードのどちらかで設定できます。

このモードを選択すると、Talend StudioはDatabricks 11.xのバージョンと互換性を持つようになります。

本機能の一般公開に伴い、以下のような過去の既知のこの問題は修正されました。
  • tGSConfigurationがSpark Streamingジョブで動作するようになりました。
  • AWSの使用時にtS3ConfigurationがtAvroInputのストレージコンポーネントとして動作するようになりました。
  • Azureの使用時にtAzureFSConfigurationがtAvroInputのストレージコンポーネントとして動作するようになりました。
  • GCPの使用時にtFileInputDelimited、tFileInputJSON、tFileInputParquet、tFileInputPositional、tFileInputRegex、tFileInputXMLがtGSConfigurationと動作するようになりました。

対象製品:

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

サブスクリプションベースであり、Big Dataを伴うTalendの全製品

tRedshiftOutputでBigDecimalをサポート

Spark Batchジョブで、tRedshiftOutputコンポーネントのスキーマにBigDecimal値を使用できるようになりました。

対象製品:

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

サブスクリプションベースであり、Big Dataを伴うTalendの全製品

Spark UniversalによるtGSConfigurationをサポート

tGSConfigurationコンポーネントを使い、他の入出力コンポーネントでGoogle Storageにアクセスできるようになりました。この機能はSpark BatchとSpark Streamingの両方のジョブに適用されています。

対象製品:

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

サブスクリプションベースであり、Big Dataを伴うTalendの全製品

スキーマレジストリーをサポート

以下のコンポーネントを使ったSpark Streamingジョブで、スキーマレジストリーを使用できるようになりました。
  • tKafkaConfiguration
  • tKafkaInputAvro

スキーマレジストリーを使えば、Talend StudioがAvroレコードの情報を登録できるようになります。

対象製品:

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

サブスクリプションベースであり、Big Dataを伴うTalendの全製品

S3 Selectをサポート

YARNクラスター(Amazon EMRクラスター付き)モードまたはDatabricksモードで、Spark Universalを使って実行するSparkジョブでtS3Configurationをストレージコンポーネントとして使用する場合、tFileInputDelimitedとtFileInputJSONでS3 Selectを使用できるようになりました。S3 Selectを使用すれば、Spark SQLクエリーを使ってS3から取得するデータ量を減らすことができます。

DatabricksでSparkジョブを実行する場合は、S3バケットがクラスターと同じリージョンにあることが必要です。そうでないとクラスター側でS3の例外が発生します。

対象製品:

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

サブスクリプションベースであり、Big Dataを伴うTalendの全製品