Talend Data Preparationでサポートされているファイル形式 - 7.3

Talend Data Preparationユーザーガイド

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2023-11-29
Talend Data Preparationでは、データセットのソースとして使用するために、また、プレパレーションの結果をエクスポートする時は出力として使用するために、さまざまな形式がサポートされています。

ローカルファイルから

次の種類のファイルをインポートしてデータセットとして使用できます。

  • .xlsまたは.xlsx
  • 区切り付きのファイル
注: 固定長ファイルはサポートされていません。

ローカルファイルに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3

詳細は、ローカルファイルからのデータセットの追加をご覧ください。

Talendジョブから

上記のファイルタイプのほか、TalendTalend Studioジョブから直接作成されたデータセットを使用できます。

それには、Talend Studioジョブの出力としてtDatasetOutputコンポーネントを使用します。

その後、次のいずれかを実行できます。

  • ジョブをTalend Studioで直接実行する。詳細は、Data Preparationコンポーネントのドキュメンテーションをご覧ください。
  • ライブデータセットファンクションを使ってTalend Administration Centerを介して実行し、Talend Data Preparationで直接データにアクセスする。詳細は、「ライブデータセットを使って作業」を参照してください。

Talendに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3

データセットから

Talend Data Preparationはさまざまなデータベースに接続し、新しいデータセットを作成するためのソースとして使用できます。データはデータベースにずっと保存され続け、サンプルだけがオンデマンドで取得されます。

データベースデータセットに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3
  • 区切り付きのファイルとしてのHDFS、AvroParquet

詳細は、データベースからデータセットを追加を参照してください。

HDFSから

Hadoopファイルシステム(HDFS)に保存されたデータにアクセスし、そのデータをデータセットの形でTalend Data Preparationインターフェイスに直接インポートできます。

HDFSに保存されている以下のファイルタイプをインポートできます。

  • 区切り付きのファイル
  • .xlsx
  • Avro
  • Parquet

HDFSファイルに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3
  • 区切り付きのファイルとしてのHDFS、AvroParquet

詳細は、「HDFSからデータセットを追加」を参照してください。

Salesforceから

Salesforceに保存されたデータにアクセスし、そのデータをデータセットの形でTalend Data Preparationインターフェイスに直接インポートできます。

Salesforceデータセットに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3

詳細は、Salesforceからのデータセットの追加をご覧ください。

Amazon S3から

Amazon S3に保存されたデータにアクセスし、そのデータをデータセットの形でTalend Data Preparationインターフェイスに直接インポートできます。

Amazon S3に保存されている以下のファイルタイプをインポートできます。

  • 区切り付きのファイル
  • .xlsx
  • Avro
  • Parquet

Amazon S3ファイルに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3
  • 区切り付きのファイルとしてのHDFS、AvroParquet

詳細は、Amazon S3からのデータセットの追加を参照してください。

Azure Data Lake Storage Gen2から

ADLS Gen2に保存されたデータにアクセスし、そのデータをデータセットの形式でTalend Data Preparationインターフェイスに直接インポートできます。

ADLS Gen2に保存されている以下のファイルタイプをインポートできます。

  • 区切り付きのローカルファイル
  • Avro
  • Parquet
  • JSON

ADLS Gen2データセットに基づくプレパレーションは、以下の形式にエクスポートできます。

  • 区切り付きのローカルファイル
  • ローカル.xlsx
  • ローカルTableau
  • Amazon S3

詳細は、Azure DLS Gen2からデータセットを追加をご覧ください。