データセットを作成 - Cloud

Talend Cloud Data Inventoryユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Inventory
Content
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
Last publication date
2024-02-28
データセットを最初から作成する方法を説明します。

手順

  1. [Datasets] (データセット) > [Add dataset] (データセットを追加)に進みます。
  2. [Add a new dataset] (新しいデータセットを追加)パネルで、データセットに名前を付け、データセットを作成する接続を選択します。
    まだ存在していない接続からデータセットを追加する場合は、[Connection] (接続)ドロップダウンリストからこの接続を直接作成できます。
  3. 必要に応じて説明を追加し、データセットの必要なプロパティを入力します。
    • S3接続やHDFSファイルストレージ接続の場合は、[Auto detect] (自動検出)ボタンを使えば、データの形式(CSV、Excel、Avro、Parquet)を自動的に検出して入力できます。

    • クエリー型データベースを変換先データセットとして使用できないため、データベースクエリーとテーブルタイプに互換性がありません。そのため、保存後にデータベース設定を別の種類に変更しようとすると、パイプラインでこの操作が可能かどうかを確認するチェックがトリガーされます。

  4. (オプション) [View sample] (サンプルを表示)をクリックすると、データセットサンプルの最初のレコードがプレビュー表示されます。
  5. [Validate] (検証)をクリックしてデータセットを保存します。

タスクの結果

新しいデータセットが[Datasets] (データセット)ページのリストに追加され、使用できる状態になります。
作成したデータセットの詳細ビューに移動して、さまざまな形式でサンプルを表示できます。
  • [Grid] (グリッド): このビューから、表形式でデータの最初の10,000件のレコードを表示できます。
  • [Hierarchy] (階層): このビューから、データの最初の10,000件のレコードをツリー状の構造に表示できます
  • [Raw] (生): このビューから、データの最初の10,000件のレコードの未変更のバージョンとフィルタリングされていないものを表示できます。