テストデータセットの作成 - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

手動で入力したスキーマに基づいてデータセットを作成する方法について説明します。

テストデータセットは、実際のレコードストアを必要とせずに固定された値のセットを提供するのに役立ち、製品を簡単に試せるようにしています。

手順

  1. [Datasets] (データセット) > [ADD DATASET] (データセットの追加)に進みます。
  2. [Add a new dataset] (新しいデータセットを追加)パネルで、テストデータセットに名前を付けます。
  3. 前に作成したもので、データの追加先とするテスト接続を選択します。
  4. データの形式を選択します。
    • CSV: その場合、スキーマフィールドの想定される形式は次のとおりです。
      • [A-Za-z_]の文字で始まる必要があります
      • 含めることができるのは[A-Za-z0-9_]のみです
      • 使用できる区切り記号はセミコロンのみです
      例: First_Name;Last_Name;Phone1;Phone2;Address;State;Company
      注: フォーマットを指定しない場合、デフォルトで汎用的なものが作成されます。
    • JSON: その場合は、JSON値の特定の形式に従い、一貫性を持たせる必要があります。レコードの並び順、1件ずつ、区切りかどうか、改行ごと。各レコードは1行でなくてもかまいません。最後に、テキストエリアのデータは角括弧付きの一般的なJSON文書ではありません。

      例:

        {
          "Id": 3146717,
          "PosTime": 1525097499899,
          "Latitude": 48.8585,
          "Longitude": 2.4921,
          "Operator": "Air France"
        }
        {
          "Id": 3757865,
          "PosTime": 1525097474634,
          "Latitude": 48.5018,
          "Longitude": 2.2246,
          "Operator": "Lufthansa"
        }
    • AVRO: この場合、Avroレコードのスキーマ、つまりAvro Apacheドキュメントに記述された特定の構文を持つJSONドキュメントも入力する必要があります。
  5. [Values] (値)エリアで、データを入力するか貼り付けます。
    データのサイズは32KBを超えることはできません。
  6. (オプション) [VIEW SAMPLE] (サンプルの表示)をクリックして、データの有効性を確認します。
  7. [VALIDATE] (検証)をクリックしてデータセットを保存します。

タスクの結果

データセットの概要パネルにリダイレクトされます。さまざまな情報やメタデータがここに表示されます。

データセットのコンテンツを視覚化して把握する場合は、[Sample] (サンプル)パネルを開きます。自分のデータが有効かどうかチェックできます。