手動で入力したスキーマに基づいてデータセットを作成する方法について説明します。
テストデータセットは、実際のレコードストアを必要とせずに固定された値のセットを提供するのに役立ち、製品を簡単に試せるようにしています。
手順
-
に進みます。
-
[Add a new dataset] (新しいデータセットを追加)パネルで、テストデータセットに名前を付けます。
-
前に作成したもので、データの追加先とするテスト接続を選択します。
-
データの形式を選択します。
- CSV: その場合、スキーマフィールドの想定される形式は次のとおりです。
- [A-Za-z_]の文字で始まる必要があります
- 含めることができるのは[A-Za-z0-9_]のみです
- 使用できる区切りはセミコロンのみです
例:
First_Name;Last_Name;Phone1;Phone2;Address;State;Company 注: 形式を指定しない場合、デフォルトでジェネリックなものが作成されます。
- JSON: その場合は、JSON値の特定の形式に従い、一貫性を持たせる必要があります。レコードの並び順、1件ずつ、区切りかどうか、改行ごと。各レコードは1行でなくても構いません。最後に、テキストエリアのデータは角括弧付きの一般的なJSON文書ではありません。
例:
{
"Id": 3146717,
"PosTime": 1525097499899,
"Latitude": 48.8585,
"Longitude": 2.4921,
"Operator": "Air France"
}
{
"Id": 3757865,
"PosTime": 1525097474634,
"Latitude": 48.5018,
"Longitude": 2.2246,
"Operator": "Lufthansa"
}
- AVRO: この場合は、Avroレコードのスキーマ(つまりAvro Apacheドキュメンテーションに記述されている特定構文を持つJSONドキュメント)も入力する必要があります。
-
[Values] (値)エリアで、データを入力するか貼り付けます。
データのサイズは32KBを超えることはできません。
-
(オプション) [View sample] (サンプルを表示)をクリックして、データの有効性を確認します。
-
[Validate] (検証)をクリックしてデータセットを保存します。
タスクの結果
データセットの概要パネルにリダイレクトされます。さまざまな情報やメタデータがここに表示されます。
データセットのコンテンツを視覚化して把握する場合は、[Sample] (サンプル)パネルを開きます。自分のデータが有効かどうかチェックできます。
データセットのサンプルパネル