顧客データを含んだファイルをインポートし、最初のプレパレーションを作成します。
Talend Cloud Data Preparationにログインすると、[Preparations] (プレパレーション)ビューが表示されます。
このビューにはすべてのプレパレーション、つまり操作を行ったデータセットが表示されます。今は空の状態ですが、顧客データへの作業はここに保存されます。このビューでは、新しいプレパレーションを追加し、フォルダーに整理できます。
生データを含んだ顧客ファイルをインポートするには、次の手順を実行します。
手順
-
左パネルのメニューで[Datasets] (データセット)を選択し、データセットのリストを開きます。この時点では空です。
-
前にダウンロードしたcustomers.xlsxをインポートする場合は、次のいずれかの操作を行います。
- [Drop a file or browse] (ファイルをドロップするか参照)ボタンをクリックしてファイルを参照し、データセットを選択します。
- Talend Cloud Data Preparation画面にデータセットを直接ドラッグ&ドロップします。
[Overview] (概要)タブが開き、データセットに関する情報が表示されます。
-
画面左側で[Configure] (設定)タブを開きます。
-
[Dataset name] (データセット名)フィールドにCustomersと入力します。
-
[Connection] (接続)フィールドは既に入力されています。
これがローカルデータセットの最初のインポートなので、プロセス中に[Local connection] (ローカル接続)タイプの接続が作成されます。これは基礎の接続となり、どのローカルデータセットのアップロードにも使われます。
-
フォームの[Format config] (形式設定)セクションで[Auto detect] (自動検出)ボタンをクリックすると、[Format] (形式)情報が自動的に入力されます。
-
[View sample] (サンプルを表示)ボタンをクリックすると、データセットの最初の50行をプレビューできます。
-
[Validate] (検証)をクリックしてデータセットの作成を完了します。
-
左パネルのメニューで[Preparations] (プレパレーション)を選択し、[Add preparation] (プレパレーションを追加]ボタンをクリックします。
-
開いた[Add a preparation] (プレパレーションを追加)パネルで、前に作成したCustomersデータセットを選択します。
[Preparation name] (プレパレーション名)フィールドは自動で入力されますが、このプレパレーション名は変更することもできます。 この例では
Customers Preparationが使われます。
-
[Submit] (送信)をクリックします。
タスクの結果
レシピが空のプレパレーションの形でプレパレーションが開きます。データはまだ変更されていませんが、プレパレーションとして保存されているので、プレパレーションステップの適用を開始できます。
customers.xlsxデータセットをインポートし、[Add preparation] (プレパレーションを追加)ボタンを使って対応するプレパレーションが作成済みのため、Customers Preparationへの変更はすべて自動的に保存されます。インポートした生データセットについては、[Datasets] (データセット)ビューで表示できます。データは変更されていない状態です。