ローカルファイルからデータセットを開く - Cloud

Talend Cloud Data Preparation入門ガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-11

顧客データを含んだファイルをインポートし、最初のプレパレーションを作成します。

Talend Cloud Data Preparationにログインすると、[Preparations] (プレパレーション)ビューが表示されます。

このビューにはすべてのプレパレーション、つまり操作を行ったデータセットが表示されます。今は空の状態ですが、顧客データへの作業はここに保存されます。このビューでは、新しいプレパレーションを追加し、フォルダーに整理できます。

生データを含んだ顧客ファイルをインポートするには、次の手順を実行します。

始める前に

customers.xlsxファイルをダウンロードします。

手順

  1. 左パネルのメニューで[Datasets] (データセット)を選択し、データセットのリストを開きます。この時点では空です。
  2. 前にダウンロードしたcustomers.xlsxをインポートする場合は、次のいずれかの操作を行います。
    • [Drop a file or browse] (ファイルをドロップするか参照)ボタンをクリックしてファイルを参照し、データセットを選択します。
    • Talend Cloud Data Preparation画面にデータセットを直接ドラッグ&ドロップします。
    [Overview] (概要)タブが開き、データセットに関する情報が表示されます。
  3. 画面左側で[Configure] (設定)タブを開きます。
  4. [Dataset name] (データセット名)フィールドにCustomersと入力します。
  5. [Connection] (接続)フィールドは既に入力されています。
    これがローカルデータセットの最初のインポートなので、プロセス中に[Local connection] (ローカル接続)タイプの接続が作成されます。これは基礎の接続となり、どのローカルデータセットのアップロードにも使われます。
  6. フォームの[Format config] (形式設定)セクションで[Auto detect] (自動検出)ボタンをクリックすると、[Format] (形式)情報が自動的に入力されます。
  7. [View sample] (サンプルを表示)ボタンをクリックすると、データセットの最初の50行をプレビューできます。
  8. [Validate] (検証)をクリックしてデータセットの作成を完了します。
  9. 左パネルのメニューで[Preparations] (プレパレーション)を選択し、[Add preparation] (プレパレーションを追加]ボタンをクリックします。
  10. 開いた[Add a preparation] (プレパレーションを追加)パネルで、前に作成したCustomersデータセットを選択します。
    [Add a preparation] (プレパレーションを追加)パネル。
    [Preparation name] (プレパレーション名)フィールドは自動で入力されますが、このプレパレーション名は変更することもできます。 この例ではCustomers Preparationが使われます。
  11. [Submit] (送信)をクリックします。

タスクの結果

レシピが空のプレパレーションの形でプレパレーションが開きます。データはまだ変更されていませんが、プレパレーションとして保存されているので、プレパレーションステップの適用を開始できます。

customers.xlsxデータセットをインポートし、[Add preparation] (プレパレーションを追加)ボタンを使って対応するプレパレーションが作成済みのため、Customers Preparationへの変更はすべて自動的に保存されます。インポートした生データセットについては、[Datasets] (データセット)ビューで表示できます。データは変更されていない状態です。

レシピが空であるプレパレーションの形式によるデータセット。