ローカルファイルからデータセットを開く - Cloud

Talend Cloud Data Preparation入門ガイド

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Preparation
task
データクオリティとプレパレーション > データクレンジング

顧客データを含んだファイルをインポートし、最初のプレパレーションを作成します。

Talend Cloud Data Preparationにログインすると、[Preparations] (プレパレーション)ビューが表示されます。

このビューにはすべてのプレパレーション、つまり、操作を実行したデータセットが表示されます。今は空の状態ですが、顧客データへの作業はここに保存されます。このビューでは、新しいプレパレーションを追加し、フォルダーに整理できます。

未加工データを含んだ顧客ファイルをインポートするには、次の手順を実行します。

始める前に

このページの左パネルにあるメニューの[Downloads] (ダウンロード)タブからcustomers.xlsxファイルを取得します。

手順

  1. 左パネルのメニューで[Datasets] (データセット)を選択し、データセットのリストを開きます。この時点では空です。
  2. 前にダウンロードしたcustomers.xlsxをインポートする場合は、次のいずれかの操作を行います。
    • [Drop a file or browse] (ファイルをドロップするか参照)ボタンをクリックしてファイルを参照し、データセットを選択します。
    • Talend Cloud Data Preparation画面にデータセットを直接ドラッグ&ドロップします。
    [Add a new dataset] (新しいデータセットを追加)パネルが開きます。ここで、データセットをインポートする前に名前と形式を設定します。
  3. [Dataset name] (データセット名)フィールドにCustomersと入力します。
  4. [Connection] (接続)フィールドは既に入力されています。
    これがローカルデータセットの最初のインポートなので、プロセス中に[Local connection] (ローカル接続)タイプの接続が作成されます。これは基礎の接続となり、どのローカルデータセットのアップロードにも使われます。
  5. オプションとして、該当するフィールドにデータセットの説明を入力します。
  6. フォームの[Format config] (形式設定)セクションで[Auto detect] (自動検出)ボタンをクリックすると、[Format] (形式)情報が自動的に入力されます。
  7. [View sample] (サンプルを表示)ボタンをクリックすると、データセットの最初の50行をプレビューできます。
  8. [Validate] (検証)をクリックしてデータセットの作成を完了します。
  9. 左パネルのメニューで[Preparations] (プレパレーション)を選択し、[Add preparation] (プレパレーションを追加]ボタンをクリックします。
  10. 表示される[Add a preparation] (プレパレーションを追加)パネルで、プレパレーションに名前(この例ではcustomers_preparation)を付けます。[Dataset] (データセット)リストで、前に作成した[Customers] (顧客)データセットを選択します。
  11. [Submit] (送信)をクリックします。

タスクの結果

レシピが空のプレパレーションの形でプレパレーションが開きます。データはまだ変更されていませんが、プレパレーションとして保存されているので、プレパレーションステップの適用を開始できます。

customers.xlsxデータセットをインポートし、[Add preparation] (プレパレーションの追加)ボタンを使って対応するプレパレーションが作成済みのため、customers_preparationへの変更はすべて自動的に保存されます。インポートした未加工データセットについては、[Datasets] (データセット)ビューで表示できます。データは変更されていない状態です。