ローカルファイルからのデータセットの登録 - Cloud

Talend Cloud Data Inventory入門ガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Inventory
Content
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
管理と監視 > 接続の管理
Last publication date
2024-03-21

自身のデータセットをインベントリーにインポートする作業を開始する準備が整いました。

Talend Cloud Data Inventoryは、データベースやクラウドプラットフォームなど、広範囲の環境やシステムに対する接続を提供します。詳細は、Talend Cloudアプリコネクターガイドをご覧ください。ただし、エンドツーエンドでフォローできる例を示すために、ローカルファイルの作業を行っていただきます。通常は、データセットをインポートする前に、対応するデータベースへの接続を設定する必要があります。ですが、ローカルファイルをデータセットとしてインポートする時に、ローカル接続がバックグラウンドで作成されるため、処理を簡単にすばやく行うことができます。

このシナリオでは、このページの左パネルにあるメニューの[Downloads] (ダウンロード)タブで取得できるmovies.csvファイルに焦点を当てています。選択したロケーションにファイルを保存します。

このデータセットには、世界中の人気映画のリストといくつかの関連情報、およびタイトル、ジャンル、人気、上映時間、公開日などのメタデータが含まれています。目標は、これをアプリケーション内のデータセットのリストに追加し、インタラクションと実際のデータの検出を開始してから、コンテンツの追跡に役立つ新しいメタデータを追加し、インベントリーのサイズが大きくなった時に検索を容易にすることです。

手順

  1. ローカルmovies.csvファイルをインポートし、最初のデータセットを作成するには、使用したい方法に応じて次のいずれかの操作を行います。
    • ファイルをドラッグし、[Datasets] (データセット)画面上の任意の位置にドロップする。
      アプリケーションにファイルをドロップしようとしている時のインターフェイス。
    • [Drag a file or browse] (ファイルをドラッグまたは参照)ボタンをクリックし、エクスプローラーを開き、そのロケーションからファイルを選択する。
      [Drag a file or browse] (ファイルをドラッグまたは参照)ボタン。

    ファイルがアップロードされ、moviesデータセットが作成されます。[Overview] (概要)ページが直接開きます。

    エスケープ文字やフィールド区切りなど、csvファイルプロパティに関する情報はバックグラウンドで自動検出されましたが、いつでも入力できます。

    インポートを可能にするために[Local connection] (ローカル接続)が作成されました。将来のローカルインポートもこの接続に頼ることになります。

  2. 画面左上で、データセット名にマウスを置いて[Edit this dataset] (このデータセットを編集)アイコンをクリックします。
  3. movies_gsgという名前を付けて[Validate] (検証)アイコンをクリックします。

タスクの結果

これで、movies_gsgデータセットの詳細を調べる準備ができます。
movies_gsgデータセットの詳細のビュー。