ローカルファイルからのデータセットの登録 - Cloud

Talend Cloud Data Inventory入門ガイド

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Inventory
task
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
管理と監視 > 接続の管理

自身のデータセットをインベントリーにインポートする作業を開始する準備が整いました。

Talend Cloud Data Inventoryは、データベースやクラウドプラットフォームなど、広範囲の環境やシステムに対する接続を提供します。詳細はTalend Cloudコネクターガイドを参照してください。ただし、エンドツーエンドでフォローできる例を示すために、ローカルファイルの作業を行っていただきます。通常は、データセットをインポートする前に、対応するデータベースへの接続を設定する必要があります。ですが、ローカルファイルをデータセットとしてインポートする時に、ローカル接続がバックグラウンドで作成されるため、処理を簡単に素早く行うことができます。

このシナリオでは、このページの左パネルにあるメニューの[Downloads] (ダウンロード)タブで取得できるmovies.csvファイルに焦点を当てています。選択したロケーションにファイルを保存します。

このデータセットには、世界中の人気映画のリストといくつかの関連情報、およびタイトル、ジャンル、人気、上映時間、公開日などのメタデータが含まれています。目標は、これをアプリケーション内のデータセットのリストに追加し、インタラクションと実際のデータの検出を開始してから、コンテンツの追跡に役立つ新しいメタデータを追加し、インベントリーのサイズが大きくなった時に検索を容易にすることです。

手順

  1. ローカルmovies.csvファイルをインポートし、最初のデータセットを作成するには、使用したい方法に応じて次のいずれかの操作を行います。
    • ファイルをドラッグし、[Datasets] (データセット)画面上の任意の位置にドロップする。
    • [Drag a file or browse] (ファイルをドラッグするか、または参照する)ボタンをクリックし、エクスプローラーを開き、そのロケーションからファイルを選択する。

    ファイルがアップロードされ、moviesデータセットが作成されます。[Overview] (概要)ページが直接開きます。

    エスケープ文字やフィールド区切り記号など、csvファイルプロパティに関する情報はバックグラウンドで自動検出されましたが、いつでも入力できます。

    インポートを可能にするために[Local connection] (ローカル接続)が作成されました。将来のローカルインポートもこの接続に頼ることになります。

  2. 画面左上で、データセット名にマウスを置いて[Edit] (編集)アイコンをクリックします。
  3. movies_gsgという名前を付けて[Submit] (送信)アイコンをクリックします。

タスクの結果

これで、movies_gsgデータセットの詳細を調べる準備ができます。