セマンティック認識分析を使用する手順 - Cloud

Talend Cloud API Services Platform Studio ユーザーガイド

Version
Cloud
Language
日本語 (日本)
EnrichDitaval
API Services Platform
Product
Talend Cloud
Module
Talend Studio
Content
ジョブデザインと開発

Talend Studioでセマンティック認識分析を使用して、次のことが行えます。

  • 分析を行うデータにおいて、セマンティックカテゴリーを検討し、複雑なセマンティック関係をクエリーする。
  • データにとって最適なインジケーターとパターンで設定済みのテーブル分析を作成する。
  • セマンティックカテゴリーと分析結果を用いて、ログサーバー上のオントロジーリポジトリーをインデックス化およびエンリッチ化する。

セマンティックを認識したアプローチを用いて、構成済みのテーブル分析を作成する手順は、以下のとおりです。

  1. データベース、区切り付きファイル、Hiveのいずれかを問わず、Studioでデータソースへの接続を行う。

    詳細は、データソースへの接続の作成をご覧ください。

  2. オントロジーインデックスが保存されているログサーバーを起動する。

    詳細は、サーバーの起動と環境設定をご覧ください。

  3. データソースでテーブルを選択するか、データベース接続でビューを選択し、データカラムのセマンティックカテゴリーを検討する。

    テーブル内のカラムセットを対象にセマンティック認識分析を開始するというオプションもあります。

    詳細は、データカラムのカテゴリーの検討をご覧ください。

  4. カラムメタデータとセマンティックカテゴリーをオントロジーリポジトリーからのコンセプトに一致させ、一致結果を出力して、最も関連するコンセプトを示す。

    詳細は、カラムのメタデータおよびセマンティックカテゴリーとオントロジーリポジトリー内のコンセプトとの一致をご覧ください。

  5. カラムの属性(セマンティック)を定義し、カラムメタデータとセマンティックカテゴリーでオントロジーリポジトリーをエンリッチ化する。

    詳細は、オントロジーリポジトリーのエンリッチメントをご覧ください。

  6. 推奨されるテーブル分析を実行し、分析結果、および分析対象カラムに使用したインジケーターとパターンで、オントロジーリポジトリーをエンリッチ化する。

    詳細は、推奨されるテーブル分析の定義をご覧ください。