セマンティック分析を使用する手順 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

Talend Studioでセマンティック分析を使用して、次のことが行えます。

  • 分析を行うデータにおいて、セマンティックカテゴリーを検討し、複雑なセマンティック関係をクエリする。
  • データにとって最適なインジケーターとパターンで設定済みのテーブル分析を作成する。
  • セマンティックカテゴリーと分析結果を用いて、ログサーバー上のオントロジーリポジトリーをインデックス化し、エンリッチする。

セマンティックを認識したアプローチを用いて、構成済みのテーブル分析を作成する手順は、以下のとおりです。

  1. データベース、区切り記号付きファイル、Hiveのいずれかを問わず、Studioでデータソースへの接続を行う。

    詳細は、データソースへの接続の作成を参照して下さい。

  2. オントロジーインデックスが保存されているログサーバーを起動する。

    詳細は、サーバーの起動と環境設定を参照して下さい。

  3. データソースでテーブルを選択するか、データベース接続でビューを選択し、データカラムのセマンティックカテゴリーを検討する。

    テーブル内のカラムセットを対象にセマンティック分析を開始するというオプションもあります。

    詳細は、データカラムのカテゴリーの検討を参照して下さい。

  4. カラムメタデータとセマンティックカテゴリーをオントロジーリポジトリーからのコンセプトに一致させ、一致結果を出力して、最も関連するコンセプトを示す。

    詳細は、カラムのメタデータおよびセマンティックカテゴリとオントロジーリポジトリー内のコンセプトとの一致を参照して下さい。

  5. カラムの属性(セマンティック)を定義し、カラムメタデータとセマンティックカテゴリーでオントロジーリポジトリーをエンリッチする。

    詳細は、オントロジーリポジトリーのエンリッチメントを参照して下さい。

  6. 推奨されるテーブル分析を実行し、分析結果、および分析対象カラムに使用したインジケーターとパターンで、オントロジーリポジトリーをエンリッチする。

    詳細は、推奨されるテーブル分析の定義を参照して下さい。