セマンティックを認識した分析を使用する手順 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

Talend Studioでセマンティックを認識した分析を使用して、次のことが行えます。

  • 分析を行うデータにおいて、セマンティックカテゴリーを検討し、複雑なセマンティック関係をクエリーする。
  • データにとって最適なインジケーターとパターンで設定済みのテーブル分析を作成する。
  • セマンティックカテゴリーと分析結果を用いて、ログサーバー上のオントロジーリポジトリーをインデックス化およびエンリッチ化する。

セマンティックを認識したアプローチを用いて、構成済みのテーブル分析を作成する手順は、以下のとおりです。

  1. データベース、区切り記号付きファイル、Hiveのいずれかを問わず、Studioでデータソースへの接続を行う。

    詳細は、データソースへの接続の作成を参照してください。

  2. オントロジーインデックスが保存されているログサーバーを起動する。

    詳細は、サーバーの起動と環境設定を参照してください。

  3. データソースでテーブルを選択するか、データベース接続でビューを選択し、データカラムのセマンティックカテゴリーを検討する。

    テーブル内のカラムセットを対象にセマンティックを認識した分析を開始するというオプションもあります。

    詳細は、データカラムのカテゴリの検討を参照してください。

  4. カラムメタデータとセマンティックカテゴリーをオントロジーリポジトリーからのコンセプトに一致させ、一致結果を出力して、最も関連するコンセプトを示す。

    詳細は、カラムのメタデータおよびセマンティックカテゴリーとオントロジーリポジトリー内のコンセプトとの一致を参照してください。

  5. カラムの属性(セマンティック)を定義し、カラムメタデータとセマンティックカテゴリーでオントロジーリポジトリーをエンリッチ化する。

    詳細は、オントロジーリポジトリーのエンリッチ化を参照してください。

  6. 推奨されるテーブル分析を実行し、分析結果、および分析対象カラムに使用したインジケーターとパターンで、オントロジーリポジトリーをエンリッチ化する。

    詳細は、推奨されるテーブル分析の定義を参照してください。