セマンティックを認識した分析を使用する手順 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

Studioでセマンティックを認識した分析を使用して、次のことが行えます。

  • 分析を行うデータにおいて、セマンティックカテゴリを検討し、複雑なセマンティック関係をクエリする。

  • データにとって最適なインジケーターとパターンで設定済みのテーブル分析を作成する。

  • セマンティックカテゴリと分析結果を用いて、ログサーバー上のオントロジーリポジトリをインデックス化し、エンリッチする。

    セマンティックを認識した分析で使用されるすべての辞書インデックスと正規表現のカテゴリのリストは、 List of the indexes and regex categories used in the Semantic-aware analysis (https://help.talend.com)でドキュメンテーションを参照して下さい。

    オントロジーリポジトリのコンテンツについては、 The ontology repository (https://help.talend.com)でドキュメンテーションを参照して下さい。

セマンティックを認識したアプローチを用いて、構成済みのテーブル分析を作成する手順は、以下のとおりです。

  1. データベース、区切り記号付きファイル、Hiveのいずれかを問わず、Studioでデータソースへの接続を行う。

    詳細は、データソースへの接続の作成を参照して下さい。

  2. オントロジーインデックスが保存されているログサーバーを起動する。

    詳細は、サーバーの起動と環境設定を参照して下さい。

  3. データソースでテーブルを選択するか、データベース接続でビューを選択し、データカラムのセマンティックカテゴリを検討する。

    テーブル内のカラムセットを対象にセマンティックを認識した分析を開始するというオプションもあります。

    詳細は、データカラムのカテゴリの検討を参照して下さい。

  4. カラムメタデータとセマンティックカテゴリをオントロジーリポジトリからのコンセプトに一致させ、一致結果を出力して、最も関連するコンセプトを示す。

    詳細は、カラムのメタデータおよびセマンティックカテゴリとオントロジーリポジトリ内のコンセプトとの一致を参照して下さい。

  5. カラムの属性(セマンティック)を定義し、カラムメタデータとセマンティックカテゴリでオントロジーリポジトリをエンリッチする。

    詳細は、オントロジーリポジトリのエンリッチメントを参照して下さい。

  6. 推奨されるテーブル分析を実行し、分析結果、および分析対象カラムに使用したインジケーターとパターンで、オントロジーリポジトリをエンリッチする。

    詳細は、推奨されるテーブル分析の定義を参照して下さい。