システムまたはユーザー定義インジケーターの設定 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

始める前に

Talend StudioProfilingパースペクティブの分析エディターでカラム分析が開いていること。

手順

  1. 分析エディターの[Data preview] (データプレビュー)ビューで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーターの選択)ダイアログボックスを開きます。
  2. [Indicator Selection] (インジケーターの選択)ダイアログボックスから、次の手順に従います。
    注:

    SQLエンジンで分析を実行する場合、データベースの日付型のカラムに対してパターン頻度統計を使うことは有用ではありません。すべての日付が1種類の形式で表示されるため、このインジケーターによってデータクオリティ問題が検出されることはありません。

    分析の日付カラムに[Date Pattern Frequency] (日付パターン頻度)を付けると、分析結果から日付の正規表現を生成できます。

  3. OKをクリックします。
    [Analyzed Columns] (分析済みカラム)ビューの分析されるカラムに、選択したインジケーターが付加されます。
    この例の分析により、以下が提供され、計算されます。
    • 全カラムのシンプル統計。
    • テキスト統計インジケーターを用いたテキストフィールドの特性、およびインジケーターにおける各個別レコードの最頻値の数。
    • 頻度の高いパターンと低いパターンを示すemailカラム内のパターン。これは、パターン頻度統計インジケーターを使ってクオリティ問題をさらに容易に特定するためのものです。
    • 要約統計インジケーターを使った、total_salesカラム内の数値データの範囲、四分位範囲、平均、中央値。
    • 売上額における1から9までの数字の頻度。これは、不正検出インジケーターを使って不正を検出するためのものです。