システムインジケーターを設定 - 7.3

Talend Real-Time Big Data Platform 入門ガイド

Version
7.3
Language
日本語
Operating system
Real-Time Big Data Platform
Product
Talend Real-Time Big Data Platform
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2023-07-24
このカラム分析では、標準のインジケーターを使用して、メールと電話番号カラムの行、空白、重複値などのシンプル統計を示します。

始める前に

  • Studioで Profiling パースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーター選択)ダイアログボックスを開きます。
  2. [Simple Statistics] (シンプル統計)を展開し、[Row Count] (行数)[Blank Count] (空白値)[Duplicate Count] (重複値)を選択します。[OK]をクリックしてウィザードを閉じます。

    データの一貫性を調べるために、EmailカラムとPhoneカラムの行数、空白値、重複値を確認します。

    それによって、[Analyzed Columns] (分析済みカラム)セクション内のカラムにインジケーターが付加されます。

  3. [Duplicate Count] (重複値)および[Blank Count] (空白値)インジケーターの横にあるアイコンをクリックし、[Upper threshold] (上限しきい値)フィールドを0に設定します。

    EmailカラムとPhoneカラムのしきい値を定義すると、分析結果の重複値と空白値のカウントが赤で書き込まれるため、大変便利です。