システムインジケーターを設定 - 8.0

Talend Data Management Platform 入門ガイド

Version
8.0
Language
日本語
Operating system
Data Management Platform
Product
Talend Data Management Platform
Module
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2024-02-06
このカラム分析では、標準のインジケーターを使用して、メールと電話番号カラムの行、空白、重複値などのシンプル統計を示します。

始める前に

  • Talend StudioProfilingパースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーターの選択)ダイアログボックスを開きます。
  2. [Simple Statistics] (シンプル統計)を展開し、[Row Count] (行数)[Blank Count] (空白数)[Duplicate Count] (重複値)を選択します。[OK]をクリックしてウィザードを閉じます。

    データの一貫性を調べるために、EmailカラムとPhoneカラムの行数、空白値、重複値を確認します。

    それによって、[Analyzed Columns] (分析済みカラム)セクション内のカラムにインジケーターが付加されます。

  3. [Duplicate Count] (重複値)および[Blank Count] (空白数)インジケーターの横にあるアイコンをクリックし、[Upper threshold] (上限しきい値)フィールドを0に設定します。

    EmailカラムとPhoneカラムのしきい値を定義すると、分析結果の重複値と空白値のカウントが赤で書き込まれるため、大変便利です。