システムインジケーターを設定 - 7.3

Talend Big Data Platform 入門ガイド

Version
7.3
Language
日本語
Operating system
Big Data Platform
Product
Talend Big Data Platform
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2023-07-24
このカラム分析では、標準のインジケーターを使用して、メールと電話番号カラムの行、空白、重複値などのシンプル統計を示します。

始める前に

  • Studioで Profiling パースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーター選択)ダイアログボックスを開きます。
  2. [Simple Statistics] (シンプル統計)を展開し、[Row Count] (行数)[Blank Count] (空白値)[Duplicate Count] (重複値)を選択します。[OK]をクリックしてウィザードを閉じます。

    データの一貫性を調べるために、EmailカラムとPhoneカラムの行数、空白値、重複値を確認します。

    それによって、[Analyzed Columns] (分析済みカラム)セクション内のカラムにインジケーターが付加されます。

  3. [Duplicate Count] (重複値)および[Blank Count] (空白値)インジケーターの横にあるアイコンをクリックし、[Upper threshold] (上限しきい値)フィールドを0に設定します。

    EmailカラムとPhoneカラムのしきい値を定義すると、分析結果の重複値と空白値のカウントが赤で書き込まれるため、大変便利です。