システムインジケーターを設定 - 8.0

Talend Data Fabric 入門ガイド

Version
8.0
Language
日本語
Operating system
Data Fabric
Product
Talend Data Fabric
Module
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2024-04-15
このカラム分析では、標準のインジケーターを使用して、メールと電話番号カラムの行、空白、重複値などのシンプル統計を示します。

始める前に

  • Talend StudioProfilingパースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーターの選択)ダイアログボックスを開きます。
  2. [Simple Statistics] (シンプル統計)を展開し、[Row Count] (行数)[Blank Count] (空白数)[Duplicate Count] (重複値)を選択します。[OK]をクリックしてウィザードを閉じます。

    データの一貫性を調べるために、EmailカラムとPhoneカラムの行数、空白値、重複値を確認します。

    それによって、[Analyzed Columns] (分析済みカラム)セクション内のカラムにインジケーターが付加されます。

  3. [Duplicate Count] (重複値)および[Blank Count] (空白数)インジケーターの横にあるアイコンをクリックし、[Upper threshold] (上限しきい値)フィールドを0に設定します。

    EmailカラムとPhoneカラムのしきい値を定義すると、分析結果の重複値と空白値のカウントが赤で書き込まれるため、大変便利です。