グラフを使用したデータの集計 - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

[Chart] (グラフ)タブは、データをグラフィカルに表現したものです。また、統計データを集計し、興味深い情報のプレビューを行うこともできます。

Talend Cloud Data Preparationのデータ集計では、2つのカラムの情報を簡単に収集して統計分析を実行できます。最初のカラムを選択し、2番目の数値を含むカラムで[sum] (合計)[max] (最大)[min] (最小)または[average] (平均)を使用して比較できます。グラフには、デフォルトで表示されるものよりも高度な統計情報が表示されます。

この例では、オンライン小売企業のデータを扱っており、処理するデータセットには年齢、性別、購入回数など、顧客に関する情報が含まれています。[Chart] (グラフ)タブを使用すると、顧客の年齢グループごとの平均購入数をすばやくプレビューすることができます。

手順

  1. 集計の基準として使用するカラムのヘッダー、この例では[Age group] (年齢グループ)をクリックします。
    データプロファイリングエリアには、年齢グループごとのに出現回数を示すグラフが表示されます。
  2. [Chart] (グラフ)タブで、表示オプションメニューをクリックし、デフォルトで[Row count] (レコード数)にセットします。
  3. [Column] (カラム)ドロップダウンリストから、[Purchases] (購入)を選択します。
    このカラムには、年齢グループにリンクさせる情報が含まれています。ドロップダウンリストには集計に対応しているすべてのカラム、つまり数値データを含む他のすべてのカラムが、integerまたはdecimalセマンティックタイプで一覧表示されます。
  4. [Aggregation] (集計)ドロップダウンリストから[Average] (平均)を選択します。
  5. [OK]をクリックします。

タスクの結果

[Chart] (グラフ)タブには、各年齢グループの平均購入数が表示されます。たとえば、18-25のグループが最も多く注文していることがわかります。水平バーの上でそれぞれマウスオーバーして、各レコードグループの正確な平均値を確認します。

このような統計情報を使用することで、データについてのインサイトをすばやく得ることができ、データセットから顧客の性別やその他のデータカテゴリーごとの購入総額を比較するなど、他の集計操作を実行できます。

グラフから集計情報を削除するには、[Average Purchases] (平均購入数) > [Remove] (削除)をクリックします。