[Chart] (チャート)タブは、データをグラフィカルに表現したものです。また、統計データを集計し、興味深い情報のプレビューを行うこともできます。
Talend Data Preparationのデータ集計では、2つのカラムの情報を簡単に収集して統計分析を実行できます。最初のカラムを選択し、2番目の数値を含むカラムでsum、max、min、averageを使って比較できます。チャートには、デフォルトで表示されるものよりも高度な統計情報が表示されます。
この例では、オンライン小売企業のデータを扱っており、処理するデータセットには年齢、性別、購入回数など、顧客に関する情報が含まれています。[Chart] (チャート)タブを使用すると、顧客の年齢グループごとの平均購入数をすばやくプレビューできます。
手順
-
集計の基準として使用するカラムのヘッダー、この例ではAge groupをクリックします。
データプロファイリングエリアには、年齢グループごとのに出現回数を示すチャートが表示されます。
-
[Chart] (チャート)タブで、表示オプションメニューをクリックし、デフォルトで[Row count] (レコード数)にセットします。
-
[Column] (カラム)ドロップダウンリストから、[Purchases] (購入)を選択します。
このカラムには、年齢グループにリンクさせる情報が含まれています。ドロップダウンリストには集計に対応しているすべてのカラム、つまり数値データを含む他のすべてのカラムが、integer
またはdecimal
セマンティックタイプでリスト表示されます。
-
[Aggregation] (集計)ドロップダウンリストから[Average] (平均)を選択します。
-
[OK]をクリックします。
タスクの結果
[Chart] (グラフ)タブには、各年齢グループの平均購入数が表示されます。たとえば、
18-25のグループが最も多く注文していることがわかります。各水平バーにマウスを重ねて、各レコードグループの正確な平均値を確認します。
このような統計情報を使用することで、データについてのインサイトをすばやく得ることができ、データセットから顧客の性別やその他のデータカテゴリーごとの購入総額を比較するなど、他の集計操作を実行できます。
チャートから集計情報を削除するには、をクリックします。