メイン コンテンツをスキップする 補完的コンテンツへスキップ

チャートを使ってデータを集計

[Chart] (チャート)タブは、データをグラフィカルに表現したものです。また、統計データを集計し、興味深い情報のプレビューを行うこともできます。

Talend Cloud Data Preparationのデータ集計では、2つのカラムの情報を簡単に収集して統計分析を実行できます。最初のカラムを選択し、2番目の数値を含むカラムでsummaxminaverageを使って比較できます。チャートには、デフォルトで表示されるものよりも高度な統計情報が表示されます。

この例では、オンライン小売企業のデータを扱っており、処理するデータセットには年齢、性別、購入回数など、顧客に関する情報が含まれています。[Chart] (チャート)タブを使用すると、顧客の年齢グループごとの平均購入数をすばやくプレビューできます。

データセットに顧客情報が含まれている状態。

手順

  1. 集計の基準として使用するカラムのヘッダー、この例ではAge groupをクリックします。
    データプロファイリングエリアには、年齢グループごとのに出現回数を示すチャートが表示されます。
    チャートタブに各年齢グループの出現率が表示されている状態。
  2. [Chart] (チャート)タブで、表示オプションメニューをクリックし、デフォルトで[Row count] (レコード数)にセットします。
  3. [Column] (カラム)ドロップダウンリストから、[Purchases] (購入)を選択します。
    このカラムには、年齢グループにリンクさせる情報が含まれています。ドロップダウンリストには集計に対応しているすべてのカラム、つまり数値データを含む他のすべてのカラムが、integerまたはdecimalセマンティックタイプでリスト表示されます。
  4. [Aggregation] (集計)ドロップダウンリストから[Mean]を選択します。
    集計リストで平均オプションが選択されている状態。
  5. [OK]をクリックします。

タスクの結果

[Chart] (チャート)タブには、各年齢グループの平均購入数が表示されます。たとえば、56+のグループが最も多く注文していることがわかります。各水平バーにマウスを重ねて、各レコードグループの正確な平均値を確認します。
チャートタブに各年齢グループの平均購入数が表示されている状態。

このような統計情報を使用することで、データについてのインサイトをすばやく得ることができ、データセットから顧客の性別やその他のデータカテゴリーごとの購入総額を比較するなど、他の集計操作を実行できます。

チャートから集計情報を削除するには、[Average Purchases] (平均購入数) > [Remove] (削除)をクリックします。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。