代表値を理解しよう

データの特徴をある1つの数値で表す統計量を「代表値」と言います。
たくさんのデータを扱う上で、データの特徴を掴むことは非常に大切なことですね。

今回は代表値の中でも非常に良く利用する、

  • 平均値(相加平均)
  • 中央値
  • 最頻値

について解説していきます。

1. 平均値(相加平均)

統計学には様々な平均の取り方がありますが、より私たちの生活に馴染み深い「相加平均」について説明します。
私たちが普段「平均」と呼んでいるものは相加平均のことです。

全てのデータを足して、データの個数で割った値のことです。

2. 中央値

中央値は、データを大きい順に並べた時の中央に当たる値です。
データの個数が偶数か奇数かで算出方法が分かれます。

2-1. 偶数の場合

偶数の場合は、中央に当たる2つのデータの平均を中央値とします。

2-2. 奇数の場合

奇数の場合は、中央に当たる1つのデータを中央値とします。

3. 最頻値

最頻値とは、その名の通り最も頻度の高い値であり、
データの中で一番個数が多い値です。

4. まとめ

データを扱う場面では、上記3つの代表値を用いることが多いです。
与えられたデータの分析をする前に代表値を確認することも多いため、
代表値については理解を深めていきましょう。