データの特徴をある1つの数値で表す統計量を「代表値」と言います。
たくさんのデータを扱う上で、データの特徴を掴むことは非常に大切なことですね。
今回は代表値の中でも非常に良く利用する、
- 平均値(相加平均)
- 中央値
- 最頻値
について解説していきます。
1. 平均値(相加平均)
統計学には様々な平均の取り方がありますが、より私たちの生活に馴染み深い「相加平均」について説明します。
私たちが普段「平均」と呼んでいるものは相加平均のことです。
全てのデータを足して、データの個数で割った値のことです。
2. 中央値
中央値は、データを大きい順に並べた時の中央に当たる値です。
データの個数が偶数か奇数かで算出方法が分かれます。
2-1. 偶数の場合
偶数の場合は、中央に当たる2つのデータの平均を中央値とします。
2-2. 奇数の場合
奇数の場合は、中央に当たる1つのデータを中央値とします。
3. 最頻値
最頻値とは、その名の通り最も頻度の高い値であり、
データの中で一番個数が多い値です。
4. まとめ
データを扱う場面では、上記3つの代表値を用いることが多いです。
与えられたデータの分析をする前に代表値を確認することも多いため、
代表値については理解を深めていきましょう。