データの種類(尺度)を理解しよう

データを扱う際、データの尺度に気を付ける必要があります。
尺度という言葉はあまり聞き慣れないかもしれま線が、データの種類と捉えるとよいでしょう。
データの尺度によって使用可能な統計手法が異なります。
具体的な統計手法を理解する前に、まずは尺度を理解しましょう。

データは

  • 量的データ
  • 質的データ

に大きく分けられます。

1. 量的データ

量的データとは、「数字に意味があり、四則演算が可能なデータ」のことです。
量的データは、次の2つに分けて考えることが一般的です。

  • 比例尺度
  • 間隔尺度

1-1. 比例尺度

比例尺度とは、「原点が0となる量的データ」のことです。
比例尺度の例として、

  • 身長
  • 速度
  • 睡眠時間
  • 価格
  • 給与

などが挙げられます。
どれも原点が0であるというのが理解できるかと思います。

1-2. 間隔尺度

間隔尺度とは、「絶対的なゼロ点が無く、目盛りが間隔的な量的データ」のことです。
間隔尺度の例として、

  • 気温
  • 西暦

などが挙げられます。

2. 質的データ

質的データとは、「分類や種類を区別するためのデータ」のことです。
質的データは、次の2つに分けて考えることが一般的です。

  • 順序尺度
  • 名義尺度

2-1. 順序尺度

順序尺度とは、「順序や大小には意味があるが間隔には意味のないデータ」のことです。
順序尺度の例として、

  • 1位、2位、3位などの順位
  • 〇〇検定1級、2級、3級

などが挙げられます。

2-2. 名義尺度

名義尺度とは、「他と区別するために与えられているデータ」のことです。
名義尺度の例として、

  • 血液型
  • 郵便番号
  • 住所
  • 所属学部
  • 学籍番号
  • マイナンバー

などが挙げられます。

3. まとめ

それぞれの尺度について理解することはできたでしょうか。
もしデータを扱う機会がありましたら、データの尺度に注意してみましょう!