データを扱う際、データの尺度に気を付ける必要があります。
尺度という言葉はあまり聞き慣れないかもしれま線が、データの種類と捉えるとよいでしょう。
データの尺度によって使用可能な統計手法が異なります。
具体的な統計手法を理解する前に、まずは尺度を理解しましょう。
データは
- 量的データ
- 質的データ
に大きく分けられます。
1. 量的データ
量的データとは、「数字に意味があり、四則演算が可能なデータ」のことです。
量的データは、次の2つに分けて考えることが一般的です。
- 比例尺度
- 間隔尺度
1-1. 比例尺度
比例尺度とは、「原点が0となる量的データ」のことです。
比例尺度の例として、
- 身長
- 速度
- 睡眠時間
- 価格
- 給与
などが挙げられます。
どれも原点が0であるというのが理解できるかと思います。
1-2. 間隔尺度
間隔尺度とは、「絶対的なゼロ点が無く、目盛りが間隔的な量的データ」のことです。
間隔尺度の例として、
- 気温
- 西暦
などが挙げられます。
2. 質的データ
質的データとは、「分類や種類を区別するためのデータ」のことです。
質的データは、次の2つに分けて考えることが一般的です。
- 順序尺度
- 名義尺度
2-1. 順序尺度
順序尺度とは、「順序や大小には意味があるが間隔には意味のないデータ」のことです。
順序尺度の例として、
- 1位、2位、3位などの順位
- 〇〇検定1級、2級、3級
などが挙げられます。
2-2. 名義尺度
名義尺度とは、「他と区別するために与えられているデータ」のことです。
名義尺度の例として、
- 血液型
- 郵便番号
- 住所
- 所属学部
- 学籍番号
- マイナンバー
などが挙げられます。
3. まとめ
それぞれの尺度について理解することはできたでしょうか。
もしデータを扱う機会がありましたら、データの尺度に注意してみましょう!