본문 바로가기
카테고리 없음

측정 수준에 따른 변수의 구분(명목,서열,등간,비율)

by ĸij⍵⌹⍗⍣⌨ 2021. 4. 15.

측정대상이 어떤 속성을 가졌는지 파악하기 위해 측정 수준을 다양하게 변수를 측정할 수 있습니다. 이러한 측정 수준은 명목, 서열, 등간, 비율 측정(척도)으로 나뉩니다. 본 포스팅에 대해선 이들을 구분하는 특징에 대해서 자세하게 알아보도록 하겠습니다. 


 들어가며

 사회과학이나 사회복지조사방법에서 연구를 위해 어떤 대상(변수)을 측정하게 됩니다. 예를 들어 우리가 '월 소득 수준'을 측정하려고 한다면, 일반적으로는 월에 얼마를 버는지 측정하고자 할 것입니다. 어떤 사람은 월 100만 원의 소득을 다른 사람은 월 200만 원의 소득을 측정할 수 있습니다. 하지만 이 외에도 측정 수준에 따라 변수를 측정할 수 있습니다. 우리가 소득이 있는지 없는지 그 여부만을 측정할 수 있고, 소득 수준을 상, 중, 하로 나눠서 응답하게 할 수도 있습니다. 이처럼 목적에 따라 우리는 측정 수준을 달리하여 변수를 측정할 수 있으며, 이 수준에 따라 네 가지 유형으로 구분할 수 있습니다. 

 

1. 명목측정

 명목(nominal)이란 단어를 풀어보면 '지정하다(nominate)'와 같이 이름을 짓는 것과 관계가 있습니다. 우리가 흔히 남자와 여자를 구분할 때 남자를 숫자 0으로 지정하고 여자를 숫자 1로 지정한다면 단순히 이름만 그렇게 지정한 것을 의미합니다. 따라서 0과 1은 어떤 수의 의미가 있는 것은 아닙니다. 반대로 여자를 0으로 남자를 1로 나타낼 수도 있습니다. 또 다른 예로 우리가 색깔에 번호를 매긴다고 생각해봅시다. 초록은 1번, 파랑은 2번, 노랑은 3번으로 나타낼 수 있습니다. 이 번호들은 우리가 그렇게 하자고 약속을 한 것이지 숫자에 어떤 서열이 있는 것은 아닙니다. 시간이 지나 초록을 3번으로 쓰기로 했다면 이번에는 초록이 3으로 지정된 것 외에는 아무 의미가 없습니다.

 따라서 명목측정은 가장 낮은 수준의 측정이라고 할 수 있습니다. 어떤 일정한 순서가 없기 때문에 변수가 가지고 있는 정보의 양도 한계가 있으며, 통계적으로 분석할 때에도 그 쓰임이 제한되기 때문입니다.

 실제 설문조사에서 명목측정의 예시를 들어보면 아래 표와 같습니다.

구분 내용
명목척도 1. 당신의 성별은 무엇입니까?
① 남성  ② 여성

 

2. 서열측정

 서열(ordinal)이란 단어는 순서라는 의미를 갖습니다. 서열측정은 명목측정보다는 한 수준 위의 측정방법이라고 생각하시면 됩니다. 구체적으로 서열측정은 변수들간의 서열을 매기는 것을 말합니다. 예를 들어 우리가 한 예능 프로그램의 만족도를 조사하고 있다고 생각해봅시다. 그 만족도를 상, 중, 하로 나눠서 측정을 한다면 서열측정을 하고 있는 것입니다. 만족도가 '하'인 것보다는 '중'이 더 높고, '중'보다는 상이 더 높은 서열이 존재합니다. 이처럼 변수 간의 우위를 예측하는 것을 서열측정이라고 합니다. 다만, 서열측정은 이러한 변수간의 순서나 순위 외에는 다른 정보를 알 수 없다는 한계를 지닙니다. 물론 명목측정에 비해서는 높은 수준의 측정이라고 할 수 있습니다. 

 실제 설문조사에서 서열측정의 예시를 들어보면 아래 표와 같습니다.

구분 내용
서열척도 1. 현재 제공받고 있는 사회복지서비스에 만족하십니까?
① 매우 만족  ② 만족  ③ 보통  ④ 불만족  ⑤ 매우 불만족

  

3. 등간측정

 등간(interval)이란 단어는 간격이라는 의미를 갖습니다. 이는 각 변수 간의 일정한 간격이 존재하는 것을 말합니다. 예를 들어 우리가 아이큐를 측정하면 100, 110, 115 등의 숫자로 측정이 됩니다. 이를 통해 우리는 아이큐가 높을수록 지능지수가 높을 것이라는 예상을 할 수 있습니다. 또한 100과 101의 차이보다는 100과 130의 차이가 좀 더 크다는 사실도 알 수 있습니다. 우리가 앞서 서열측정에서는 단순히 순위만 알 수 있었다면 이제는 그 간격의 차이도 알게 된 것입니다. 

 이러한 등간측정의 큰 특징은 절대 영(숫자 0)의 개념이 없다는 것입니다. 온도의 예를 들면 우리가 0도라고 해서 그 온도가 없다고 표현하지 않습니다. 같은 예로 지능이 0일 경우는 없을 것입니다. 우리가 지능이 없다라고 하는 것은 불가능에 가깝기 때문입니다.

 또한 등간척도는 더하거나 뺄 수는 있어도 곱하거나 나누는 것은 불가능합니다. 예를 들어 지능지수가 100인 사람과 지능지수가 200인 사람이 있다면 단순히 지능지수의 차이는 '100'의 차이가 난다고 할 수는 있습니다. 하지만 이 지능지수가 2배가 차이가 난다고 할 수는 없습니다. 지능지수라는 것은 우리가 지능을 측정하기 위해 편의상 만들어 놓은 것입니다. 따라서 지능이 0이라는 것은 존재하지 않습니다. 그렇기 때문에 지능은 간격만을 측정할 수 있으며, 실제로 지능이 2배나 3배가 차이 난다고 할 수 있지는 않습니다. 이를 보다 정확히 이해하기 위해선 비율측정과 비교하는 것이 좋습니다. 

 

4. 비율측정

 우리는 앞서 등간측정을 살펴보았습니다. 비율측정과 등간측정의 차이는 절대 영(숫자 0)의 유무라고 할 수 있습니다. 즉, 비율측정은 0의 값이 존재합니다. 예를 들어 소득의 경우 월 100만 원, 월 200만 원이 있을 수 있고, 월 소득이 0원일 수도 있습니다. 이것이 등간측정과의 명확한 차이입니다. 따라서 월 200만 원은 월 100만 원에 비해 2배의 소득을 가지고 있다고 말할 수도 있습니다. 이 외에도 나이, 거주기간, 자녀 수, 서비스를 받은 횟수 등이 있을 수 있습니다. 이처럼 명확하게 0의 값이 존재하고 산술적으로 모든 계산이 가능한 측정을 비율측정이라고 합니다. 

 따라서 비율척도는 더하기, 빼기, 곱하기, 나누기가 모두 가능합니다. 나이가 20살인 사람보다 나이가 40살인 사람이 정확히 2배가 많다고 할 수 있습니다. 이처럼 비율측정은 가장 높은 수준의 측정으로 나머지 하위 수준의 측정보다 많은 정보를 담고 있다고 할 수 있습니다. 

 

 지금까지 알아본 측정수준에 따른 변수의 속성을 표로 만들어 구분하면 아래와 같습니다.

특성 명목변수 서열변수 등간변수 비율변수
범주
순위 X
등간격 X X
절대영점 X X X
비교방법 확인, 분류 순위비교 간격비교 수량비교
사칙연산 불가 >, < >, <, +, - >, <, +, -, ×, ÷
성별, 지역 순위, 학력 수준 온도, 지능 소득, 인구 수

 지금까지 측정수준에 따른 변수가 어떻게 구분되는지 알아보았습니다. 우리는 명목측정, 서열측정, 등간측정, 비율측정 순으로 정보가 많아지는 것을 알게 되었습니다. 사회과학이나 사회복지조사방법에서는 되도록이면 비율측정으로 변수를 측정하기 위해 노력합니다. 비율측정이 가장 많은 정보를 담고 있기도 하지만 하위 수준의 측정으로 변환이 가능하게 때문입니다. 예를 들어 소득의 경우 100, 200만 원으로 나타내기도 하지만 상, 중, 하로 바꿔 서열척도로 나타내거나 소득이 200만 원 이상 또는 200만 원 이하로 구분하여 명목척도로도 나타낼 수도 있기 때문입니다. 좀 더 자세히 다룰 내용들이 많지만 주제를 많이 벗어나므로 나중에 기회가 되면 또 다루도록 하겠습니다.  

댓글