Statistic
2. 중심적 경향 측정하기
우혁이 아빠
2012. 11. 26. 10:52
평균(average)
평균값(mean)
,
이상치(outlier)
다른 데이터에 비해 눈에 뜨일 정도로 지나치게 높거나 낮은 값.
편향(skewed)된 데이터
이상치가 데이터를 오른쪽이나 왼쪽으로 '잡아끄는' 경우.
중앙값(median)
가운데에 있는 값. 모든 값을 나열하여 가운데에 있는 값을 고른다. 만약 데이터의 개수가 짝수면 가운데에 있는 두 수의 평균값을 취한다.
중앙값을 구하는 3단계
1. 작은 수에서 큰 수 순으로 나열합니다.
2. 홀수 개의 수가 있으면 중앙값은 한가운데 있는 수입니다. 만약 n개의 수가 있다고 하면 중앙값의 위치는 (n+1)/2 입니다.
3. 짝수 개의 수가 있으면 가운데에 있는 두 수를 서로 더한 다음에 2로 나눕니다. 가운데 위치는 (n+1)/2를 계산하면 찾을 수 있습니다. 가운데에 있는 두 수는 이 값의 좌우측에 있는 수입니다.
최빈값(mode)
가장 많이 나타나서 도수가 가장 높은 값을 의미합니다. 평균값이나 중앙값과 달리 최빈값은 어떤 경우에도 데이터 집합 안에 존재하는 실제 값, 그리고 가장 흔히 나타나는 값입니다.