반응형

왜도(비대칭도)와 첨도(꼬리부분의 두꺼움 정도)

측정값들의 평균(mean)과 표준편차(또는 분산)의 값만으로는 자료가 가진 분포모양을 완전하게 설명할 수 없다.

자료 분포의 특징글 더 정확하게 기술하는 데에는 표준화적률(standradized moments)이 사용된다.

 

예를 들어, 50명으로 구성된 A, B, C 세 그룹의 성적의 각각의 리스트의 값과 같다고 가정하면, 세 그룹 모두 평균(50점)과 표준편차(12점)가 같다. 하지만 히스토그램으로 그려보면 분포상태는 현저히 다름을 확인할 수 있다.

 

A 그룹과 B 그룹은 평균 50을 중심으로 대칭이므로 평균과 중앙값 최빈값이 동일하다. 하지만 A 그룹과 B 그룹을 비교하면 A 그룹보다 B 그룹에서 꼬리부분(평균에서 멀리 떨어진 부분, 양 끝부분)에 자료가 더 많이 관측되고 있음을 알 수 있다.

그리고 C 그룹의 경우 평균으로부터 비대칭이고 분포의 우측에 긴 꼬리(우 비대칭 분포)가 있다. 이 경우 평균값이 가장 높고 중앙값, 최빈값 순서이다. 즉 평균과 최반값 사이에 중앙값이 놓이게 되며 이 경우 왜도(α3)는 0보다 크다.

이렇듯 분포의 대칭이나 비대칭 또는 분포에서 꼬리부분의 두꺼운 정도를 판정하는 데 쓰이는 통계값이 왜도(skewness, α3)와 첨도(kurtosis, α4)이다.

대칭형 히스토그램을 가진 자료의 왜도는 α3=0이고 C 그룹과 같이 우측에 긴 꼬리가 있는 경우는 α3>0이 되고 이와 반대로 좌측에 긴 꼬리(좌 비대칭 분포)가 있는 경우는 α3<0의 값을 가진다.