난쟈고랴
by Xerx
카테고리
이글루 파인더
확률변수를 쉽게 설명해보자 #2 - 중심극한정리
확률변수의 합과 중심극한정리를 설명해볼까한다.

중심극한정리라는 뭔가 무시무시해 보이는 녀석은 알고나면 참 별거 아니면서도 정말정말 신기하고 대단한 놈이다.

--------------------
확률변수
--------------------


확률변수. 해서 수학책에서 찾아보면
표본공간의 사건에 대해 실수값을 return하는 함수라고 되어있다.
뭐야 이거 무서워표본, 표본공간, 사건, 실수값 함수 따위를 다루기는 싫으므로 내 스타일대로 가련다.



시리즈를 의도한것은 아니지만, 저번 글에서 확률변수는 무엇인가?에 대한 내 대답은

라고 했다.

저 그림에서 중요한 부분은 분포와 수직선이다.
분포는 이것을 말하며

수직선은 이것을 말한다.


저 두가지는 각각 '확률'과 '변수'에 해당한다.




--------------------
서론: 나라꼴
--------------------


우리는 요즘 민주주의 사회가 직면하고 있는 불확실성을 몸소 체험하고 있다. 상황이 나쁘면 시대의 시계를 되돌리는 일들이 민주적으로 벌어지는 것이다.

그렇다고 국개론을 외치며 한탄만을 할 수는 없다. 차라리 대통령을 추첨으로 뽑는게 낫지 않을까? 찬반양론이 팽팽하다.

랜덤하게 국민중에 추첨을 해서 대통령을 뽑는 나라를 생각해보자. 겉만 봐서는 모르지만, 국민 개개인의 "능력"은 0에서 100까지 다양하다.

평균은 어떨까? 한 50쯤갈거라고 생각하는 것은 성급하다. 한민족 역사에 비추어 우리는 위대한 민족 평균이 70이나 90쯤은 되지 않을까? 아니면 한국인은 절망적이라 10의 평균을 가질 것인가?

뭐가 어찌되었든 여기서 한명을 골라 잡아서 대통령을 세우자. 그러면, 사람을 뽑기 전에 "우리나라 대통령의 능력"은 확률분포를 보일 것이다. 어떤 분포일까? 모른다!

만일 표준편차 10의 종형분포라면 랜덤대통령제를 택할때 능력이 70 이상일 대통령을 뽑을 확률이 5%정도다.
다른 분포라면 그에 따른 분석을 할 수 있다.어떤 모양일지 모르겠는데에 문제가 있다.

[대체 어떤 확률분포를 보일 것인가 ㄷㄷㄷ]


그렇다면, "우리가 95점 이상의 훌륭한 대통령을 뽑을 가능성은?" 따위의 고급 질문에 대해서는 어찌 접근해 볼 수도 없게 된다.

아아, 이 혁명적인 랜덤대통령제의 효과는 어찌 평가할 수도 없는 녀석이란 말인가.


아래의 과정은 이러한 질문에 어떻게든 답하기 위한 과정이다.

---------------------
간단한 확률변수: 이상한 동전
---------------------


동전이 꼭 앞뒤일 필요는 없다. 우리가 가진 동전은 한쪽면에 -1이, 다른쪽면에 1이 적혀있다. 이것이 확률변수의 '변수'에 해당한다.
던지기전에 생각해보자. -1이 나올 확률이 0.5, 1이 나올 확률이 0.5이다. 확정된 값이 아닌 '분포'를 가진다.

그래서, 동전을 던지기 전에 생각해보는 저 동전의 결과(아직 -1인지 1인지 모른다)는 확률변수가 된다.


나타내는 방법은 우리가 봤던 그림도 있고
(주의: 이거 잘못된 그림입니다. orz 그냥 보기좋으라고... )

고등학교 수학책에서 봤던 이런 표도 있다.


같은 이야기이다. 모두가 '나는 확률변수야'라는 소리를 하고 싶어하는 것이다.

쉽게 알 수 있는 것이지만, 이 동전의 평균은 0이다.
= (-1*0.5) + (1*0.5)

표준편차는 1이다.
= (-1-평균)제곱*0.5 + (1-평균)제곱*0.5

---------------------
확률변수의 연산?
---------------------


X가 확률변수가 아닌 그냥 변수라면 X+X = 2X 이다.


X가 확률변수라면 어떨까?

먼저 2X를 생각해보자. X가 -1라면 2X는 -2, 1이라면 2의 값이 된다.


아, 확률변수의 연산결과는 확률변수가 되겠구나 하는 생각을 할 수 있다.

그럼 X+X 는 어떻게 되나? 앞의 X랑 뒤의 X가 각각 따로 움직이는 녀석이라고 생각하자. 그렇다면 경우의 수를 따져줘야 한다.
(독립사건 어쩌고 하는 이야기가 나오는데, 잠시 미뤄두자)

앞의 X와 뒤의 X, 그 순서를 생각해서

-1 -1 이라면 결과는 -2
-1 1 이라면 결과는 0
1 -1 이라면 0
1 1 이라면 2

다르게 이야기하면 X+X는 -2 0 2 의 가능성을 갖고 그 분포는 0.25 0.5 0.25가 된다. 말하자면, X 두개를 더하면 앞면이 -2 뒷면이 -2 똑바로 서면 0이 나오는 허리 두꺼운 통나무 모양의 동전이 되는 것이다 :


X제곱은 뭐가 되나?
-1 이면 1
1 이면 1
우왓; X제곱은 확률변수가 아닌, 게다가 변수도 아닌 그냥 상수 1이 되어버린다.
<7>

(그래서 확률변수의 미적분은 그냥 변수의 미적분과는 매우 다르게 된다. orz)

X*X는, 둘이가 따로 논다고 가정하면
-1 -1 일때 1
-1 1 일때 -1
1 -1 일때 -1
1 1 일때 1

그래서 결국 X*X는 그냥 X와 똑같은 성질을 갖는다.


----------------------
덧셈의 오묘함 - 중심극한정리
----------------------


같은 성질을 가지고 독립인 확률변수 (iid: identical and independent) 여러개를 더해보자.
즉, 똑같은 동전 확률변수 X들인데 각각 따로논다고 생각하고, 여러개를 더해보자.

X+X+X
-3에서 3까지 범위를 가질텐데, 잘 구해보면 -3 한개, -1 세개, 1 세개, 3 한개가 나온다.


따로노는 X 4개를 더하면?


그림이 점점 이뻐지는 것이 보이는가?
그렇게 많이 많이 더해가보자. 이런건 컴퓨터에게 시키는 것이 제맛이다.


9개까지만 더해도 상당히 종형모양에 가까워진다.
따로노는 X 무한개를 모아서 요렇게 덧셈을 해주면, 정확히 정규분포랑 똑같은 모양이 나온다.

놀라운 것은, 정규분포 모양과는 전혀 동떨어진 모양의 확률변수라고 해도 똑같은 모양의 따로노는 놈들을 무수히 모아서 더하면 무조건 정규분포의 모양과 같아진다. 이것이 중심극한정리이다.

한가지 예만 살펴보자.
아까 동전은 -1과 1이 50:50으로 균형잡힌 것이지만
이를 조작해서 92:8 의 동전을 만들자. 던지면 -1이 많이 나오는 녀석이다.
이놈의 경우는 아래와 같다. 10개를 더해도 종형같지 않지만, 100개쯤 더하면 상당히 종형같다:

무한개를 더하면 평균이 -무한대로 진행하는 정규분포가 되리라고 생각할 수 있다.


그렇다. 어떤 분포든 독립된 애들을 마구 더한 그 결과로 나온 확률변수는 정규분포를 따른다. 정규분포가 그리 중요한 이유는 중심극한정리 때문인 것이다.

--------------------
결론: 나라꼴2
--------------------


자, 그렇다면 '덧셈'을 통해 각 사람의 능력을 연산하는 경우 정규분포를 사용한 근사가 말이 되기 시작한다.
우리가 잘 아는 덧셈 연산은 평균의 그것이다. 더해서 나누면 평균인데, 각 사람의 능력이 확률변수이므로 더한다...의 결과로 나오는 확률변수는 상당히 정규분포 모양의 확률분포가 된다. ('나눈다'의 과정도 중요한 의미를 갖는데 그것은 다음시간에)

그렇다면 이런 이야기를 할 수 있다: 우리국민 중에서 랜덤하게 100명을 뽑은 다음에 이들에게서 1/100 씩 신체기증을 받아서 프랑켄 슈타인을 만들면, 최소한 이 녀석 능력의 확률분포는 정규분포의 모양에 가까워지게 된다. 1000명이면 더 정규분포, 10000명이면 더더더. [....내가 왜 이 글을 쓰기 시작한거지]


자, 그럼 저 정규분포의 평균과 표준편차는 구할 수 있을 것인가?의 문제가 뒤따른다. 표준편차는 좀 그렇지만 그 평균은 상당히 정확하게 구할 수 있다. 이것은 평균이 갖는 '나눈다'의 과정 덕분이다. 대수의 법칙, 평균의 법칙이라고 불리는 이야기가 나온다.
by Xerx | 2009/02/17 15:13 | 트랙백 | 덧글(3)
트랙백 주소 : http://xerx.egloos.com/tb/4068351
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented at 2009/05/08 15:35
비공개 덧글입니다.
Commented by 신수진 at 2009/06/04 23:38
너무 많은 도움이 됬습니다. 감사합니다^^
Commented by ghost at 2009/06/24 21:36
출처 밝히고 퍼갑니다~ 잘 정리 해놓으셨네요 ^^

:         :

:

비공개 덧글



<< 이전 페이지 다음 페이지 >>


이전블로그
Jump Nodes
최근 등록된 트랙백
간통죄는 폐지되어야 한다...
by Fiat justitia, ruat caelum.
간통죄?
by There is *a* spoon.
간통죄 관련.. -_-a
by 꿈, 희망, 기적과 뽀록
이자율평가설의 기상천외한..
by Xerx's 蘭者考麗
괴물 감상문 수집~*
by 외날개 히요Heeyo
최근 등록된 덧글
이글루링크
태그
rss

skin by 이글루스