역사관련 글들/한국사관련 글들

[스크랩]박/라 논문 개선 (8) 신라-백제-고구려 순으로 올 확률

monocrop 2009. 5. 17. 00:21

박/라 논문 개선 (8) 신라-백제-고구려 순으로 올 확률

 

글 : 바비 / http://www.history21.org/ 백가쟁명 / 2008-04-17

 

 

지금까지 동과 서 차이 (중원이냐 한반도냐) 문제에 관심을 가지는 것으로 보이는데. 만약 김부식이 무작위로 중국기록을 차용하였다면 당연히 중심지가 중원부근으로 나타나지 않겠느냐는 의견이 있었죠.

그럼 김부식이 무작위로 중국기록을 차용했는지 이젠 남북 차이를 가지고 검정을 해보도록 하죠.

김부식이 중국 사서 일식 기록을 무작위로 차용하였다면 초기신라, 백제, 고구려 최적관측지가 남에서부터 신라-백제-고구려 순서로 올 확률은

1. 고구려-백제-신라
2. 고구려-신라-백제
3. 백제-신라-고구려
4. 백제-고구려-신라
5. 신라-고구려-백제
6. 신라-백제-고구려

1번부터 6번 경우 모두 고려했을 때 1/6 = 16.7% 입니다.

박/라는 식분 최대평균치를 가지고 최적관측지를 구해서 신라-백제-고구려라고 가정을 두고 계산을 했습니다. 그런데 삼국사기에 실린 초기신라, 백제, 신라 일식 기록들에서 구한 최적관측지의 오차범위를 생각하면 항상 신라-백제-고구려 순서로 오는 것은 아닙니다. 삼국사기 일식 기록에서 구한 최적관측지가 고구려-백제-신라 순으로 오는 비율 역시 부트스트랩으로 구할 수 있습니다.

만약 이 부트스트랩에서 나온 비율이 기대값 P = 16.7% 와 크게 다르지 않다면 박/라의 순서에 관한 논증은 효력이 없을 것입니다.

저는 부트스트랩으로 삼국사기 일식기록을 무작위로 추출하는 과정을 100번 반복해서 그 최적관측지 순서가 신라-백제-고구려 순으로 오는 경우를 p로 두고 그것이 기대치 P = 16.7%로 유의하게 다른지 카이제곱으로 검정해보도록 하겠습니다.

실제 관측된 p1 + p2 + ... + p6 = 1;
기대치 P1 + P2 + ... + P6 = 1;
P1 = P2 = ... = P6 = 1/6 = 16.7%;

Chi-Square = (p1 - P1)^2/P1 + ... + (p6 - P6)^2/P6

여기서 p1...p6 가 무작위분포에서 온 것이라는 귀무가설이 기각되면 더 이상 김부식이 중국기록을 무작위로 차용했다는 주장이 나와서는 안될 것으로 봅니다.

이것을 하려면 최소 1,000 번 정도 부트스트랩을 해야하는데 상당한 시간이 걸리겠군요. 우선 100번부터 하고... 그 결과를 댓글로 알려드리겠습니다.

저도 어떤 결과가 나올지 장담못하겠군요.

 

 

부트스트랩 100번 반복 결과

 

 

 



부트스트랩으로 해보니까 N=1,000 인 경우보다 100 인 경우가 더 나은 것 같아서 그 결과도 보여드립니다.

카이제곱 검정 자체에 문제가 좀 있기 때문에 무작위분포를 가지고 임의추출하더라도 무작위분포에서 나오지 않았다는 결과를 내는 경우가 많습니다. 그러나 부트스트랩으로 무작위분포를 가지고 임의추출하더라도 p-value 가 0.01 이하로 되는 경우는 드물었기 때문에 삼국사기 일식기록은 중국 자료를 무작위로 차용한 것이 아니라는 결론에 도달할 수 있습니다. 실제 부트스트랩으로 추정해보니까 귀무가설을 기각할 수 있는 p 값은 alpha = 0.05이고 N = 100 일 경우, p = 0.05 가 아니라 p = 0.01, chi-square = 13.64 이었습니다. 부트스트랩 N = 1,000 인 경우는 alpha = 0.05 에서 p = 0.000000006, chi-square = 46.48 이었습니다. 이렇게 되는 이유에 대해서는 통계학자와 상의를 좀 해봐야겠군요.


어떤 경우든 삼국사기 초기 일식기록이 중국 자료를 무작위로 차용했다면 위 그림처럼 분포를 보일 확률은 p = 0.01 보다 훨씬 작았습니다.

alpha = 0.05 에서 구한 부트스트랩 chi-square와 비교해보아도 100번 일 경우 chi-square = 64.5 > 13.64 로 훨씬 컸으며, 1,000번인 경우도 chi-square = 757.38 > 46.48 보다 훨씬 컸습니다.

바비 (2008-04-19 12:48:05)   
한가지 흥미로운 사실은 고구려와 백제만 비교해보면 남북 차이가 거의 없다는 것입니다. 선입견을 배제하고 조금 더 들어가본다면 초기 고구려와 초기 백제는 비슷한 위도상에 있었으며 남북으로 보다는 동서로 서로 인접해 있었을 가능성이 높습니다.
바비 (2008-04-19 12:50:11)   




물론 초기 신라에 비교해서 오차는 크지만 선입견 없이 한번 검토해볼 필요가 있겠군요.

 

 

고구려-백제 동서 비교

 



초기 고구려와 백제가 비슷한 위도에 있었다면 어느 나라가 더 서쪽에 있었는지 역시 부트스트랩으로 조사해보았습니다. 평균일식으로 정한 최적관측지 부트스트랩 분포를 가지고 조사해보니까 5번에 4번꼴로는 고구려가 서쪽에 백제가 동쪽에 있는 것으로 나타났습니다. 하지만 고구려와 백제 최적관측지의 위치는 동서에 따라 유의하게 다르지는 않았습니다 (p = 0.2).


바비 (2008-04-21 17:17:36)   
부트스트랩으로 추정한 백제-고구려 중심지의 평균 거리는 약 2,000 킬로미터로 나타났습니다만 오차가 너무 크고 두 중심지간의 유의한 차이가 없었습니다. 단지 참고로.