본문 바로가기
독서와 글쓰기/책 이야기

샤론 버치 맥그레인의 불멸의 이론을 읽고

by 격암(강국진) 2014. 1. 16.

2014.1.16

최근에 베이즈이론에 대한 책 불멸의 이론을 읽었다. 그 소감과 그로 인해 떠올랐던 생각들이 사라지기전에 적어두기로 한다. 불멸의 이론은 어떻게 베이즈이론이란 것이 탄생하고 이제까지 퍼져오게 되었는가에 대해 과학저술가이자 저널리스트인 맥그레인이 소개하고 있는 책이다. 결론적으로 말하자면 나는 이 책을 흥미롭게 재미있게 읽었다. 

 

 

이 책을 읽기 시작하자마자 나는 초등학교시절에 읽었던 이야기들이 생각났다. 그 이야기들은 20세기 초반에 활약했던 물리학의 영웅들에 대한 것들이었으며 당시 어렸던 나는 양자역학이나 상대성이론따위를 이해하지 못하고 마치 그리스 신화읽듯 그 이야기들을 읽었다. 이 책을 읽으며 그 때가 떠올랐던 것은 단순히 이 책이 과학자나 수학자가 쓴 책이 아니며 전반적으로 베이지안 정리를 둘러싼 수학과 공학의 천재들의 이야기를 흥미있게 나열한 책이기 때문만은 아니다. 사실 이 책이 단순히 흥미위주의 책이라고 말하는 것은 이 책을 쓰기 위해 들였을 자료조사의 고생을 생각하면 아주 부당한 것이다. 이 책은 방대한 내용을 말하기때문에 다소 피상적으로 보이는 부분이 없지 않지만 베이지안 이론의 역사에 대한 많은 사례를 잘 정리해 놓았다. 

 

이 책을 읽으면서 20세기초의 하이젠베르크, 쉬뢰딩거, 아인쉬타인, 보어, 막스플랑크 같은 이름들을 떠올린다는 것은 그만큼 우리가 살아갈 시대가 바뀌었다는 뜻이다. 다시 말해 20세기의 시작은 물리학 그것도 이론물리학이 영웅을 만들어 내던 시대였지만 우리는 통계학이 영웅을 만들어 내는 시대로 접어들고 있다는 뜻인 것이다. 나 자신이 물리학도다. 그러니까 괜히 통계학을 높이 과대평가하기 위해서 이런 말을 쓰는게 아니다. 참고로 말하자면 19세기 말무렵에 사람들은 물리학이라고 하면 이미 밝혀질 것이 다 밝혀져서 별로 재미있는게 없는 분야라고 생각했다고 한다. 그래서 양자역학의 아버지 하이젠베르크가 어린 시절에는 그에게 물리학은 이미 끝난 분야라고 생각한다고 말하던 사람들도 있었다고 한다. 마찬가지로 지금은 종종 대중에게 그저 지루하고 단순한 분야라고 인식되는 통계가 사실은 백년뒤, 50년뒤에는 전혀 다른 분야로 인식될수도 있다. 

 

왜 통계학이 그렇게 중요한 분야가 될수 있는가. 그건 두가지 방식으로 이야기할수 있다. 하나는 왜가 아니라 예를 들어서 말하는 것이다. 지금 전세계에서 가장 화제가 되는 몇가지 분야가 있다. 하나는 검색이다. 구글의 검색이나 번역서비스는 어떻게 가능할까? 또하나는 금융이다. 컴퓨터들이 눈부신 속력으로 거래를 체결하는 시대, 전세계시장을 하나로 묶어서 비지니스를 해야 하는 시대에 우리는 그 불확실성문제를 어떻게 해결할까. 바로 통계를 통해서 그렇게 한다. 통계숫자몇개, 통계처리를 하는 방식의 약간의 변화가 세계가 움직이는 방식을 점점 더 크게 바꿔가는 시대다. 

 

통계라고 하면 그저 학생 열명의 성적의 평균값같은 간단한 문제만 생각하지만 통계는 이 책의 말미에서 짧게 언급하듯이 이제 아예 어떤 보조적 수학의 분야를 넘어서 인간정신의 근원에 대해 이야기하는 경지로 나아가고 있다. 말하자면 우리의 뇌는 우리가 의식하지 못하는 가운데 통계문제를 베이지언방식에 따라서 풀고 있으므로 그 통계적 처리방법의 의미를 아는 것이 우리 정신의 본질을 꽤뚫는 일이 될 수도 있다는 것이다. 우리는 이미 이런 주장을 믿는 사람들이 많이 생겨난 시대를 살고 있다. 

 

어쩌다가 통계는 이렇게 중요한 분야가 되었을까? 그것은 통계를 우리가 뭔가를 보는 과정과 비교해 보면 이해가 될것이다. 오늘날 한국사회는 어떤 사회인가라는 질문이 있다고 하자. 그걸 위해서 우리는 한국을 관찰해야 한다. 즉 한국을 봐야 한다. 그런데 그냥 관찰 몇 번한 것 가지고는 한국사회가 어떤 사회인지 알 수가 없다. 관찰 몇개가 아니라 수만 수억번이라고 해도 사실은 그것가지고는 상당히 부족하다. 우리는 봤다는 자료 즉 관측자료를 처리할 통계적 방법이 필요하다. 통계문제는 그렇게 간단하지 않다. 

 

통계에는 차원의 저주문제라는게 있다. 차원의 저주란 기본적으로 우리가 관찰하는 대상이 여러 특성을 가지고 있을 때 생길수 있는 경우의 수가 지수함수적으로 늘어난다는 이야기다. 서로 다른 주사위 3개를 던지면 나오는 경우의 수는 6x6x6이 된다. 주사위 열개를 던지면 6^10이 된다. 이 주사위의 숫자가 바로 차원에 해당한다. 그래서 도대체 어떤 사람이 왜 폐암에 걸리는가라는 질문을 연구하기 위해 폐암과 관련이 될만한 항목을 20개쯤 모으면 가능한 경우가 너무 많아지는 것이다. 당장 사람들이 죽고 있는데 자료수집을 수백년씩 할 수는 없지 않은가. 

 

우리는 통상 장난감같은 문제만 들어왔기 때문에 이런 경우가 드물다고 생각하지만 실제로는 우리가 접하는 무수한 실생활 문제가 다 이렇게 높은 차원수를 가지는 문제다. 글자나 음성을 알아듣기 위해서는 수백차원 수천차원의 데이터를 다뤄야 한다. 동전한개를 가지고 앞면이 나올 확률과 뒷면이 나올 확률이 각각 0.5라는 것을 확인하기 위해서는 그저 몇백번 정도만 던져봐도 아주 정확히 확인할수가 있다. 하지만 아버지라는 음성을 듣고 그게 전에들었던 아버지라는 말과 같은 말이라는 것을 높은 확률로 확신하기 위해서 우리는 몇번이나 그 음성을 들어야 하는 것일까? 차원의 저주를 생각하면 평생 그 소리만 들어도 우리는 아버지를 알아듣기가 힘들다. 어떤 의미로 평생들어도 똑같은 말을 듣지 못한다. 그런데 아이들은 아주 쉽게 말을 배운다. 그것도 수없이 많은 단어를 다 배운다. 

 

이 예들은 우리가 일상에서 만나는 많은 불확실성 앞에서 어떤 문제를 가지게 되는가를 보여준다. 통계학을 주도했던 것은 소위 빈도주의자의 방식이라고 불리는 것이었는데 이 방식은 종종 별로 도움이 되질 않는다. 그리고 이와는 다른 베이지언 방식도 오랜간 별 도움이 되질 않았다. 베지이언의 경우는 이론적으로 어떤 토대가 있다고 해도 그걸 실질적으로 계산해 낼 수가 없었기 때문이다. 컴퓨터에 익숙한 우리와는 달리 베이지언 정리의 아버지중의 하나라고 하는 라플라스는 이러저러한 문제를 풀기 위해서는 곱하기가 몇만번 필요하다같은 무시무시한 말도 하면서 계산을 했다고 한다. 그러니 복잡한 차원의 저주문제가 나오는 실생활문제는 빈도주의적 접근은 원칙적으로 도움이 안되고 베이지언은 계산능력이 떨어져서 도움이 안되었던 것이다. 

 

그런데 이것이 컴퓨터가 등장하고 계산이 빠르게 행해질 수 있게 되자 이야기가 달라진다. 그 덕에 컴퓨터가 보편화된 20세기 후반기 이후 세상은 베이지언 방식이 득세하는 시대가 되었다. 이 책이 보여주는 것처럼 베이지언 방식은 몇번이나 죽고 망각되었지만 결국 부활한 것이다. 그 이유는 딱하나다. 빈도주의 접근이 불가능한 경우에도 그 방식을 쓰면 실제로 도움이 되더라는 것이다. 

 

이건 마치 텔레비젼이 어떻게 움직이는 지 몰라도 스위치를 누르면 방송이 나오더라는 상황과 비슷하다. 원시인을 상상해 보라. 그 원시인은 그 방송을 믿는게 아니라 그 방송은 악마가 보여주는 화면이며 따라서 맞을 때가 있어도 종종 엉터리 근거없는 답을 줄거라면서 텔레비전을 버리라고 할지 모른다. 양심있고 신을 무서워하는 자라면 저런 텔레비전은 부셔버릴것이야라고 저주한다. 이게 빈도주의자의 입장이다. 베이지언의 입장은 기본적으로 방송이 보이더라, 그 방송내용이 도움이 되더라라는 것이다. 

 

그런데 그리고 나서 사람들은 골치를 썩는 것이다.  그런데 이게 왜 말이되지?하고 말이다. 어떤 사람은 쉽게 납득하고 어떤 사람은 잘 모르겠지만 결과가 나오니까라고 말하면서 이해를 포기하며 어떤 사람은 신적인 영감을 받듯이 받아들이고 세상을 보는 눈을 바꾼다. 개종하는 것이다. 그래서 베이지언의 방식은 단순한 테크닉의 문제가 아니라 철학의 문제라고 말해지게 된다. 

 

다시 한국을 본다라는 문제로 돌아가보자. 대통령을 뽑는 대선도 한국을 보는 방법중의 하나다. 그것도 비싼 방법이다. 오랜간 선거기간을 거쳐 정보를 보내고 나이가 어린 학생들을 제외하면 전 국민이 다 참여해서 투표하게 만든다. 그 결과가 한국의 뜻, 한국의 선택이라고 믿고 우리는 정부를 구성한다. 

 

한국의 뜻이 그렇게 중요한데 왜 대선을 매달하지 않는가? 너무 비싸고 너무 느리기 때문이다. 왜 그럴까? 우리가 통계적 방법을 도입하면 국민의 뜻을 거의 실시간으로 알 수도 있지 않을까? 실제로 대선을 할 때 우리는 전체 결과가 나오기 전에 이미 결과를 예측하곤 한다. 여기서는 대선 이야기를 했지만 영화를 만든다거나 자동차를 팔거나 할 때 대중의 의사가 어떤 것인가를 빠르게 알아채고 반영하는 것이 현대에 얼마나 큰 이익을 주는가는 말할 필요가 없을것이다. 9시 뉴스앵커는 천명정도에게 질문해서 나오는 결과를 기반으로 국민은 이 문제에 분노하고 있다던가 용납하고 있다던가하고 주장한다. 그러므로 이렇게 저렇게 해야 한다고 그 결과를 해석한다. 하지만 그런 해석이 정말 옳다면 대선따위 필요없다. 실시간으로 여론조사를 해서 우리는 언제나 국민의 진짜 뜻을 확인할 수 있을 것이다. 

 

이런 것을 곰곰히 생각하면 정부의 형태에서 현대 사회의 구조가 마치 인간의 뇌나 눈같은 기관처럼 세상과 자기자신을 보기 위한 기관처럼 느껴진다. 그러니 우리가 세상을 보는 방식 즉 통계적 분석의 방식이 바뀌면 정치가 바뀌고 경제가 바뀌고 역사가 바뀔 것이다. 우리가 일상생활에서 계속 해서 던지는 질문들은 실은 통계적 질문들인 경우가 많기 때문이다. 결혼을 해야 할까 말아야 할까? 게임을 하면 정말 폭력성이 늘어날까? 게으른 사람은 정말 성공할 가능성이 없을까? 우리가 왼쪽을 선택했다면 그 선택을 평가하기 위해 우리는 가보지 않은 선택인 오른쪽이 생산할 결과를 예측해야 한다. 이것도 대개 확률추정이다. 

 

불멸의 이론의 마지막 문장은 이렇다. 

 

불멸의 이론은 이제 막 시작했을뿐이다.

 

어쩌면 백년쯤 지나면 철학과 종교 과학 예술 문제가 모두 통계문제라고 생각하는 시대가 올지도 모른다. 그리고 인공지능같은 새로운 도구가 열심히 새로운 방식으로 그 계산을 해주고 있을지도 모른다. 결국 따지고 보면 우리의 인식의 문제가 바로 부족한 자료에 기반하여 현실을 만들어 내는 확률적 근사의 문제이기 때문이다. 너 자신을 알라라고 말하는 고대 그리스의 질문은 베이지언의 시각을 통해서 그 의미가 다시 해석된다. 실체라는게 뭔지, 나라는게 뭔지 어떻게 추정할 것인지 확률적으로 사고하고 질문하게 되는 것이다. 

 

 

댓글