본문 바로가기
주제별 글모음/과학자의 시선

반직관적인 확률계산

by 격암(강국진) 2017. 11. 12.
반응형

논리적인 추론이란 이따금 우리의 직관과는 전혀 반대일 수 있다. 그걸 보여주는 예를 하나 소개해 보겠다. 


어느 마을에서 범죄가 일어났다. 그런데 범죄현장을 조사한 결과 이 범죄를 저지른 사람들은 이인조인데 둘중의 한 사람은 아주 드문 희귀병을 가지고 있었다. 이 희귀병을 가진 사람은 전체 인구중 천명중 한명밖에 없다. 이때 경찰은 철수라는 사람을 용의자로 검거하고 이 사람이 이 희귀병을 가졌는가를 테스트한다. 그 테스트 결과는 이 사람이 희귀병이 없다는 것이었다. 


이때 확률계산에 서툴렀던 형사는 생각한다. 어차피 두 명중의 한 사람은 희귀병이 없다는 것을 알고 있었다. 이 테스트 결과는 범죄 현장에 나타난 사실과 모순되지 않는다. 그러므로 철수가 희귀병이 없다는 사실은 대단한 증거는 아니겠지만 이 용의자가 범인일 확률을 조금은 증가시킬 것이다.   


그런데 사실은 테스트 결과 이 용의자가 희귀병이 없다는 사실은 이 용의자가 범인일 확률을 거의 절반으로 줄인다. 대부분의 사람들은 희귀병이 없기 때문에 두 사람을 무작위로 뽑았을 때 한 사람은 희귀병이 없고 한 사람이 희귀병이 있을 확률은 약 0.2%가 된다. 희귀병에 걸릴 확률은 0.1%이지만 두 사람이기 때문에 두 사람중의 어느 쪽이든 희귀병에 걸려 있으면 되는 것이라서 확률이 약 두배가 되는 것이다. 


그런데 만약 철수가 범인 중의 하나라면 이제 나머지 한 사람은 반드시 희귀병에 걸린 사람이어야만 한다. 사람들 중에서 무작위로 하나를 뽑았을 때 이런 사람이 나올 확률은 이제 0.1%다. 다시 말해서 철수가 범인이라는 것을 가정하는 순간 사건 현장에서의 상황은 전보다 더 있기 힘든 일이 된다. 그러므로 비록 철수가 희귀병에 걸려있지 않다는 사실이 사건 현장의 증거와 모순되지는 않지만 굳이 따지자면 철수가 범인이 아닐 확률을 두배로 늘려주는 것이다. 


또다른 예를 하나 들어 보자. 이번에는 정보라는 말이 가지는 혼란에 대한 것이다. 


철수는 누군가가 전화로 이야기하는 것을 듣고 있다. 철수는 말이 너무 나지막해서 이것이 엄마인지 아빠인지 알 수가 없다. 가만히 귀를 기울여 보니 대화의 대용이 여자들이 할 내용인 것같이 들려서 철수는 이것이 엄마라고 거의 확신했다. 그런데 다음 순간 전화로 이야기하는 사람이 하는 말이 욕처럼 들렸다. 그러자 철수는 이것이 엄마라고는 믿을 수 없게 되었다. 엄마는 욕을 하지 않기 때문이다.


우리는 통상 더 많은 정보를 들으면 우리가 가지는 정보량이 증가하고 세상을 우리가 더 많이 알 수 있다고 생각한다. 정보를 일종의 물이나 돈처럼 우리가 저장창고에 집어넣는다고 생각하는 것이다. 그러니까 데이터란 더 많으면 많을 수록 좋고 책이란 더 많이 읽으면 읽을 수록 좋으며 더 많은 사람과의 대화는 우리에게 더 많은 정보를 준다고 생각한다. 


그런데 정보이론에서 말하는 정보란 정확히 말하면 이런 것이 아니다. 정보란 우리가 가지는 불확실성을 얼마나 줄여줄 수 있는가 하는 것이다. 그래서 어떤 데이터는 그 데이터를 가짐으로 해서 오히려 우리의 불확실성이 증가할 수도 있다. 위에서 말하는 예에서 엄마는 거의 욕을 하지 않지만 하필이면 그 순간에 욕을 했다고 하자. 그러면 그 욕이라는 데이터는 오히려 불확실성을 증가시켜서 우리로 하여금 이것이 엄마인지 아빠인지를 더욱 알 수 없게 된다. 이 예는 모든 데이터는 정보를 가지고 있다는 우리의 직관에 반대된다. 어떤 데이터는 반정보적이다. 그러니까 나쁜 언론이 그런 데이터만 골라서 제공한다면 그 언론은 정보를 제공하는 곳이 아니라 오히려 정보를 빼앗아 가는 곳이 될 수도 있다. 


사람들은 일단 어떤 선입견을 가지게 되면 주어진 증거가 자신의 믿음과 충돌하는가 그렇지 않은가만 보는 경향이 있다. 우리가 일단 어떤 것을 믿으면 그 믿음을 버리기가 쉽지 않은 이유는 확률을 따져보면 그 믿음이 더 믿기 어려운 증거가 되는 일을 목격해도 심지어 그것을 거꾸로 자신의 믿음이 옳다는 증거로 삼기 때문이다. 


예를 들어 여기 어떤 정치인이 있다고 해보자. 어떤 사람들은 그가 부패한 정치인이라고 주장한다. 그런데 가만히 보면 이 사람은 사실 돈이 없어 보인다. 본인은 물론 이거니와 그 주변의 사람들이 그렇게 대단히 잘살지 않는다. 그런데도 어떤 사람들은 그건 그 부패한 정치인이 부정한 방식으로 모은 돈을 기가 막히게 숨기고 살고 있다는 증거라고 생각한다. 검소하게 별다른 사치없이 살아가는 그 모습은 그가 교활한 인간이라는 증거일 뿐이다. 검소하게 살면서도 교활하게 돈을 숨기는 것도 가능은 하겠지만 그것은 훨씬 더 어려운 일이라는 점을 인정하지 않으려고 한다. 일단 그는 부패한 정치인이라고 믿기 때문이다. 왜 그렇게 믿었을까? 주변 사람들이, 친한 사람이 그렇게 말하고 있으니까 그렇다. 


어떤 사람들은 보통사람은 도저히 믿을 것같지않는 음모론이나 사이비종교에 사람들은 빠져드는 것같다. 너무나 수상한 사람을 믿거나 너무나 멀쩡한 사람을 의심한다. 물론 모든 놀라운 이야기가 다 사기는 아니다. 음모론처럼 보여도 그것이 합리적인 의심이라면 지적하는 것이 좋다. 중요한 것은 때로는 한발 한발만 앞으로 가는게 아니라 뒤로 확 물러나서 전체적인 증거를 다 한꺼번에 볼 필요가 있다는 것이다.  그럴 때 그럴듯하다고 생각되었던 이야기가 전혀 다르게 보일 수도 있다. 우리의 직관과 논리적 확률계산이 다른 경우가 있다는 예는 이런 주장에 설득력을 더한다.  

반응형

댓글0