본문 바로가기
독서와 글쓰기/오늘의 질문

오늘의 질문 : 통계는 왜 윤리의 미래인가.

by 격암(강국진) 2019. 1. 25.










안녕하세요. 오늘의 질문. 강국진 입니다. 오늘은 통계는 윤리의 미래인지에 대해 이야기해 보겠습니다. 


먼저 과거의 법과 윤리에 대해서 생각해 봅시다. 세상이 느리게 움직이고 단순하던 시절에는 윤리도 단순했습니다. 저작권같은 없으면 저작권을 침해할 수도 없죠. 결혼제도가 없는 곳에서는 다른 사람의 배우자를 유혹하면 안된다는 금기도 있을 수가 없습니다. 


그런데 여러 사람들이 모여서 살려고 하니까 법과 윤리가 생깁니다. 예를 들어서 사람이 사람을 죽이면 안된다는 것도 사실은 말도 안되는 법칙입니다. 실제로는 사람들은 언제나 전쟁을 하면서 다른 사람들을 죽여왔기 때문입니다. 다시 말해서 누구는 죽여도 되고 누구는 죽이면 안되는지를 구분할 필요가 있었을 뿐이었다는 겁니다. 이것은 결국 누군가를 죽이려면 어떤 권위있는 존재에게 허락을 받던지 아니면 오직 왕같은 권위있는 사람만 사람을 죽을 있는 권한이 있다는 뜻이 됩니다. 그래서 아무리 억울해도 복수를 위해서 사람을 죽여서는 안됩니다. 누가 아버지를 죽여도 내가 직접 살인범을 죽이면 나도 살인범이 됩니다. 우리는 신고를 하고 누군가가 살인범을 잡아서 처벌을 하도록 해야 하는 겁니다. 


세상이 단순하던 시절에는 법이 복잡할 필요가 없었습니다. 그냥 지도자의 명령을 따르는 것이 법이라고 하면 거의 충분했죠. 죽이든 살리든 리더가 결정하는 겁니다. 하지만 그룹이 커지면 금방 사람의 지도자가 모든 일을 제대로 처리할 수가 없습니다. 그러니까 윤리는 법으로 기록되어져서 인간이 아니라 법조문에 따라서 사람들을 처벌을 하게 되고 상도 주게 되는 겁니다. 이런 의미에서 말하자면 법은 최초의 기계중 하나입니다. 우리가 처리해야 사건에 대한 정보를 법이라는 것에다 입력시키면 법은 우리가 어떤 행동을 해야 하는지를 출력해주는 정보처리장치인 겁니다. 이전에는 사람이 하던 일을 기계가 대신해 주기 시작한 것이죠. 물론 법을 해석하고 집행하는 많은 인간들의 도움을 받아야했기는 하지만 말입니다. 


물론 이야기는 여기서 끝이 아닙니다. 인간의 문명이 발달함에 따라서 우리는 점점 넓은 영역에 걸쳐서 그리고 점점 많은 사람들과 영향을 주고 받게 되었습니다. 그래서 윤리도 예절도 법도 점점 복잡해 밖에 없었습니다. 


이렇게 윤리는 우리가 통상 이해하고 있는 영역을 넘어가기 시작합니다. 우리가 생각하는 윤리란 상식적으로 이런 것이죠. 


좋은 일을 하고 나쁜 일을 하지 말자. 


그러니까 윤리적 금기나 법이란 나쁜 일을 금지하는 것입니다. 예를 들어서 위에서 말한 것처럼 사람을 죽이면 안된다 같은 법을 만드는 것이죠. 


그런데 사람이 사람을 죽인다는 무슨 뜻일까요. 단순한 세상에서는 사람이 사람을 죽인다는 것이 무슨 뜻인지는 명백했습니다. 그건 다른 사람을 칼로 찌르면 안된다거나 절벽에서 밀어서 떨어뜨리면 안된다거나 독이 물건을 먹이면 안된다거나 하는 것이었습니다. 우리가 누군가를 죽인다고 그것이 구체적으로 어떤 행동을 의미하는 것인지가 보다 분명했습니다. 그리고 누가 누구를 죽였는지가 아주 알기 쉬웠죠. 


그런데 복잡한 세상에서는 그게 어렵습니다. 담배는 폐암을 일으킨다고 알려져 있습니다. 그러면 길에서 담배를 피우는 사람은 길에 다니는 사람들을 모두 죽이고 있는 걸까요? 위험한 공정을 통해서 만들어지는 물건을 소비하는 소비자는 그걸 만드는 공장의 노동자들을 죽이고 있는 걸까요? 재개발 사업을 추진하는 회사는 지역의 가난한 사람들을 죽이고 있는 걸까요?


이런 질문들은 끝없이 많습니다. 그리고 우리는 대개 이런 질문들에 대해서 아니라고 말하게 됩니다. 우리는 알게 모르게, 사실 대부분은 의식도 하지 않는 채로 많은 일들을 행하고 있습니다. 이런 일들의 결과 사람들이 죽는다고 해서 그걸 살인죄로 처벌한다면 우리는 현대사회에서는 아무 일도 없을 것입니다. 예를 들어서 청년 취업을 지원하는 것에 대한 예산을 삭감한 국회의원이 있다고 해봅시다. 그런데 취업을 못해서 절망한 나머지 자살한 청년이 생겼습니다. 국회의원은 청년을 죽인 사람이니까 살인죄로 처벌해야 할까요? 그렇게 하기는 현실적으로 어렵습니다. 적어도 언제나 그렇게하기는 불가능합니다. 


그런데 그렇다고 해서 모든 일들에 대해서 상관없다. 괜찮다고 하면 사실은 실질적으로는 합법적으로 사람을 죽일 방법을 가르쳐 주는 것이 되기 때문에 사회가 유지될 수가 없습니다. 그건 마치 다른 걸로 사람을 죽이면 살인이지만 망치로 사람을 죽이면 그건 사람을 죽인 것이 아니라고 법을 만드는 거나 마찬가지입니다. 그렇다면 사람들은 살인을 하고 싶을 때마다 망치를 쓰겠죠. 사실 이런 면때문에 현대 사회에서는 많은 살인자들이 법의 처벌을 피해가고 있는 것도 사실입니다. 


그래서 이런 복잡한 세상에 등장하는 것이 바로 기록이고 데이터입니다. 앞에서 흡연과 폐암의 관계에 대한 예를 말했었는데요. 우리는 데이터를 통해 간접흡연의 위험도를 이야기할 있고 따라서 거리에서 흡연을 하는 것을 어느정도로 처벌할 것인가 하는 것은 이제 데이터의 수집과 분석의 문제가 되는 것입니다. 


우리는 우선 필요한 데이터를 모아야 합니다. 처음에는 어떤 일이 벌어졌는지의 이유를 알아내는데 그걸로 충분합니다. 하지만 데이터가 너무 많아지면 그걸 분석하는 일이 점점 어려워 집니다. 그리고 바로 데이터의 분석방식을 가지고 우리는 논쟁을 하게 됩니다. 이런 행위는 거의 책임이 없다. 저런 행위는 거의 직접적 살인이나 마찬가지다하고 싸우게 되는 거지요. 그래서 요즘은 뉴스를 보거나 신문기사를 읽으면 대개는 데이터를 분석한 내용이 가득합니다. 그런 근거를 집어넣지 않고서는 신빙성이 떨어진다고 사람들은 생각합니다. 


많은 양의 데이터를 분석하는 학문을 우리는 바로 통계학이나 확률론이라고 부릅니다. 시간이 가면 수록 우리는 점점 A B다라고 말하는 대신에 A B 확률은 80% 같은 식으로 말하고 생각하게 됩니다. 이미 일기예보도 그렇게 하고 있지요. 그래서 오늘날은 확률에 대해서 이해하는 것이 아주 중요합니다. 오늘 제가 하고 싶은 말을 다르게 말하면 문자를 지배했던 사람들이 권력을 가졌던 것이 과거라면 앞으로는 확률이나 데이터를 지배하는 사람들 확률계산을 지배하는 사람들이 권력을 가질 거라는 겁니다. 사물을 판단하는 근거가 데이터니까요. 


그런데 확률에 대해서는 사람들이 흔히 모르는 사실이 두가지가 있습니다. 첫째로는 확률론은 매우 최신의 학문이며 어떤 의미에서 양자역학이나 상대성 이론보다도 최신이라는 겁니다. 왜냐면 우리가 주어진 데이터를 어떻게 다뤄야 할지에 대해서는 지금도 정확히 합의가 이뤄지고 있지 않기 때문이죠. 간단히 말하면 확률이 뭔지를 학자들도 모르는 겁니다. 그런데도 모두가 확률을 쓰고 있습니다. 


보통 사람들은 확률이라고 하면 골치아프다고 생각하지만 사실은 자신이 확률이 뭔지 안다고 생각하는 경우가 많습니다. 그러니까 동전을 던지면 앞면이 나올 확률이 0.5이고 뒷면이 나올 확률이 0.5라는 것이 확률이라는 겁니다. 


그런데 여기 이런 예를 들어 봅시다. 여기 새로운 비행기가 출시되었습니다. 그래서 비행기는 한달정도 운행을 했지만 아직 한번의 사고도 적도 없습니다. 그런데 보험사 사장이 직원에게 묻는 겁니다. 


비행기는 사고날 확률이 얼마나 되지?


이건 중요한 질문입니다. 왜냐면 보험료를 받을 사고날 확률에 따라서 보험료를 받기 때문입니다. 보험료를 아주 싸게 받았는데 대형사고가 벌어지면 보험사는 망하겠죠. 그렇다고 한도 끝도 없이 무조건 보험료를 비싸게 받으면 사람들이 보험을 들지 않을 겁니다. 


그런데 사장의 질문에 대해서 직원이 이렇게 대답한다고 해봅시다.


비행기는 아직까지 사고난 적이 없으니 사고날 확률은 0입니다.


이런 답은 이상합니다. 그런데 이게 바로 우리가 확률이라는 것을 제대로 정의하기 힘들다는 것을 보여주는 예입니다. 확률을 단순하게 이해하면 주사위를 열번 던졌는데 1 2 나오면 1 나올 확률은 5분의 1이라고 해야 하는 겁니다. 그러니까 방식대로라면 아직 비행기 사고가 안났으면 사고가 확률이 0이라고 해야 하는 거지요. 이것을 빈도주의자의 확률이라고 부릅니다. 


그리고 물론 빈도주의자의 확률은 여기서 명확히 말이 안되는 결론을 주지요. 이런 식으로 확률을 계산하면 첫번째 비행기 사고때 보험사는 파산할 있습니다. 사고가 나는 데이터 하나를 수집하는 순간 회사가 망할 있다는 겁니다. 


핵전쟁을 하면 우리가 살아남을 있는 확률은 얼마가 될까요? 빈도주의자식으로 계산하자면 우리는 여러번 핵전쟁을 해보고 몇번 살아남는가를 따져야 합니다. 이건 말이 안되죠. 그리고 핵전쟁이나 비행기사고가 아니라고 해도 오늘날 우리는 아주 자주 한번도 일어나서는 안되는 것의 확률을 따질 때가 많습니다. 사람들에게 약을 주고 나서 결과를 보고 약을 먹으면 죽을 확률을 계산하면 안되죠. 


이제 약간 정리를 봅시다. 저는 윤리나 법이란 데이터에 의존하게 된다고 말했습니다. 그리고 데이터를 분석하는 것이 바로 통계고 확률론이라고 말했죠. 그런데 확률의 정의가 심지어 전문가에게도1 + 1 = 2같은 산수처럼 명백하지 않다면 우리는 어떤 상황에 있는 걸까요? 어떤 공사를 해도 손해를 확률이 없다고 전문가가 말할 우리는 그냥 그걸 믿으면 될까요? 전문가는 정말 제대로 확률을 계산하고 있을까요? 전문가니까? 확률 계산이 전문가 사이에서 서로 틀리면 누굴 믿어야 할까요? 또다른 전문가를 불러와야 할까요?


사람들이 종종 모르는 두번째 사실은 간단합니다. 인공지능이나 기계학습이라고 부르는 학문은 사실 통계나 확률론의 분야입니다. 데이터를 어떻게 다룰까에 대한 한가지 해법입니다. 그리고 요즘 유명한 딥러닝은 바로 기계학습을 하는 여러가지 방법 중의 하나죠. 


그러니까 저는 통계가 윤리의 미래라고 말했지만 인공지능의 발전에 따라서 우리는 얼마 지나지 않아 이렇게 말할 수밖에 없을 수도 있습니다. 


인공지능은 윤리의 미래다. 혹은 딥러닝은 윤리의 미래다. 이렇게 말입니다.


이제까지 제가 말씀드린 것을 주의깊게 들으신 분은 통계가 윤리의 미래인지, 우리가 그걸 피할 없는지를 이해하셨을 겁니다. 우리는 점점 통계적 분석결과 없이는 아무 것도 주장할 없는 세상에 살게 되고 있습니다. 우리의 직관적인 느낌에 어떤 행동이 아주 나쁘다고 해도 분석결과 별로 영향이 없는걸로 나오면 우리는 직관을 버리고 계산을 믿어야 합니다. 통계에 대한 인간의 직관이란 수십만년전의 원시시대때 진화한 것이기 때문입니다. 통계에 대한 인간의 직관이 매우 부정확하다는 증거는 세상에 차고 넘칩니다. 그러니까 우리는 점점 통계에 의존해서 윤리적 판단을 밖에 없는 것입니다. 우리의 직관과 감정에만 의존하는 것은 원숭이가 제트기를 운전하게 하는 것이나 마찬가지입니다. 


이런 일은 복잡한 세상에 산다면 결코 피할 수가 없을 것입니다. 그리고 세상은 지금 이순간에도 맹렬히 복잡해지고 있지요. 우리는 문제들에 대해서 깊이 고민할 필요가 있습니다. 적어도 말도 안되는 통계계산에 속지 않기 위해서는 말입니다. 오늘은 여기까지 하겠습니다. 오늘의 질문 강국진이었습니다. 






  


댓글