거대 AI의 개발이 가장 급한 일일까?
챗GPT3.5의 등장이래 세계는 핵경쟁을 이야기할 정도로 AI에 대한 치열한 경쟁에 들어섰다. 그야말로 가장 먼저 AGI라고 불리고는 하는 슈퍼 AI의 개발에 도달하는 나라나 회사가 지구 정복이라도 할 것같고 나머지는 식민지가 될 것같은 분위기다. 몇백조의 투자를 발표하는 일이 계속되는 가운데 경제 규모가 작은 회사나 나라는 이런 경쟁에서 가망이 없어 보인다. 우리나라에서도 AI 투자에 목소리를 높이는 사람이 많이 있는데 이런 주장이 꼭 틀린 것은 아니겠지만 나는 지금 세계가 좀 잘못된 투자를 하고 있다고 생각한다. 어쩌면 우리는 조만간 AI에 투자한 사람들이 큰 낭패를 보는 걸 보게 될지도 모른다.
사람들은 AI 개발을 구글이나 아마존 같은 회사의 성공 사례와 혼동하는 것같다. 즉 AI를 개발한 선점효과가 엄청나다고 생각하는 것이다. 하지만 정말 그럴까? 그러니까 예를 들어 오픈 AI의 AI가 정말 뛰어나면 제 2, 제 3의 AI들은 사용되지 않을까? 그렇지 않다. AI를 사용하는 것에는 여러가지 이유가 있다. 예를 들어 성능이 좀 문제가 있다고 하더라도 한쪽은 완전 무료인데 다른 쪽은 상당한 사용료를 요구한다면 사람들은 무료 AI를 쓸 것이다. 게다가 AI의 사용을 교체하는 것은 네이버나 아마존같은 서비스를 교체하는 것과 다르다.
그 첫번째 이유는 AI는 보이지 않는 곳에서 작동하기 때문이다. 예를 들어 보자. 내가 쓰는 프로그램 중 하나인 AIexe라는 프로그램은 내가 명령을 내리면 AI로 하여금 코딩을 하게 하고 그걸 실행해서 내 컴퓨터에서 작업을 하게 하는 프로그램이다. AI 에이전트 프로그램이라고 할 수 있다. 예를 들어 이 디렉토리안에 있는 사진 중에서 서울에서 촬영된 것만 골라서 다른 디렉토리로 옮겨줘라고 하면 그렇게 해주는 프로그램이다. 그런데 이런 작업을 할 때 이 프로그램은 꼭 챗GPT나 클로드같은 특정 AI만 쓰는게 아니라 내가 그걸 지정할 수 있다. 말하자면 챗GPT나 클로드같은 AI는 자동차의 엔진같은 역할을 한다면 AIexe는 자동차다. 그래서 자동차를 운전하는 사람은 지금 이 차의 엔진이 어느 것인지를 꼭 몰라도 된다. 어느 쪽이든 더 좋은 성능을 내고 싼 값에 쓸 수 있는 걸 쓰면 된다. 그러니까 한번 한쪽 AI를 쓰게 되면 영원히 그쪽에 귀속되게 되는 그런 효과가 없다.
두번째 이유는 AI 기술발달이 빠르기 때문이다. 지금 세계는 더 강력한 AI를 개발하려고 노력할 뿐만 아니라 더 작은 AI 더 작은 에너지를 소모하는 AI를 개발하고 있다. 그래서 지금 세계에서 가장 강력한 AI를 개발해도 몇년만 지나면 그것보다 훨씬 작은 크기인데도 같은 성능을 내는 AI가 개발된다. 더구나 그건 아예 무료일 수도 있다. 그러니까 개발비를 수십조 들여서 AI를 만들어도 그걸로 벌어들일 수 있는 시간차이는 불과 수년이거나 그것도 안된다는 것이다.
누군가 에베레스트 산을 처음 오르면 그건 참으로 힘들지만 그 다음에는 그걸 오르는 사람들이 무더기로 나오기 마련이다. 그 산을 오를 수 있다는 것이 이미 알려졌기 때문이다. 그러니까 최신 챗GPT같은 AI의 개발은 시간 문제일 뿐 금새 훨씬 많은 나라가 할 수 있는 일이 될 것이다. 물론 컴퓨팅 파워같은 문제가 있기는 하지만 그런 것이 필요하다는 것이 알려지면 개발도 시간문제다. 필요한 컴퓨팅 파워를 확보하는 문제도 몇년 지나지 않아 어느 정도 해결될 것이다. 그리고 알고리듬도 개발되어 더 작고 더 효율적인 방법이 개발될 것이다. 그렇게 되면 처음 챗GPT를 개발한 사람이 쓴 시간과 컴퓨팅 파워와는 비교도 안되는 작은 양의 투자로도 비슷한 결과를 얻을 수 있게 될 것이다. 실제로 최근에는 중국의 오픈 소스 AI 딥시크가 등장했다. 물론 논란의 소지가 있고 확실한 것은 아니지만 이 AI는 오픈AI의 최신 AI에 비하면 20분의 1정도의 비용으로 개발되었는데도 상당한 성능을 보여준다고 한다.
여기에는 데이터 문제도 있다. 텍스트 데이터에 대해 말하자면 이미 인류가 이제까지 생산한 모든 데이터가 AI 학습에 사용되었다. 그래서 멀티 모달이라고 해서 동영상, 이미지, 음성 데이터 이야기가 많이 나오는 이유는 이때문이기도 하다. 텍스트 데이터가 더 없으니 동영상 데이터를 더 쓰자는 식이랄까. 그러나 멀티모달방식으로의 확장은 필요한 것이기는 하겠지만 나는 그것이 챗GPT 3.5가 보여준 충격적 성능향상을 보여주지는 못할 거라고 생각한다. 말하자면 돈을 더 퍼부어도 성능이 좋아지는 속력이 한계에 다다르게 된다. 애초에 덱스트 데이터는 매우 중요한 데이터였다. 그건 그냥 데이터가 아니라 인간의 지능적 활동의 결과물이다. 그걸로 얻어진 성능향상과 비슷한 것을 동영상 데이터를 주면 또 얻을 수 있을 거라고 생각해서는 안된다. 수없이 영화를 많이 보면 AI가 F=ma라는 뉴턴 방정식을 쓰는 고전역학을 혼자서 깨달을 거라고 생각하는 건 무리다.
이걸 종합하면 지금 천문학적인 돈을 들여서 AI를 개발하고 비싼 GPU니 TPU를 사들이는 사람들은 바보짓을 하고 있다는 것일까? 그렇지는 않다. AI에 대해서는 많은 투자가 필요하다. 다만 우리는 우리가 어떤 미래에 도달해야 하는가에 대해서 조금 오해하고 있으며 그때문에 한쪽으로 너무 관심이 치우쳐 있다는 것이다. 이 글에서 자세히 설명하기에는 글이 너무 길어질 것이기 때문에 결론적으로 말하자면 우리가 도달해야 하는 것은 인간과 기계와 AI가 연결된 AI 에이전트 사회, 지능적 네트워크의 사회다. AI는 이 사회에서 소통의 미디어로 사용될 것이며 그 사회에서는 중앙의 슈퍼 AI 하나가 모든 일에 대한 답을 주는게 아니라 수없이 많은 AI와 인간들이 서로 연결되어 총합을 이뤄서 답을 도출해 낼 것이다. 그 AI들은 인간과 인간 사이를 이어주는 새로운 언어같은 역할을 할 것이다.
이런 망을 건설하는 것이 진짜 선점효과를 발휘할 분야다. 뛰어난 집단적 지능을 가진 사회가 내가 상상할 수 있는 가장 AGI에 가까운 존재다. 우리는 지금 말하자면 최고의 자동차를 만들면 저절로 새로운 교통 시스템을 가진 사회가 온다고 착각하고 있다. 하지만 자동차가 달릴 길이 없으면 자동차의 성능은 제대로 쓰이지 못할 것이다. 인터넷으로 연결된 컴퓨터로 채워진 21세기를 사는 우리는 지금의 세상이 슈퍼컴퓨터가 사회의 중앙에 한대 있고 그 컴퓨터 혼자서 문제를 해결하는 사회가 아니라는 것을 알고 있다. PC도 없던 1950년대쯤에 어떤 사람이 미래는 슈퍼 컴퓨터 하나가 문제를 해결하는 시대일거라고 생각하면서 슈퍼컴퓨터 개발에만 몰입하는 것을 상상해 보라. 그것이 지금의 상황과 비슷하다.
뛰어난 AI를 개발하는 일의 가치를 폄하할 수는 없다. 그러나 미래는 거대 AI 하나가 존재하는 세상이 아니고 수없이 많은 종류의 AI가 한꺼번에 작동하는 시대다. 실질적으로 일상에서 문제를 해결하려면 그래야 한다. 지금 세계에서 가장 비싼 AI를 데려와도 그 AI가 pc에서 돌아가는 작은 장기 프로그램과 장기를 두면 장기를 이길 수 없다. 이것은 특정한 문제에서는 그 문제에 특화된 프로그램 혹은 AI가 거대 AI보다 훨씬 좋은 답을 준다는 것을 보여준다. 자동차가 사방에 있어도 안방에서 화장실에 가면서 자동차 타는 사람은 없다.
그런데 투자도 그렇지만 사람들의 관심은 온통 슈퍼 AI의 등장에 매몰되어 있다. 이것은 멀지 않은 장래에 큰 실망을 가져올지도 모른다. 몇백조를 들여서 개발한 AI가 실제로 투자금을 회수하지도 못한 상태에서 몇년을 보내면 그것의 수백분의 1의 투자로 만든 AI보다 성능이 뒤쳐질 수 있다. 그리고 그렇게 돈을 한쪽에만 투자하면 AI 대중화는 오히려 늦어질 수 있다. AI 투자는 필요하지만 그것이 어떤 방면으로 쓰여야 하는가에 대한 조심스런 생각이 필요하다. 길은 안만들고 자동차만 개발하고 있는 것은 아닌지 고민이 필요하다. 특히 한국처럼 경제규모가 크지 않은 나라에서는 고민이 더욱 필요하다. 그렇지 않으면 쓸 수 있는 돈이 고갈되어 버릴테니까 말이다.