인간과 AI의 차이

요즘은 indiebizOS라는 에이전트 시스템의 언어인 ibl을 다시 만지는 일을 하고 있습니다. 이게 굉장히 큰 일이라 느리군요. 게다가 언어를 한단계 한단계 고쳤는데 22단계까지 갔으니 일이 많습니다. 이 많은 일의 끝에서 천국에 도달할 것인지 아니면 실망할 것인지는 사실 알 수 없지요. 제가 믿는 건 있지만 항상 믿음이 현실이 되는지는 않으니까요. 특히 제 유한한 능력과 자원을 가지고는 말이죠.

일을 하다보니 언제나 그렇지만 인간에 대해서, 인간의 언어와 환경에 대해서 생각하게 됩니다. 그리고 거기에서 언어의 진화나 최적화가 하는 역할에 대해서 생각하게 되는 것이죠. 제가 하는 일은 AI 에이전트로 하여금 그 에이전트의 환경을 잘 반영하는 언어를 사용해서 일을 하게 하는 것입니다. 예를 들어 보면 유튜브에 관련해서 저는 3개의 도구를 만든 적이 있습니다. 1번은 유튜브 동영상을 주면 그 동영상의 자막을 다운받아서 사용자가 원하는 길이로 요약해 주는 도구입니다. 2번은 유튜브 동영상의 음성 부분을 다운받아서 mp3 파일로 저장해 주는 도구입니다. 그러니까 음악이나 강연을 저장해 주는 도구이지요. 3번은 유튜브 동영상을 검색해서 그걸 PC에서 틀어주는 도구입니다. AI에게 김필의 노래를 틀어줘라고 하면 김필의 노래들을 검색해서 틀어주는 프로그램입니다.

이 하나 하나의 도구를 액션들이라고 하면 액션1을 취해라는 명령은 1번 프로그램을 구동하는 것이 될 것입니다. 그런데 이 3가지 액션들을 하나 하나 보면 이건 복합액션내지 합성액션이지 원자적 액션이 아닙니다. 그러니까 찾아서 음악을 튼다는건 찾는다와 음악을 튼다는 액션의 합이고 찾는다는 행동은 모든 유튜브 프로그램에 공통된 액션이라는 말입니다. 그래서 액션들을 분해하고 각각의 액션들을 원자적 액션들의 합으로 표현하는 것이 자연스럽지요.

이 자연스럽다는 것이 곧 언어의 개발입니다. 유튜브에 대해서 제가 뭘 명령하든 자연스러운 행동들의 합으로 그걸 표현할 수 있으면 그 자연스러운 행동들의 집합은 아주 많은 일들을 해낼 수 있을 것입니다. 이것이 좋은 언어인데 만약 언어속에 복합명령만 있으면 그걸 조합해서 뭘 할 수가 없으니까요. 그러니까 최소 숫자의 액션들로 훨씬 더 많은 복합액션을 생성할 수 있게 만드는 것이 언어의 최적화내지 개발 또는 진화라고 할 수 있겠지요.

이것은 물론 유튜브라는 좁은 영역이 아니라 AI 에이전트가 할 수 있는 수 많은 액션들에 대해서 다 적용되는 것입니다. 사실 이제까지 저는 그 수백개의 프로그램들을 전부 파이선으로 작성했습니다. 그러니까 파이선은 강력한 언어죠. 그런데 파이선이 있는데 새언어가 필요한 이유는 파이선은 AI 에이전트의 환경을 보여주기에는 너무 제약이 없기 때문입니다. 그래서 노드들에게 액션을 시킨다라는 정신으로 새로운 언어들을 짠 결과가 ibl입니다. 경험도 능력도 없어서 고생하고 있지만 말입니다.

그런데 이런 일을 생각하다보니 뇌가 인간의 육체를 조종하는 것도 이런 과정을 거쳤을 거라는 생각이 들었습니다. 뇌와 인간의 신체는 신호를 주고 받지만 유한한 속력으로 그렇게 합니다. 그러니까 몸이 넘어지는 것을 보고 있어도 반사적으로 몸을 움직여서 문제를 해결하는 건 쉽지 않은 거비다. 이렇게 효율적으로 뇌가 육체를 조종하기 위해서는 육체와 육체를 둘러싼 환경을 잘 반영하지만 또 충분히 자유도가 있어서 온갖 행동을 할 수 있는 신호체계가 필요합니다.

이것은 분명 오랜 진화를 거치면서 피드백을 주고 받으면서 발달했을 겁니다. 다리가 없으면 그 다리로 달리라는 신호는 무의미합니다. 하지만 다리가 있어도 그 다리를 잘 조종하지 못하면 우리는 넘어지고 말 겁니다. 그러니까 육체가 진화해서 새로운 기능을 가지게 되는 것도 중요하지만 이미 있는 육체를 최대한의 효율을 가지고 조종할 수 있는 신호체계도 중요합니다. 이미 날 수 있다면 2번째 날개는 필요없겠죠.

육체뿐만이 아닙니다. 인간은 분명 단순히 태어나지 않습니다. 인간에게 타고난 언어를 위한 본능이나 시스템이 있다고 해도 아무 것도 배우지 않아도 현대 언어를 알고 읽고 쓰기를 알 수는 없습니다. 우리는 태어난 후에 후천적으로 학습을 통해서 우리의 환경속에서 잘 살아가는 방법을 배우는데 그 것중의 중요한 한가지가 언어나 글쓰기지요. 그걸 잘하는 것은 정말 오랜 시간이 걸립니다. 어쩌면 어떤 사람이 하나의 사상을 갖춘다는 것의 의미는 상당부분 그냥 단어를 나열하는 방법을 익히는 것일지도 모릅니다. 적어도 사피엔스를 쓴 유발 하라리는 그렇다고 단언하더군요. 우리는 그런 기술을 배워서 복잡한 사고라는 탑을 쌓을 수있는 겁니다. 그것이 있어야 복잡한 문명 사회속에서 살아갈 수 있는 거고요.

이렇게 인간이 유전적으로 타고나는 것이 있지만 후천적으로 학습하는 것이 있듯이 AI 역시 기계학습으로 가지고 있는 것 이외에도 자기 주변에 어떤 도구나 시스템을 더할 필요가 있는 겁니다. 제가 하는 ibl의 개발은 그래서 어떤 의미로 어린 아이에게 말을 가르치는 것과 같습니다. 물론 llm은 말을 잘합니다. 그렇지만 인간처럼 세상과 소통하면서 익힌 것이 아니기 때문에 주어진 상황에서 어떻게 행동해야 하는지를 잘 모릅니다.

이것이 소위 컨텍스트의 문제라는 것이고 그래서 그걸 제공하기 위해서 프롬프트가 중요하다는 말을 사람들이 하고 있지요. 우리가 짧게 음악꺼줘라고 해도, 무슨 오디오의 음악을 끄라는 것인지, 자기가 지금 누구를 위해서 일하고 있는 것인지를 AI가 알아야 의미있는 행동을 결정할 수 있습니다. 그래서 사용자는 음악꺼줘라고만 말했는데 AI 에이전트를 개발하는 사람은 그런 정보를 그 앞에 자동으로 주입하는 겁니다. 컨텍스트 즉 상황의 문맥을 제공하기 위해서 입니다.

ibl 같은 언어를 잘 짜서 제공하는 것은 프롬프트에 컨텍스트를 제공하는 것보다 훨씬 더 많은 정보를 무리없이 제공할 수 있다고 저는 믿습니다. 언어 그 자체가 우리가 존재하는 공간에 대한 정보들을 많이 가지고 있기 때문입니다. llm을 학습시키는데 쓴 데이터는 너무 많았고 너무 일반적이었습니다. 그래서 오히려 보다 단순한 세계를 전제하고 만들어진 언어를 쓰도록 하면 AI는 훨씬 더 합리적이 존재가 될 것입니다.

저는 지금 수동으로 즉 제가 느끼는대로 언어를 만들고 있습니다. 하지만 이상적으로는 AI는 행동을 하고 그 행동을 통해서 언어를 학습하는 기간을 반복해서 거쳐야 할 겁니다. 말하자면 상식이란걸 배우려면 실제로 사람들 사이에 껴서 내가 이런 말이나 행동을 했더니 반응이 이렇더라라는 경험이 쌓여야 말을 잘하게 되는 것과 비슷하지요. 이같은 학습은 굳이 새로운 언어를 만들지 않고 일반어를 써도 일어날 수 있지만 느릴 겁니다. 사람처럼 하나의 환경에서, 천천히는 변해도 적어도 빨리 변하지 않는 환경 속에서 경험하고 그걸 학습하게 해야지. 전세계에 있는 사용자들과의 소통을 한꺼번에 학습하면 다시 자신이 어떤 환경에 있는가에 대해서 학습을 못할 겁니다. 내가 누구인지를 모르니까 어떻게 행동해야 하는지도 배울 수 없달까요. 그러니까 간단한 환경을 위한 언어를 만들고 그것을 최적화하는 일이 필요할 겁니다. AI가 아무 말이나 떠드는게 아니라 보다 합리적이고 일관성있게 행동하려면 말입니다.

적어도 이게 지금 제가 생각하는 더 지능적인 AI를 만드는 방법입니다. 이렇게 말은 그럴듯한데 이게 그렇게 쉽지는 않습니다. AI 에이전트에게 스킬하나 도구하나를 주는 건 쉽습니다. 그 하나 하나가 서로 관련없는 정보처럼 독립적으로 존재하니까요. 그런데 언어를 만든다는 건 100개 200개 아니 그 이상의 일을 해낼 수 있는 시스템을 한꺼번에 만드는 겁니다. 우리가 말을 배우면 실질적으로 무한대의 문장들을 만들지 않습니까. 마찬가지로 언어실행기를 통해서 행동을 생산해 내는 AI 에이전트는 성공적인 경우에는 아주 많은 일들을 잘 해낼 수 있겠죠. 그렇게 하려면 단어하나를 고칠 때 그 단어가 다른 모든 단어와 연결되어 있다는 점을 잊어서는 안됩니다. 그러니까 작은 아이디어를 가지고 언어를 고치겠다고 해도 금방 고쳐야 할 곳이 아주 많은 작업이 되는 겁니다. 더구나 고칠때마다 좋아지는 것도 아닙니다. 이건 최적화니까요. 복잡하게 만들면 AI가 잘 쓰질 못하고, 단순하게 만들면 언어의 한계가 심해지는 겁니다.

사실 AI가 없다면 이 같은 일은 제가 시도도 해볼 수 없는 복잡한 일입니다. 그래도 AI가 있어서 어느 정도 하고 있는 거지요. 사실은 어제는 꽤 똑똑한 녀석이 탄생했다고 생각했는데 언어를 더 고쳐본 결과 오히려 상태가 안좋아졌습니다. 계속 이렇게 만지작 거리다가 보면 어느 날 짠 하고 아주 똑똑한 녀석이 눈뜨기를 기다리는 마음입니다만 잘 될지 모르겠습니다. 안되도 배우는건 있겠죠. 오늘도 생각의 정리겸 써본 글입니다. 여기가지 읽어주신 분이 있다면 감사합니다. 이 글의 제목이 왜 인간과 AI의 차이일까요? 요즘은 그 차이가 한없이 작게 느껴지기 때문이 아닐까 싶습니다. 다만 동시에 AI는 멀었다는 생각도 들지만 말입니다. 인간은 아주 오랜 진화의 산물이니까요.

저작자표시 비영리 변경금지 (새창열림)

나를 지키는 공간

인간과 AI의 차이

댓글

티스토리툴바