By Will Knight, WIRED US
처음 언뜻 보았을 때는 밴쿠버에 있는 브리티시컬럼비아대학교 내 유명한 인공지능(AI) 연구소가 생성한 일련의 최신 연구 논문이 그리 주목할 만한 내용은 아닌 듯했다. 기존 알고리즘과 아이디어가 점차 개선된다는 특징을 담은 논문은 평균 수준의 AI 콘퍼런스나 저널 내용처럼 보였다.
하지만 브리티시컬럼비아대학교 인공지능 연구소의 연구 내용은 매우 놀랍다. 연구를 첫 단계부터 최종 논문 게재 단계까지 브리티시컬럼비아대학교 연구소 연구팀이에서 옥스퍼드대학교 연구팀, 스타트업 사카나 AI(Sakana AI)와 공동으로 개발한 AI 과학자가 진행했기 때문이다.
AI 과학자의 연구 프로젝트는 혁신적인 변화를 입증하는 초기 단계를 나타낸다. 바로 AI가 발명과 새로운 아이디어 탐구를 통해 학습하도록 하는 것이다. 단순히 매우 참신한 아이디어이기만 한 것이 아니다. 일부 논문은 디퓨전 모델(diffusion)이라는 이미지 생성 기법을 개선할 변경 사항을 설명했다. 다른 논문은 딥뉴럴 네트워크의 학습 속도를 높일 접근 방식을 다루었다.
브리티시컬럼비아대학교 연구소를 이끄는 제프 클룬(Jeff Clune) 교수는 “획기적인 아이디어는 아니다. 매우 창의적인 아이디어를 제시한 것도 아니다”라며, “하지만 누군가가 시도할 만한 멋진 아이디어이다”라고 말했다.
오늘날 AI 프로그램이 놀라운 능력을 선보일 수 있듯이 인간이 생성한 훈련 데이터를 소비할 필요성에 국한되기도 한다. AI 프로그램이 흥미로운 아이디어 실험 및 탐구를 진행하여 공개된 방식으로 학습하면, 인간이 훈련 과정에서 AI에 제시한 수준을 넘어선 능력을 선보일 수 있다.
클룬 교수의 AI 연구소는 과거, 아이디어 실험과 탐구로 학습하는 AI 프로그램을 설계한 적이 있다. 예를 들어, 옴니(Omni)라는 이름으로 개발한 AI 프로그램은 여러 가지 비디오 게임과 유사한 환경에 등장하는 가상 캐릭터의 행동을 생성하려 하면서 흥미로워 보이는 캐릭터 행동 하나를 저장하고는 새로운 디자인으로 반복한다. 과거에는 흥미 정도를 정의하기 위해 핸드코딩(hand coding)으로 작업한 지시 사항이 필요한 부분이었다. 그러나 대규모 언어 모델은 프로그램이 더 매력적인 행동이나 아이디어를 식별할 방법을 부여한다. 클룬 교수의 연구실에서 진행한 또 다른 최신 프로젝트에서도 옴니와 같은 접근 방식으로 AI 프로그램이 가상 캐릭터가 로블록스(Roblox)와 유사한 환경에서 모든 작업을 분류하는 코드로 고안하도록 했다.
AI 과학자는 클룬 교수의 연구실이 가능성을 구현하는 사례 중 하나이다. AI 프로그램은 머신러닝 실험을 생성하며, 대규모 언어 모델의 도움으로 가장 가능성이 큰 부분을 결정한 뒤 필요한 코드를 작성하고는 실행한다. 학습한 내용을 바탕으로 변화를 주고, 반복한다. 클룬 교수는 프로젝트 결과가 과소평가되었으나 학습 프로그램을 주입하는 컴퓨터 성능이 강화된다는 점에서 공개 학습 방식이 언어 모델 자체와 함께 성능이 더 강해질 수 있다.
클룬 교수는 대규모 언어 모델로 열 수 있는 가능성을 두고 “새로운 대륙이나 행성을 탐색하는 것과 같다”라며, “미래에 발견하게 될 사항을 알지 못하지만, 프로그램을 실행할 때마다 무언가 새로운 것을 찾게 된다”라고 말했다.
예루살렘히브리대학교 교수이자 앨런 인공지능연구소(AI2) 과학자 톰 호프(Tom Hope)는 대규모 언어 모델과 마찬가지로 AI 과학자가 가상의 존재이므로 실존하는 대상으로 고려할 수 없다고 주장했다. “그는 AI 과학자의 구성 요소 모두 지금 당장 가치 있다고 평가할 수 없다”라고 전했다.
호프 교수는 과학적 발견 요소 자동화 노력이 1970년대 앨런 네웰(Allen Newell), 허버트 사이몬(Herbert Simon) 등 AI 선구자의 작업과 이후 학문과 전문성 연구소(Institute for the Study of Learning and Expertise) 소속 연구원 팻 랭글리(Pat Langley)의 작업까지 수십 년에 이어 펼쳐졌다는 점을 지목했다. 또한, AI2 연구팀을 포함한 복수 연구팀이 최근 들어 대규모 언어 모델을 최대한 활용하여 가설 제기, 논문 작성, 연구 검토 작업 등을 도운 점도 언급했다. 호프 교수는 “브리티시컬럼비아대학교 연구팀이 시대정신을 포착했다. 물론, 연구 방향은 매우 귀중할 것이다”라는 견해를 전했다.
대규모 언어 모델 기반 시스템이 실제 새로운 아이디어나 획기적인 아이디어를 제시할 가능성은 확실하지 않다. 클룬 교수는 “무한한 질문을 제기할 수 있는 부분이다”라고 언급했다.
과학 연구에서 획기적인 노력이 없더라도 개방적인 학습 접근 방식은 지금 당장 더 역량이 뛰어나면서 유용한 AI 시스템을 개발하는 데 중요한 부분이 될 것이다. 2024년 8월, 투자 기업 에어스트리트캐피털(Air Street Capital)은 보고서를 통해 클룬 교수 연구팀의 더 강력하면서도 신뢰할 만한 AI 에이전트나 컴퓨터에서 유용한 작업을 자동으로 수행하는 프로그램 개발 가능성을 강조했다. AI 분야 대기업 모두 AI 에이전트를 AI 연구 분야의 다음 핵심 과제로 본다.
최근, 클룬 교수가 이끄는 연구소는 최신 개방적 학습 프로젝트로 AI 에이전트 발명 및 개발이 가능한 AI 프로그램을 공개했다. AI가 설계한 에이전트는 연산 처리, 포괄적인 읽기 작업 등 일부 작업에서는 인간이 설계한 에이전트보다 훌륭한 능력을 선보인다. 잘못된 행동을 생성하는 에이전트의 시스템을 막을 방법을 고안하는 일이 다음 단계가 될 것이다. 클룬 교수는 “위험할 수도 있다. 지금 당장 올바른 작업을 수행하는 시스템이 필요하지만, 가능한 목표라고 생각한다”라고 말했다.
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
An ‘AI Scientist’ Is Inventing and Running Its Own Experiments
처음 언뜻 보았을 때는 밴쿠버에 있는 브리티시컬럼비아대학교 내 유명한 인공지능(AI) 연구소가 생성한 일련의 최신 연구 논문이 그리 주목할 만한 내용은 아닌 듯했다. 기존 알고리즘과 아이디어가 점차 개선된다는 특징을 담은 논문은 평균 수준의 AI 콘퍼런스나 저널 내용처럼 보였다.
하지만 브리티시컬럼비아대학교 인공지능 연구소의 연구 내용은 매우 놀랍다. 연구를 첫 단계부터 최종 논문 게재 단계까지 브리티시컬럼비아대학교 연구소 연구팀이에서 옥스퍼드대학교 연구팀, 스타트업 사카나 AI(Sakana AI)와 공동으로 개발한 AI 과학자가 진행했기 때문이다.
AI 과학자의 연구 프로젝트는 혁신적인 변화를 입증하는 초기 단계를 나타낸다. 바로 AI가 발명과 새로운 아이디어 탐구를 통해 학습하도록 하는 것이다. 단순히 매우 참신한 아이디어이기만 한 것이 아니다. 일부 논문은 디퓨전 모델(diffusion)이라는 이미지 생성 기법을 개선할 변경 사항을 설명했다. 다른 논문은 딥뉴럴 네트워크의 학습 속도를 높일 접근 방식을 다루었다.
브리티시컬럼비아대학교 연구소를 이끄는 제프 클룬(Jeff Clune) 교수는 “획기적인 아이디어는 아니다. 매우 창의적인 아이디어를 제시한 것도 아니다”라며, “하지만 누군가가 시도할 만한 멋진 아이디어이다”라고 말했다.
오늘날 AI 프로그램이 놀라운 능력을 선보일 수 있듯이 인간이 생성한 훈련 데이터를 소비할 필요성에 국한되기도 한다. AI 프로그램이 흥미로운 아이디어 실험 및 탐구를 진행하여 공개된 방식으로 학습하면, 인간이 훈련 과정에서 AI에 제시한 수준을 넘어선 능력을 선보일 수 있다.
클룬 교수의 AI 연구소는 과거, 아이디어 실험과 탐구로 학습하는 AI 프로그램을 설계한 적이 있다. 예를 들어, 옴니(Omni)라는 이름으로 개발한 AI 프로그램은 여러 가지 비디오 게임과 유사한 환경에 등장하는 가상 캐릭터의 행동을 생성하려 하면서 흥미로워 보이는 캐릭터 행동 하나를 저장하고는 새로운 디자인으로 반복한다. 과거에는 흥미 정도를 정의하기 위해 핸드코딩(hand coding)으로 작업한 지시 사항이 필요한 부분이었다. 그러나 대규모 언어 모델은 프로그램이 더 매력적인 행동이나 아이디어를 식별할 방법을 부여한다. 클룬 교수의 연구실에서 진행한 또 다른 최신 프로젝트에서도 옴니와 같은 접근 방식으로 AI 프로그램이 가상 캐릭터가 로블록스(Roblox)와 유사한 환경에서 모든 작업을 분류하는 코드로 고안하도록 했다.
AI 과학자는 클룬 교수의 연구실이 가능성을 구현하는 사례 중 하나이다. AI 프로그램은 머신러닝 실험을 생성하며, 대규모 언어 모델의 도움으로 가장 가능성이 큰 부분을 결정한 뒤 필요한 코드를 작성하고는 실행한다. 학습한 내용을 바탕으로 변화를 주고, 반복한다. 클룬 교수는 프로젝트 결과가 과소평가되었으나 학습 프로그램을 주입하는 컴퓨터 성능이 강화된다는 점에서 공개 학습 방식이 언어 모델 자체와 함께 성능이 더 강해질 수 있다.
클룬 교수는 대규모 언어 모델로 열 수 있는 가능성을 두고 “새로운 대륙이나 행성을 탐색하는 것과 같다”라며, “미래에 발견하게 될 사항을 알지 못하지만, 프로그램을 실행할 때마다 무언가 새로운 것을 찾게 된다”라고 말했다.
예루살렘히브리대학교 교수이자 앨런 인공지능연구소(AI2) 과학자 톰 호프(Tom Hope)는 대규모 언어 모델과 마찬가지로 AI 과학자가 가상의 존재이므로 실존하는 대상으로 고려할 수 없다고 주장했다. “그는 AI 과학자의 구성 요소 모두 지금 당장 가치 있다고 평가할 수 없다”라고 전했다.
호프 교수는 과학적 발견 요소 자동화 노력이 1970년대 앨런 네웰(Allen Newell), 허버트 사이몬(Herbert Simon) 등 AI 선구자의 작업과 이후 학문과 전문성 연구소(Institute for the Study of Learning and Expertise) 소속 연구원 팻 랭글리(Pat Langley)의 작업까지 수십 년에 이어 펼쳐졌다는 점을 지목했다. 또한, AI2 연구팀을 포함한 복수 연구팀이 최근 들어 대규모 언어 모델을 최대한 활용하여 가설 제기, 논문 작성, 연구 검토 작업 등을 도운 점도 언급했다. 호프 교수는 “브리티시컬럼비아대학교 연구팀이 시대정신을 포착했다. 물론, 연구 방향은 매우 귀중할 것이다”라는 견해를 전했다.
대규모 언어 모델 기반 시스템이 실제 새로운 아이디어나 획기적인 아이디어를 제시할 가능성은 확실하지 않다. 클룬 교수는 “무한한 질문을 제기할 수 있는 부분이다”라고 언급했다.
과학 연구에서 획기적인 노력이 없더라도 개방적인 학습 접근 방식은 지금 당장 더 역량이 뛰어나면서 유용한 AI 시스템을 개발하는 데 중요한 부분이 될 것이다. 2024년 8월, 투자 기업 에어스트리트캐피털(Air Street Capital)은 보고서를 통해 클룬 교수 연구팀의 더 강력하면서도 신뢰할 만한 AI 에이전트나 컴퓨터에서 유용한 작업을 자동으로 수행하는 프로그램 개발 가능성을 강조했다. AI 분야 대기업 모두 AI 에이전트를 AI 연구 분야의 다음 핵심 과제로 본다.
최근, 클룬 교수가 이끄는 연구소는 최신 개방적 학습 프로젝트로 AI 에이전트 발명 및 개발이 가능한 AI 프로그램을 공개했다. AI가 설계한 에이전트는 연산 처리, 포괄적인 읽기 작업 등 일부 작업에서는 인간이 설계한 에이전트보다 훌륭한 능력을 선보인다. 잘못된 행동을 생성하는 에이전트의 시스템을 막을 방법을 고안하는 일이 다음 단계가 될 것이다. 클룬 교수는 “위험할 수도 있다. 지금 당장 올바른 작업을 수행하는 시스템이 필요하지만, 가능한 목표라고 생각한다”라고 말했다.
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
An ‘AI Scientist’ Is Inventing and Running Its Own Experiments
저작권자 © WIRED Korea 무단전재 및 재배포 금지
저작권자 © WIRED Korea 무단전재 및 재배포 금지
이 기사를 공유합니다