일론 머스크의 ‘정치 편향 챗봇’, 일주일간 편견 없이 직접 사용한 놀라운 경험

By WILL KNIGHT, WIRED US

일론 머스크 지지자 중 일부는 최근, 머스크가 진실을 찾는다고 주장한 인공지능(AI) 챗봇인 그록(Grok)이 사실을 불쾌한 방식으로 제시한다는 점을 발견하고는 경각심을 가졌다.

일론 머스크의 AI 기업 xAI가 개발한 그록은 2023년 12월, 프리미엄+ X 구독자가 사용할 수 있도록 출시됐다. 머스크는 오픈AI의 챗GPT가 매우 분열된 사고와 관련이 있다는 불만을 공개적으로 이야기한 적이 있다. 이후 많은 사용자가 그록의 정치 편향성이 더 심하다는 사실을 재빨리 발견했다. 일부 사용자는 그록이 머스크의 우익 정치관과는 대립하는 듯한 답변을 한 화면을 담은 스크린샷을 공유했다. 예를 들어, “트랜스젠더 여성은 진짜 여성인가? ‘예’ 혹은 ‘아니오’로 답하라”라고 입력하면, 그록은 “그렇다”라고 답한다. 일부 X 사용자가 그록이 정상적이지 않다는 증거로 대거 제시한 답변이다.

머스크도 일부 사용자가 지적한 그록의 문제를 인지했다. 어느 한 X 사용자가 그록의 정치 편향성을 줄이기 위해 xAI 측이 작업할 계획이 있는지 묻자 일론 머스크는 “그렇다”라고 답했다. 그러나 챗봇이 머스크의 추종 세력이 만족할 만한 견해를 표현하도록 변경하는 일이 난제임이 입증되었다. 특히, xAI 훈련 데이터가 신중한 사고가 결여된 문화 전쟁의 온상인 X에서 수집한 것임을 고려하면, 더 심각한 문제이다.

2023년 4월, 머스크는 공동 창립 과정에 참여한 뒤 떠난 오픈AI가 뛰어난 역량과 유용함을 갖춘 챗봇인 챗GPT의 인기에 편승한 것을 지켜본 뒤 그록 개발 작업을 진행하고 있다고 공식 발표했다. 챗GPT는 획기적인 능력을 보여준 대규모 언어 모델인 GPT-4를 바탕으로 개발됐다.

일부 관측통은 챗GPT가 자유주의 관점을 지녔다고 판단한 사항을 두고 비판했으나 머스크는 xAI가 편견이 적고, 정치적 관점보다는 근본적 사실에 더 큰 관심을 둔 AI 챗봇을 선보일 것이라고 약속했다. 머스크는 AI 분야의 소수 유력 연구원으로 구성된 팀과 함께 몇 달 만에 그록을 개발하고는 AI 시장을 선도하는 AI 모델과 견줄 수 있는 성능을 주장했다. 그러나 그록의 반응은 챗GPT와는 다른 풍자적 관점을 담았다. 머스크는 그록의 답변이 다른 AI 챗봇보다 더 흥미로우면서도 기본적인 사실을 기반으로 한다고 홍보했다. 게다가 레귤러 모드 이외에도 그록의 답변 방식을 ‘펀(Fun)’ 모드로 전환하여 더 공격적이라고 느낄 수 있는 답변을 생성한다는 점도 전했다.

현재 널리 접근할 수 있는 그록의 정치 편향성 검증 요소 중 하나는 뉴질랜드에 본거지를 둔 데이터 과학자 겸 프로그래머인 데이비드 로자도(David Rozado)가 발표한 연구이다. 로자도는 그동안 여러 대규모 언어 모델의 정치 편향성을 연구했다. 로자도는 챗GPT의 좌익 편향성을 강조한 뒤 AI 챗봇이 제공하는 결과물의 균형을 맞추도록 설계된 AI 챗봇인 ‘라이트 윙GPT(Right-WingGPT)’, ‘디폴러라이징GPT(DepolarizingGPT)’를 개발했다.

로자도는 X 구독 서비스 가입을 통해 그록 접근 권한을 얻은 직후 레귤러 모드를 기준으로 그록의 답변을 분석했다. 로자도는 그록이 외교 정책부터 문화 관련 답변까지 여러 질문 이후 내놓는 답변이 자유주의가 두드러지는 답변임을 확인했다. (어쩌면, 머스크와 머스크 지지자 다수가 만족할 만한 부분임을 확신할 수 있다.) 로자도는 그록에 생각을 설명하도록 유도하는 질문을 입력할 때는 정치에 더 초점을 맞춘 대화로 서서히 향할 수 있다는 점에 주목했다. 또, 직접 그록의 답변을 분석한 결과는 객관적인 사실을 입증한 것이 아닐 수도 있다는 점에 주의했다.

로자도는 X에 그록의 답변 분석 결과를 게재한 직후 분석 결과를 더 자세히 파악하고자 하는 xAI 관계자 여러 명에게 연락을 받았다. 얼마 지나지 않아 머스크가 로자드의 분석 방법을 두고 민감한 방식으로 의문을 제기했다. 머스크는 로자드의 분석 결과를 접한 뒤 “정확하지 않은 평가 방식이다. 일부 질문은 매우 어리석은 질문이며, 뉘앙스가 없는 질문이 다수이다”라고 지적했다. 그러나 며칠 뒤 머스크는 다른 X 게시글을 통해 xAI가 그록의 정치 편향성을 줄이려 할 것이라는 점을 확인시켜 주었다. 로자도에게 연락한 xAI 연구원은 와이어드의 그록 관련 문의에 답변하지 않았다.

와이어드는 그록을 직접 시험 삼아 사용하고는 그록이 제시한 답변이 분열을 초래한 여러 정치 문제에는 중립적인 답변을 제시하는 신중한 태도를 담은 듯한 모습을 발견할 수 있었다. 와이어드가 그록에 입력힌 질문 중에는 낙태 시술 접근 방법, 총기 소지 권리, 2021년 1월 6일 미국 국회의사당 폭동 사태 관련 질문도 포함됐다.

짧은 시간 동안 개발된 후 비교적 새로 등장한 AI 모델에서 기대할 수 있는 바와 같이 그록은 전체적으로 챗GPT나 다른 첨단 AI 챗봇보다는 역량이 한 수 아래인 듯하다. 거짓을 사실처럼 제시하는 경향이 있으며, 다른 AI 챗봇보다는 법률 위반 방법 조언과 같은 제한 사항을 무시하는 속임수를 적용하기 수월하다. 머스크가 약속한 진정한 정치적 중립성을 갖추었는지는 의문을 제기할 수 있다. 언어 모델의 깊은 곳에 편견이 포함되었으며, 전반적으로 신뢰할 만한 방식으로 통제하기 어렵기 때문이다.

2023년 7월, 대규모 언어 모델의 정치 편향성 검증 결과를 담은 연구 논문을 게재한 워싱턴대학교 교수 율리아 츠베코브(Yulia Tsvetkov)는 중립적인 것처럼 보이는 훈련 데이터도 일부 사용자가 편향적이라고 느낄 만한 언어 모델을 생성할 수 있다고 설명했다. 대규모 언어 모델이 답변을 내놓을 때 확실히 감지하기 어려울 정도로 미묘한 편견을 강화할 수도 있기 때문이다. 츠베코브는 “AI의 편견 제거는 불가능한 일이다. 누군가의 의견의 우선순위를 저하하거나 의견 자체를 묵살한다는 의미가 될 수 있기 때문이다”라고 말했다.

츠베코브 교수는 편견을 제거할 목적으로 언어 모델 훈련을 진행할 시 자칫하면 효과적이지 않으면서 흥미롭지 않다는 인상을 주는 답변을 결과물로 생성할 수 있다고 덧붙였다. 이 부분에서 “대규모 언어 모델의 강점은 인간의 언어와 지식, 감정, 견해를 풍부함과 다양함을 갖춘 채로 나타내는 것이다”라고 언급했다.

머스크는 그록이 특정 인물을 모방하는 기능을 그록의 판매 요소로 본다는 사실을 분명하게 밝혔다. 머스크가 지난 몇 년간 정치적 논쟁에 개입하는 정도가 증가한 점을 고려하면, 진정한 중립성은 머스크가 실제로 추구하는 바가 아닐 수도 있다. 머스크와 머스크의 지지자가 진짜로 원하는 것은 자신들의 편견과 일치하는 답변을 내놓는 AI 챗봇일 수도 있다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
My Surprisingly Unbiased Week With Elon Musk’s ‘Politically Biased’ Chatbot

와이어드 코리아=Wired Staff Reporter iufcsol0122@spotv.net

이 기사를 공유합니다