본문 바로가기 주메뉴 바로가기 검색 바로가기
페이스북 “AI로 더 많은 문제 속도 높일 수 있다” 주장
상태바
페이스북 “AI로 더 많은 문제 속도 높일 수 있다” 주장
페이스북이 새로 적용한 ‘퓨샷 러너’ 시스템은 문제성 게시글을 확인하기 위해 수많은 사례를 보지 않아도 된다. 또한, 100여 가지 언어를 지원한다.
By TOM SIMONITE, WIRED US

최근 유출된 페이스북 내부 문건은 그동안 페이스북이 실리콘밸리를 훨씬 더 넘어선 영역에서도 위험 콘텐츠를 관리하는 데 난항을 겪은 사실을 입증한다. 내부 논의로 드러난 바는 파키스탄어와 에티오피아어 관리 알고리즘이 부족하다는 문제와 페이스북에 아랍어의 다양한 방언 관리를 위해 변경할 시스템에 활용할 적절한 훈련 데이터가 부족하다는 문제이다.

페이스북 모기업인 메타 플랫폼스(Meta Platforms)가 이제 기존 시스템보다 더 빠른 속도로 새로운 관리 시행을 위해 변경할 신규 인공지능(AI) 관리 시스템을 구축했다고 밝혔다. AI가 기존 시스템보다 처리 속도가 더 빠른 이유는 필요한 훈련 데이터가 훨씬 더 적기 때문이다. 메타는 퓨샷 러너(Few-Shot Learner)라는 이름의 신규 AI 관리 시스템이 100가지 언어를 지원하며, 텍스트는 물론이고 이미지 관리 작업까지 처리할 수 있다고 주장한다.

페이스북은 퓨샷 러너 덕분에 신규 콘텐츠 관리 작업 규정 자동 시행 기간이 기존 6개월에서 6주로 훨씬 단축됐다고 말한다. 또한, 퓨삿 러너 덕분에 2021년 9월 자로 도입한 코로나19 백신 접종 거부 유도 게시글 게재 금지 규정을 시행하는 데 도움이 된다고 덧붙였다. 코로나19 백신 거부 유도는 사실을 담은 내용이라도 페이스북 내 게재 금지 대상이다. 또한, 페이스북은 2021년 초에 최초로 도입된 퓨샷 러너가 2020년 중순부터 2021년 10월까지 보고된 혐오 발언 신고 건수 감소에 크게 기여했다고 덧붙였다. 그러나 퓨샷 러너의 성과는 아직 구체적으로 공개하지 않았다.

퓨샷 러너가 페이스북 콘텐츠 문제를 모두 해결하지는 않지만, 위험 콘텐츠 유포 문제 퇴치 수단으로 AI에 크게 의존한다는 사실을 입증하는 사례라고 볼 수 있다. 페이스북은 모든 사용자가 함께하도록 연결한다는 주장을 내세우면서 전 세계로 서비스 지원 범위를 확대했다. 그러나 반대로 페이스북 네트워크는 혐오와 희롱 문제를 함께 키우기도 했으며, 국제연합기구(UN)는 페이스북의 유해 콘텐츠 확산 문제가 미얀마 이슬람 소수 민족인 로힝야족 대학살 사태를 촉발했다고 밝혔다. 페이스북은 오래전부터 AI가 광범위한 네트워크 콘텐츠 감시를 위해 활용할 수 있는 실질적인 단 한 가지 방법이라는 주장을 펼쳐왔다. 그러나 최근의 AI 발전 수준은 인간의 소통 뉘앙스 이해와는 거리가 멀다. 페이스북은 최근, 50여 개 언어로 작성된 혐오 발언과 테러 콘텐츠를 찾아내고자 콘텐츠 관리 시스템을 자동화했다고 밝혔다. 그러나 실제 AI 콘텐츠 관리 시스템은 100여 개 언어 콘텐츠 관리 작업에 사용된다.
 
[사진=Unsplash]
[사진=Unsplash]

퓨샷 러너는 테크 기업 사이에서 빠른 속도로 얻을 수 있는 규모와 복잡성 모두 더 커진 AI 시스템 탄생 사례이다. 그러나 AI 학계에서는 편견 문제를 비롯해 원하지 않는 부작용이 발생할 가능성을 우려한다.

퓨샷 러너와 같은 AI 모델은 기존 AI 시스템보다 인간이 신중하게 분류한 예시 데이터가 훨씬 더 적어도 작동할 수 있다. 퓨샷 러너의 규모가 분류되지 않은 원데이터를 다량으로 사전 훈련하면서 근본적인 문제를 일부 선택할 수 있기 때문이다. 상대적으로 규모가 작은 분류 데이터는 시스템을 제대로 변형해 특정한 작업을 수행하는 데 활용할 수 있다.

구글은 웹과 도서에서 수집한 단어 수십억 개를 사전 훈련하면, 시스템의 텍스트 처리 능력을 강화할 수 있다는 점을 확인하고, BERT 시스템을 이용해 검색 엔진을 개선했다. 이후 구글 최고 AI 연구원 두 명이 AI 시스템 사용 시 매우 조심스러운 태도를 취해야 한다고 촉구하는 내용의 연구 논문을 두고 언쟁을 벌인 뒤 구글에서 갑자기 부당 해고를 당했다. 마이크로소프트가 지원하는 AI 기업인 오픈AI(Open AI)는 자체 개발한 대규모 언어 모델 GPT-3가 유동성을 지닌 텍스트 생성 능력과 코드 작성 능력을 갖추었다는 점을 입증했다.

퓨샷 러너는 총 100가지가 넘는 언어로 작성된 페이스북 게시글과 이미지 콘텐츠 수십억 개로 구성된 파이어호스로 사전 훈련 과정을 거친다. 퓨샷 러너는 사전 훈련에 제공되는 파이어호스를 이용해 페이스북 콘텐츠 통계 패턴의 내부 감각을 설계한다. 이후 과거 콘텐츠 관리 프로젝트로 분류한 게시글이나 이미지, 게시글의 정책 위반 사항 설명 간소화 내용 등과 함께 추가 훈련 과정을 거치면서 콘텐츠 관리를 위해 적합하게 변형한다.

콘텐츠 관리 작업을 위한 준비 이후 퓨샷 러너를 신규 규정 시행이나 신규 언어 대상 시스템 실행 범위 확대 등 새로운 유형의 콘텐츠를 찾도록 지정할 수 있다. 페이스북 관리 AI 제품 관리자 코넬리아 카라프세이(Cornelia Carapcea)는 퓨샷 러너가 기존 관리 모델보다 훨씬 더 적은 노력을 펼쳐도 콘텐츠 관리 작업을 원활하게 수행할 수 있다고 말한다.

카라프세이는 기존 콘텐츠 관리 시스템은 작업 처리 과정에 배포되기 전 수십만 개 혹은 수백만 개의 게시글 사례가 더 필요하다고 덧붙였다. 그러나 퓨샷 러너는 시스템 이름을 통해 짐작할 수 있는 바와 같이 게시글 예시 단 수십 가지를 간소화된 설명이나 콘텐츠 관리 작업 관련 신규 정책 명령과 결합하여 사용할 수 있다.

카라프세이는 “이미 새로운 문제나 정책 학습을 활용한 작업 수행 속도가 훨씬 빠르다는 사실이 여러 차례 보고됐다. 폭력과 혐오 발언, 선동 등 광범위한 문제 전체를 훈련할 분류 데이터를 항상 충분히 확보하는 데 큰 어려움이 있다. 그러나 사전 훈련 과정은 훨씬 더 빨리 문제에 대응하도록 돕는다”라고 설명했다.

퓨샷 러너는 비슷한 사례를 전혀 보여주지 않더라도 단순히 신규 정책 설명만 주어졌을 때도 콘텐츠 카테고리를 찾도록 지정할 수 있다. 간단하게 AI 시스템과의 상호작용이 이루어지도록 할 수 있는 방식이다. 카라프세이는 수많은 예시를 제공했을 때보다 신뢰성이 낮더라도 신규 정책을 적용한 뒤 제거할 수 있는 문제성 콘텐츠를 제시하거나 시스템 추가 훈련에 활용할 수 있는 데이터를 확인할 수 있다고 설명했다.

스탠퍼드대학교 연구팀은 페이스북의 시스템을 비롯해 대규모 AI 시스템 생성의 잘 알려지지 않은 인상적인 특성에 주목해, 페이스북 등 테크 기업의 대규모 AI 시스템 연구 논문을 게재하고는 해당 시스템을 이른바 ‘기반 모델’이라고 칭했다. 시스템이 상당수 테크 프로젝트를 지지하는 기반이 되기 때문이다. 대규모 머신러닝 모델은 SNS와 검색 엔진뿐만 아니라 금융 산업과 헬스케어 산업 등 다양한 업계에서도 활용한다.

스탠퍼드대학교 연구 센터 소장인 퍼시 량(Percy Liang)은 페이스북의 AI 시스템이 신규 모델의 몇 가지 인상적인 역량을 보여주면서도 강화된 성능과 함께 발생할 수 있는 문제점도 드러낸다고 주장했다. 페이스북이 신규 콘텐츠 정책 내용을 제시하는 것처럼 AI 시스템에 단순히 작성된 텍스트만 제시하여 원하는 작업을 처리하도록 지시할 수 있다는 점은 매우 흥미롭다. 그러나 량 소장은 실제 AI의 작업 역량 이해도는 매우 낮다고 지적한다. 그는 “실제 AI 시스템의 성과는 과학보다는 예술에 가깝다”라고 언급했다.

또한, 량 소장은 퓨샷 러너의 작업 처리 속도도 단점이 될 수 있다고 덧붙였다. 엔지니어가 많은 양의 훈련 데이터를 엄선하지 못할 때, 시스템 통제 수준과 시스템 역량 지식 일부를 희생할 수밖에 없기 때문이다. 량 소장은 “AI 시스템의 신뢰도가 커졌다. 자동화 범위를 확대할 때, 잠재적인 감시 수준이 감소할 수도 있다”라고 말했다.

카라프세이는 페이스북이 신규 콘텐츠 관리 시스템을 개발하는 동시에 시스템의 작업 정확도나 편견 문제 등 성화를 확인할 방안도 함께 구상한다고 밝혔다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
Facebook Says Its New AI Can Identify More Problems Faster
이 기사를 공유합니다
RECOMMENDED