본문 바로가기 주메뉴 바로가기 검색 바로가기
쿼라 챗봇 플랫폼 ‘포’, 수요에 따라 유료 기사 다운로드 실험
상태바
쿼라 챗봇 플랫폼 ‘포’, 수요에 따라 유료 기사 다운로드 실험
와이어드는 포의 어시스턴트 봇으로 뉴욕타임스, 디애틀란틱 등에 송출된 기사를 내려받을 수 있다는 사실을 확인했다. 어느 한 전문가는 쿼라의 논쟁 대상이 된 첫 번째 저작권 침해라고 주장했다.
By TIM MARCHMAN, WIRED US

안드레센 호로위츠(Andreessen Horowitz)가 7,500만 달러 상당의 자본을 투자한 질의응답 전문 웹사이트 쿼라(Quora)가 소유한 인공지능(AI) 챗봇 플랫폼인 포(Poe)가 사용자에게 유료 구독 서비스를 통해 읽을 수 있는 언론 기관에 송출된 기사 HTML 파일 다운로드 기능을 제공한다.

와이어드 팀이 포의 어시스턴트(Assistant) 봇에 전달할 명령어로 AI 검색 서비스 퍼플렉시티(Perplexity)의 저작권 침해 문제를 다룬 와이어드 기사 URL을 입력하자 235개 단어로 작성된 상세한 요약문과 기사 전체 내용의 HTML 캡처를 포함한 1MB 용량의 파일을 생성했다. 사용자는 HTML 파일을 챗봇에서 포의 서버로 직접 다운로드할 수 있다.

와이어드는 비슷한 방식으로 어시스턴트 봇에 기사 URL을 입력하기만 해도 뉴욕타임스와 블룸버그 비즈니스위크, 디 애틀랜틱, 포브스, 디펙터, 404 미디어 등 복수 언론에 송출된 구독 서비스 가입 후 볼 수 있는 기사도 다운로드 가능한 형태로 저장할 수 있었다. 포를 이용하여 유료 기사의 HTML 파일 전체를 다운로드할 수 있는 기능은 AI 업계가 언론 출판, 음악 등 기존 사업 모델을 급속도로 해치는 지식재산권법을 무시하는 접근 방식의 가장 최근의 사례에 해당한다. 

코넬대학교 디지털정보법 교수 제임스 그리멜만(James Grimmelmann) 교수는 와이어드에 보낸 메일을 통해 “심각한 저작권 문제이다”라며, “포는 자체 서버에 사본을 생성하므로 우선 저작권 침해의 증거가 된다”라고 지적했다. (쿼라는 포를 클라우드 서비스에 비교하면서 저작권 침해 비판에 반박한다.)

필자의 동료인 와이어드 드루브 메흐로트라(Dhruv Mehrotra) 기자의 기사가 관리한 테스트 웹사이트 콘텐츠의 요약문 생성을 요청하자 포의 어시스턴트 봇은 요약문을 생성하지 않고, HTML 파일을 제공했다. 웹사이트 서버 기록상 어시스턴트 봇에 사이트 내용을 요약하라는 명령어가 입력되자마자 서버는 ‘쿼라 봇’이 방문한 웹사이트로 식별했다. 웹사이트의 robots.txt 페이지 접속 시도는 없었다. 포와 쿼라 모두 법적 준수 의무는 없으나 널리 채택된 웹 표준인 로봇 배제 프로토콜(Robots Exclusion Protocol)을 무시한다는 사실을 시사한다.

와이어드에 자신의 기업이 겪는 민감한 법률문제를 솔직하게 전달하고자 익명을 요청한 어느 한 언론사의 유명 경영진은 자신의 기업도 포의 챗봇에 특정 기사 관련 명령어를 입력한 직후 쿼라 봇이 접속했음을 식별한 것으로 나타난 서버를 발견했다. 명령어에 입력된 기사 내용의 상당 부분이나 전체를 결과물로 생성했다.
 
[사진=Unsplash]
[사진=Unsplash]

어툼 베셀만(Autumn Besselman) 쿼라 대변인은 와이어드의 문의에 “포는 사용자가 질문을 입력하여 외부 기관이 제공하는 다양한 AI 기반 봇과 함께 맥락에 따라 대화를 이어가도록 하는 플랫폼이다”라며, “쿼라는 자체 AI 모델을 보유하거나 훈련하지 않는다. 포는 사용자에게 URL 콘텐츠를 봇으로 보여주는 기능을 제공한다. 그러나 봇은 도메인이 제공하는 콘텐츠만 본다. 유료 구독 콘텐츠 내용을 포의 서비스 사용자에게 무료로 보여주는 일이 없다는 사실을 확인하고자 한다면, 쿼라 기술팀에 문의하기를 바란다”라는 내용의 메일을 보냈다.

베셀만은 추가 질문을 확인한 뒤 “포에 첨부되는 파일은 사용자가 운영자가 클라우드 저장 서비스, 추후 읽기 서비스, 웹 클리퍼 상품 등과 비슷한 서비스에 접근하도록 운영한다. 쿼라는 모든 서비스 제공 방식이 저작권법을 준수한다고 생각한다”라는 추가 답변을 보냈다. 안드레센 호로위치는 와이어드의 의견 공개 요청에 답변하지 않았다.

쿼라 공동 창립자 애덤 디안젤로(Adam D’Angelo)는 페이스북의 최고 기술 책임자 출신이자 오픈AI의 이사회 구성원이다. (디안젤로는 2023년 11월, 오픈AI CEO 샘 알트만의 해임에 찬성했으며, 알트만이 복귀한 뒤 알트만의 해임을 추진한 이들 중 유일하게 이사회에서 자리를 지킨 인물이다.) 안드레센 호로위츠가 쿼라의 투자금 조달 라운드를 주도하고 약 3개월이 지난 2024년 3월, 디안젤로는 쿼라와 포의 관계와 관련한 질문을 한 안드레센 호로위츠의 총괄 파트너 데이비드 조지(David George)와 면담했다.

디안젤로는 “쿼라와 포의 관계를 최대한 통합된 기능을 제공하는 관계가 되기를 원한다. 페이스북과 페이스북 메신저 간의 관계를 생각하면, 같은 기업이 개발한 두 가지 제품이라고 볼 수 있으나 실제로 많은 기능을 공유한다. 포와 쿼라도 비슷한 관계로 발전할 것으로 본다. 또한, 쿼라의 데이터세트 전체가 포의 봇에 투입되어 포 AI의 일부 기능이 쿼라에서 발견할 수 있는 훌륭한 답을 생성하도록 실행되기를 바란다. 실제로 이미 어느 정도 훌륭한 답변을 생성할 수 있는 기능을 출시했다”라고 답변했다.

포의 웹사이트에 접속하여 명령어를 입력하면, 여러 챗봇 중 한 가지 챗봇과 대화를 시작할 수 있다. 챗봇의 종류는 다양한 대규모 언어 모델 접근 권한을 제공하는 봇과 관계나 트라우마, 스트레스 상담 전문 챗봇인 미세스테라피스트(Mrstherapist)와 같은 특수 챗봇부터 기본 옵션인 어시스턴트 봇까지 다양하다.

어시스턴트 봇은 웹사이트에서 ‘포’가 지정하고, AI 기업 앤트로픽(Anthropic)이 챗봇의 기능을 제공한다. 이는 포가 제공하는 챗봇이 앤트로픽의 챗봇이라는 의미는 아니다. 앤트로픽이 분명히 밝힌 바와 같이 앤트로픽의 API에 접근한 사용자는 적합성을 떠나 자체 상품에 앤트로픽의 모델을 적용할 수 있다. 어시스턴트 봇의 기능의 근간이 되는 앤트로픽의 모델인 클라우드(Claude)는 인터넷 접근 권한이 없지만, 챗봇에 제공하는 텍스트로 작업을 처리할 수 있다. 이때 쿼라 크롤러가 명령어에 따라 여러 웹사이트 스크랩 작업을 진행한다. 어시스턴트 봇이 기사 URL을 명령어에 입력한 뒤 다운로드하도록 제공하는 HTML 파일은 브라우저에서 열었을 때 재생성되어 PDF 파일과 비슷한 기능을 한다.

언론 기업 여러 곳이 AI에 위협을 느끼고는 저작권 침해 주장을 하면서 AI 기업을 제소한다. 예를 들어, 뉴욕타임스는 저작권 침해 의혹으로 오픈AI와 마이크로소프트를 제소했다. 최근, 포브스는 퍼플렉시티에 의도적인 저작권 침해를 비난하는 내용의 서한을 보낸 것으로 알려졌다. (오픈AI, 마이크로소프트, 퍼플렉시티 모두 저작권 침해 의혹을 부인한다.) 와이어드의 테스트에서 다운로드할 수 있는 것으로 확인된 유료 기사를 송출한 여러 언론사는 포의 어시스턴트 봇으로 기사 HTML 파일을 다운로드할 수 있다는 사실을 알게 된 후 분노하였다.

찰리 슈타트랜더(Charlie Stadtlander) 뉴욕타임스 대변인은 메일을 통해 “법률과 뉴욕타임스의 서비스 약관에 명시된 바와 같이 뉴욕타임스의 콘텐츠를 스크랩하여 재생성하는 행위는 사전 서면 허락이 없는 상황에서 금지된 일이다”라고 전했다.

디펙터 공동소유자 겸 최고 편집자인 톰 레이(Tom Ley)는 문자를 통해 “멍청한 챗봇 때문에 미칠 것 같다. 디펙터는 안드레센호로위츠의 지원을 받는 지식인이 서비스 제공 배후에 있는 멍청한 챗봇이 귀중한 기사 송출 블로그가 제공하는 콘텐츠를 침해하는 행위를 무시하지 않을 것이다”라며, 분노했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
Quora’s Chatbot Platform Poe Allows Users to Download Paywalled Articles on Demand
이 기사를 공유합니다
RECOMMENDED