본문 바로가기 주메뉴 바로가기 검색 바로가기
오픈AI GPT스토어, 저작권 항의 촉발
상태바
오픈AI GPT스토어, 저작권 항의 촉발
어느 한 출판인이 오픈AI GPT스토어의 일부 챗봇이 자사의 저작권 보호 대상이 되는 서적을 이용하여 제작되었다고 주장했다. 오픈AI는 문제가 된 일부 챗봇을 GPT스토어에서 삭제했으나 권리 당사자의 추가 항의가 발생할 수도 있다.
By KATE KNIBBS, WIRED US

지난 몇 달간 모튼 블리치펠트 안데르센(Morten Blichfeldt Andersen)은 몇 시간 동안 오픈AI의 GPT스토어 검색 활동을 했다. 2024년 1월 출시 후 GPT스토어에는 각종 유용한 인공지능(AI) 툴과 간혹 기이한 툴이 넘쳐났다. 만화 생성 툴은 뉴요커 스타일 일러스트레이션과 선명한 애니메이션 스틸을 제공한다. 프로그래밍 및 코드 작성 툴은 코드와 글 생성 단축키를 제공한다. GPT에 출시된 봇 중에는 색상 분석 봇과 거미 식별 봇, 데이팅 코치 ‘리즈GPT(RizzGPT)’ 등도 있다. 그러나 블리치펠트 안데르센은 한 가지 유형의 봇 때문에 골머리를 앓고 있다. 바로 자신의 근무 기업이 저작권을 보유한 교과서를 허가 없이 훈련 과정에 이용한 챗봇이다.

블리치펠트 안데르센은 덴마크 교과서 출판 기업 프랙시스(Praxis) 출판 책임자이다. 프랙시스는 AI를 적극적으로 채택하고, 자체 챗봇을 개발했다. 그러나 지금은 GPT스토어에서 자사 저작권법을 위반한 챗봇을 찾아내면, 또 다른 저작권 위반 챗봇이 등장하는 일이 반복된다. 블리치펠트 안데르센은 저작권 위반 챗봇 퇴치 노력에 나섰다.

블리치펠트 안데르센은 “저작권을 침해한 챗봇을 검색하고는 오픈AI에 신고한다. 하지만 저작권을 위반한 챗봇이 계속 등장한다”라고 말했다. 블리치펠트 안데르센은 저작권 위반 챗봇이 계속 등장하는 주된 이유가 교과서 내용을 그대로 게재하여 학우와 공유할 맞춤 제작 봇을 개발하기 때문이라고 생각한다. GPT스토어에 배포된 전체 챗봇 중 블리치펠트 안데르센이 발견한 저작권 위반 챗봇은 극소에 불과하다. 그는 “지금까지 저작권 위반 신고를 마친 앱은 빙산의 일각이다”라고 말했다.

미국 IT 매체 테크크런치가 오픈AI의 GPT스토어에 스팸이 너무 많다고 보도한 기사 내용처럼 GPT스토어에서는 저작권 보호 콘텐츠를 어느 정도 이용했음을 나타내는 봇을 찾기 쉽다. 저작권자의 동의 없이 저작권 보호 콘텐츠를 사용하는 행위는 일부 상황에서는 인정이 되지만, 다수 권리 당사자가 법적 대응에 나설 수 있다. 와이어드는 웨스테로스 라이터(Westeros Writer)라는 챗봇이 왕좌의 게임 제작자 조지 R.R 마틴(George R.R. Martin)의 문체와 같은 글을 작성한다고 주장한다는 사실을 발견했다. 또, 보이스 오브 앳우드(Voice of Atwood)라는 챗봇은 마가렛 앳우드(Margaret Atwood) 작가의 문체를 모방한다고 주장한다. 또 다른 챗봇인 라이트 라이크 스티븐(Write Like Stephen)은 스티븐 킹의 문체를 모방한다.

와이어드는 라이트 라이크 스티븐에 입력한 질문에 속임수를 담아 답변을 변경하도록 하는 시스템 명령어를 드러내도록 유도해 보았다. 이때 라이트 라이크 스티븐은 스티븐 킹의 회고록 ‘On Writing’에 접근했다고 전했다. 또한, 사용자의 요청에 따라 회고록 구문을 그대로 전달하고, 해당 문구가 작성된 페이지도 알려주었다. (라이트 라이크 스티븐 개발자는 이메일 주소나 연락처, 기타 외부 SNS 프로필 정보를 제공하지 않아 와이어드팀은 개발자에게 별도로 연락할 수 없었다.)

카일라 우드(Kayla Wood) 오픈AI 대변인은 GPT스토어의 챗봇 차단 요청이 저작권을 위반한 챗봇을 대상으로 제기된 것이라고 말하면서도 삭제 요청 충족 방식 관련 질문에는 답변하지 않았다. 우드 대변인은 오픈AI가 GPT의 저작권 문제를 적극적으로 살펴본다고 밝혔다. 우드 대변인은 “오픈AI는 자동화 시스템과 인간 검토, 사용자 보고를 통합하여 오픈AI 정책 위반 가능성이 있는 GPT를 찾아서 접근한다. 정책 위반 사항 중에는 필요한 허가 없이 외부 기관의 콘텐츠를 사용하여 제작한 챗봇도 있다”라고 설명했다.
 
[사진=Unsplash]
[사진=Unsplash]

새로운 논쟁
GPT스토어의 저작권 문제는 오픈AI의 기존 법률문제가 추가로 발생하는 원인이 될 수 있다. 오픈AI는 저작권 침해 혐의로 뉴욕타임스, 조지 R.R 마틴(George R.R. Martin)을 포함한 소설 및 비문학 작품 작가 집단 여러 곳의 소송을 비롯하여 여러 건의 소송을 직면했다.

오픈AI GPT스토어에 출시된 챗봇은 챗GPT와 같은 기술을 바탕으로 개발되었으나 오픈AI 소속이 아닌 외부 개발자가 특정 기능을 수행하도록 개발한 챗봇이다. 개발자는 챗봇을 개발 시 챗봇의 지식을 오픈AI의 기술에 적용되었다는 주장을 위한 추가 정보를 게재할 수 있다. 사용자의 질문에 답할 때 활용할 추가 정보를 제공하는 과정은 검색 증강 생성(RAG)이라고 칭한다. 블리치펠트 안데르센은 GPT스토어에 배포된 챗봇의 RAG 파일이 당사자 허가 없는 저작권 보호 콘텐츠 사용 문제의 온상이라고 본다.

오픈AI의 GPT스토어 사용 약관에는 필요한 허가가 없는 상태에서 외부 기관의 콘텐츠 사용을 금지한다는 규정을 명시했다. 하지만 지금 당장 오픈AI 외부에서는 GPT 개발자가 저작권 보호 콘텐츠를 사용했다는 사실을 확인할 길이 없다. 즉, 저작권자가 직접 저작권 위반 챗봇에 맞서야 한다는 의미이다.

블리치펠트 안데르센은 여러 키워드를 이용하여 GPT스토어에서 프랙시스의 출판 서적 내용을 이용했을 수도 있는 챗봇을 찾아낸다. 이후 저작권 위반을 의심할 만한 챗봇을 발견하면, 각각의 챗봇과 직접 대화하면서 프랙시스의 저작권 보호 콘텐츠로 훈련을 받았는가 파악한다. 사소한 작업이지만, 여러 차례 결과를 얻었다. 일부 챗봇에 프랙시스 출판 교과서의 특정 구문을 재생성하도록 명령어를 입력하여 저작권 위반 챗봇을 발견했다. 블리치펠트 안데르센은 “언어 모델을 속여서 저작권 위반 여부를 찾아내야 한다”라고 말했다.

오픈AI가 무단으로 저작권 보호 콘텐츠를 수집하여 자사 시스템 훈련 과정에 이용했다는 의혹으로 제기된 소송은 판결까지 몇 년이 걸릴 것이다. 하지만 GPT스토어에 게재된 챗봇의 저작권 위반 논쟁은 즉각 파장을 불러일으킬 수 있다. 제임스 그리멜만(James Grimmelmann) 코넬대학교 인터넷법 교수는 “GPT는 저작권과 관련하여 중요한 방식으로 오픈AI와 사용자 간의 관계를 변경한다”라고 말했다. 온라인 플랫폼에서 자체 콘텐츠 게재를 허용할 때는 저작권자가 당사자 동의 없이 지식재산권 적용 콘텐츠가 널리 확산된 것을 두고 항의하도록 인정하는 미국 저작권법의 일부분인 디지털밀레니엄저작권법(Digital Millennium Copyright Act) 적용 대상이 된다. 디지털밀레니엄저작권법 적용 예시로 유튜브의 일반 사용자의 개인 영상 게재 허용을 언급할 수 있다. 따라서 유튜버가 배경 음악을 추가한 채로 게재한 영상이 음원 라이선스 없이 영상을 게재한 것이라면, 일부 음반사는 해당 유튜버를 제소하고 영상 삭제 요청을 할 수 있다. GPT스토어에서는 개발자가 직접 개발한 작업물을 게재하도록 하므로 디지털밀레니엄저작권법 적용 대상에 해당한다.

저작권 침해 챗봇
불법 복제 반대라는 의도로 제정된 디지털밀레니엄저작권법은 저작권 법률 집행의 중요성을 강화했다. 저작권자가 당사자 동의 없이 저작권 콘텐츠를 이용한 다른 콘텐츠나 기술이 온라인에 게재되었을 때 저작권 위반 콘텐츠 및 기술 삭제를 신속하게 요청하도록 한다. 디지털밀레니엄저작권법의 저작권 침해 통지서를 보내는 방식으로 삭제 요청이 진행된다.

블리치펠트 안데르센은 GPT스토어에서 프래시스 교과서를 이용하여 제작된 챗봇을 처음 발견하자 오픈AI에 저작권 침해 통지서를 보냈다. 그는 덴마크 창작물 제작자 이익 보호 단체인 덴마크권리동맹(Danish Rights Alliance)에 도움을 청할 때까지 오픈AI의 답변을 받지 못했다고 전했다. 2023년, 저작권 침해 통지서를 제출하면서 일시적으로 접속이 차단된 생성형 AI 훈련에 사용된 프래시스의 출판 서적 19만 6,000여 권의 컬렉션을 확인했다.

덴마크권리동맹 콘텐츠 보호 및 법률 집행 책임자 토마스 헬드럽(Thomas Heldrup)은 저작권 위반 AI 퇴치 운동을 이끈다. 헬드럽은 GPT스토어의 저작권 위반 챗봇 삭제 과정에서 중심이 되는 역할을 하고, 오픈AI가 프래시스의 저작권 위반 대상이라고 판단한 챗봇을 제거하도록 프래시스 대신 문제를 제기했다.

헬드럽은 “오픈AI는 덴마크권리동맹이 보고한 챗봇을 포함하여 저작권 침해 챗봇을 신속하게 삭제했다”라고 말했다. 하지만 헬드럽은 오픈AI의 더 많은 변화를 원한다. 그는 “오픈AI는 권리 당사자가 저작권을 침해한 GPT 검색 시 즉시 사용할 만한 더 나은 툴이 필요하다”라고 덧붙였다.

블리치펠트 안데르센은 GPT스토어의 저작권 위반 챗봇 배포 문제가 나아지지 않는다면, 프래시스가 오픈AI를 상대로 법적 대응에 나설 방안을 고려할 것이라고 전했다. 블리치펠트 안데르센은 기업과 AI 개발사 모두 RAG 콘텐츠로 등록되는 저작권 보유 콘텐츠를 확인할 만한 더 강력한 시스템을 추가하는 것을 원한다. 유튜브에 등장하는 콘텐츠 저작권 보호를 위해 콘텐츠 ID 시스템과 비슷한 시스템을 원한다. (콘텐츠 ID와 같은 시스템 도입 계획을 물어보았을 때 오픈AI는 직접 답하지 않았으나 GP의 문제를 철저하게 검증한다고 전했다.)

복수 스타트업이 이미 AI 기업의 저작권 침해 챗봇 발견을 돕기 시작했다. 패트로누스AI(Patronus AI)창립자 겸 CEO 아난드 칸나판(Anand Kannappan)은 저작권 보호 대상이 되는 텍스트를 감지하는 AI 툴인 카피라이트캐처(Copyright Catcher) 서비스 출시로 개인 맞춤 설계 GPT의 저작권 침해 가능성을 확실히 찾아낼 수 있을 것이라고 주장했다.

그러나 일부 지식재산권 전문가는 오픈AI가 디지털밀레니엄콘텐츠법에 따라 저작권 사전 통지 요청을 하더라도 오픈AI가 일부 GPT의 저작권 보호 콘텐츠 사용과 관련하여 정당한 사용 개념을 주장할 수 있다고 지적했다.

아메리칸대학교 워싱턴법학대학 저작권 및 공개 라이선스 프로젝트 책임자 메레디스 제이콥(Meredith Jacob)은 “당사자 허가 없이 저작권 보호 콘텐츠를 일절 게재할 수 없다고 말하는 것을 주저할 수 있다. 매우 중요한 교육, 연구 기능을 배제하게 되기 때문이다”라고 설명했다. 또한, 학생의 교과서 내용 이해를 돕는 GPT 제작 활동을 공정한 사용 사례로 보호할 수 있는 대상이라고 덧붙였다.

오픈AI 외부인이 GPT스토어의 봇에 활용하고자 게재한 보완 파일을 볼 간단한 방법이 없다면, 저작권자는 오픈AI의 자동화 시스템이 저작권 위반 행위를 찾아낸다고 신뢰하거나 시간이 걸리더라도 개별적으로 의심스러운 봇을 확인하는 방법에 의존하는 등 침해를 우려할 수밖에 없다. 블리치펠트 안데르센은 “GPT스토어의 저작권 위반 문제 퇴치는 제대로 발견하는 것은 사막에서 바늘을 찾는 것과 다를 바 없다”라고 말했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
OpenAI’s GPT Store Is Triggering Copyright Complaints
이 기사를 공유합니다
RECOMMENDED