본문 바로가기 주메뉴 바로가기 검색 바로가기
저작권 소송, 생성형 AI의 미래 형성한다
상태바
저작권 소송, 생성형 AI의 미래 형성한다
예술 작품과 텍스트, 코드를 생성할 수 있는 알고리즘이 급속도로 발전한다. 그러나 알고리즘이 법적 문제로 피해를 줄 수 있다.
By WILL KNIGHT, WIRED US

테크 업계가 정리해고 바람과 급격한 암호화폐 시장 붕괴, 현재 진행 주인 트위터 혼란까지 각종 악재를 극복하지 못한 것처럼 보이는 가운데, 일부 투자자와 기업가는 이미 테크 부문의 새로운 호황에 주목한다. 바로 일관성 있는 글과 매력적인 이미지, 제 기능을 하는 컴퓨터 코드 작성 등과 같은 능력을 갖춘 인공지능(AI)이다. 하지만 생성형 AI라는 신흥 유망 기술 속에는 그 자체의 암울한 문제가 내재해 있다.

2022년 11월, 캘리포니아주 연방법원에는 깃허브의 코드 작성 프로그램인 코파일럿(Copilot)을 겨냥한 집단 소송이 제기되었다. 코파일럿은 프로그래머가 코드 입력을 시작할 때 제 기능을 하는 코드를 작성하는 능력을 갖춘 AI 기반 코드 작성 프로그램이다. 집단 소송 원고인 개발자는 코파일럿이 깃허브 라이선스 구매로 제공하는 오픈소스 코드를 재생성할 때 사실을 알리지 않았다는 점을 지적하며, 깃허브가 저작권을 침해했다고 주장했다.

소송은 현재 시작 단계에 머무르고 있으며, 소송 결과는 불확실하다. 코드 작성 AI 기술이 새로운 기술이며, 그동안 법적 감시가 거의 이루어지지 않았기 때문이다. 하지만 다수 법률 전문가는 생성형 AI 툴의 포괄적인 추세와 관련이 있다고 말한다. 명령어에 따라 그림과 사진, 일러스트레이션을 생성하는 AI와 마케팅 문구를 작성하는 AI 모두 인간의 과거 작업을 이용해 훈련한 알고리즘을 바탕으로 개발하기 때문이다.

비주얼 아티스트는 오래전부터 기존 작품의 이미지를 포함한 AI의 합법성과 윤리성과 관련하여 각종 의문을 제기했다. 시각적 창작 작품으로 생계를 유지하는 일부 아티스트는 자신의 과거 작업물로 훈련 과정을 거친 AI 예술 작품이 같은 방식으로 새로운 이미지를 완성한다는 점에 분노했다. 음악 업계 단체인 미국 레코드 협회(RIAA)는 AI 기반 음악 제작과 리믹싱이 저작권 우려의 새로운 시대 시작이라는 결과로 이어질 것을 암시했다.

깃허브를 제소한 디자이너 겸 프로그래머, 변호사인 매튜 버터릭(Matthew Butterick)은 “생성형 AI 때문에 지금 당장 직면한 문제는 AI로 제작한 작업물이 인간 제작자의 작품을 마구 이용하면서 발생하는 일이다”라고 말했다.

코파일럿은 생성형 AI 기술의 창의성과 상업적 잠재력을 지닌 강력한 사례이다. 코파일럿은 수많은 프로젝트의 코드 수억 개를 저장한 마이크로소프트의 계열사인 깃허브가 개발한 툴이다. 깃허브는 AI 스타트업인 오픈AI(OpenAI)가 코드 생성을 위해 설계한 알고리즘을 훈련하면서 완성됐다. 깃허브는 저장한 다량의 코드를 이용해 훈련하면서 프로그래머가 키보드로 몇 글자를 입력한 뒤 전체 코드를 먼저 완성할 수 있는 시스템을 개발했다. 최근, 깃허브는 개발자가 코파일럿을 사용하면, AI 코드 작성 툴 없이 평소처럼 코드 작성 작업을 할 때보다 걸리는 시간을 절반 이상 단축할 수 있다는 조사 결과를 발표했다.
 
[사진=Unsplash]
[사진=Unsplash]

그러나 일부 개발자가 즉시 알아차린 바와 같이 코파일럿은 간혹 공개 코드 저장소에 저장된 코드 문구 수백만 줄에서 복사한 식별 가능한 코드 스니펫을 재생성할 수도 있다. 버터릭을 포함한 다수 개발자가 제기한 소송은 마이크로소프트와 깃허브, 오픈AI를 저작권 침해로 기소했다. 코파일럿의 코드가 특정 코드를 다루는 오픈소스 라이선스에 필요한 코드 작성 기여자 정보를 포함하지 않았기 때문이다.

물론, 프로그래머는 항상 서로 작성한 코드를 보고 연구하고 학습하고, 복사하여 사용하기도 한다. 그러나 모두 AI가 인간 개발자와 같은 수준으로 작업할 것이라고 확신하지는 않는다. 특히, AI가 자체적으로 가치 있는 코드를 대거 생성하면서 코드 참고 출처의 라이선스 요구사항을 무시할 가능성을 우려한다. 부테릭은 “기술자인 나는 개인적으로 AI를 열렬히 지지한다. 여러 영역에 걸친 AI의 가능성을 모색하고자 한다. 그러나 모두에게 공정한 방식으로 사용해야 한다”라고 말했다.

깃허브 CEO 토마스 돔크(Thomas Dohmke)는 현재 코파일럿이 기존 코드를 복사하여 사용하는 행위를 방지할 기능을 적용했다고 밝혔다. 그는 “코파일럿의 코드 작성이 가능해지면서 코파일럿이 제안하는 코드가 깃허브에 공개된 코드와 일치할 때는 라이선스 요구사항이 없어도 해당 제안 코드를 사용하지 않을 것이다”라고 말했다.

코파일럿의 코드 복사 방지 기능으로 저작권을 보호할 수 있을 것인지는 더 지켜보아야 할 것이다. 또, 앞으로 진행될 소송이 광범위한 영향을 미칠 수도 있다. 오픈소스 관련 전문 변호사이자 전직 코드 개발자인 루이스 비야(Luis Villa)는 “소송으로 생성형 AI의 저작권 문제가 해결되지 않았다고 가정하면, 해당 소송 판결은 중요한 판례가 될 것임이 분명하다”라고 말했다.

깃허브 공동 창립자 나트 프리드만(Nat Friedman)과 개인적인 친분이 있는 비야는 코파일럿과 같은 AI 툴이 오픈소스와 무료 소프트웨어라는 정체성에 위반하지 않는다고 생각한다. 비야는 “1980년대와 1990년대 무료 소프트웨어 운동은 개발자의 코드 작성 능력을 늘리고자 저작권의 권력을 축소하는 것을 주로 논의했다. 따라서 현재 일각에서 커뮤니티 보호를 위해 저작권을 최대화하는 방안을 논의한다는 점에 분노를 느낀다”라고 밝혔다.

코파일럿 소송 결과를 떠나 이번 소송 자체가 비야는 생성형 AI의 다른 분야의 운명도 좌우할 것이라고 본다. 만약, 코파일럿 소송이 AI 생성 코드와 알고리즘 훈련 데이터의 유사성을 결정한다면, 훈련 데이터에 포함된 작품과 같은 스타일의 이미지나 음악을 재생성하는 AI 시스템에도 파장이 이어질 것이다.

웹 개발 커뮤니티 글리치(Glitch) CEO이자 프런티어전자재단(Electronic Frontier Foundation) 이사회 구성원인 아닐 대쉬(Anil Dash)는 생성형 AI의 저작권 침해를 둘러싼 법적 논의가 생성형 AI 훈련의 중대한 적용 과정이라고 본다. 그는 “AI가 예술 작품을 창작하거나 글이나 코드를 작성하는 것을 보았다면, AI가 완성한 작품의 의미와 생성형 AI의 작품이 기업과 사회에 의미하는 바를 생각하게 된다. 모든 기관이 생성형 AI의 의미를 깊이 생각하지 않은 듯하다. 생성형 AI의 의미를 생각하는 것이 다음의 변경 단계가 될 것이라고 본다”라고 전했다. 생성형 AI를 깊이 생각하면서 시범 사용하는 이가 증가하는 가운데, 앞으로 생성형 AI의 저작권 관련 소송이 증가할 수도 있을 것이다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
This Copyright Lawsuit Could Shape the Future of Generative AI
이 기사를 공유합니다
RECOMMENDED