본문 바로가기 주메뉴 바로가기 검색 바로가기
오픈AI의 신규 툴, 아티스트 대상 개인 데이터 통제 권한 부여...그 방법은 불확실
상태바
오픈AI의 신규 툴, 아티스트 대상 개인 데이터 통제 권한 부여...그 방법은 불확실
오픈AI의 신규 툴, 아티스트 대상 개인 데이터 통제 권한 부여…그 방법은 불확실
By KATE KNIBBS, WIRED US

오픈AI가 자신의 작품이 챗GPT를 포함한 여러 인공지능(AI) 시스템의 이면에 존재하는 알고리즘 훈련에 부적절하게 동원되었다는 의혹을 제기하는 예술가, 작가, 출판 산업 관계자와의 소송 공방을 이어가고 있다. 2024년 5월 7일(현지 시각), 오픈AI는 창작물 생성 인력과 권리자를 달래도록 설계된 툴을 공개했다. 해당 툴은 오픈AI가 예술가, 작가 등의 작품 사용 방식을 어느 정도 통제할 권한을 부여한다.

오픈AI는 2025년, 콘텐츠 크리에이터가 자신의 콘텐츠를 오픈AI의 AI 개발 시 이용할 데이터에 포함되지 않도록 설정하는 툴인 미디어 매니저(Media Manager)를 출시할 계획이라고 밝혔다. 오픈AI는 공식 블로그 게시글을 통해 미디어 매니저를 크리에이터와 콘텐츠 소유자가 자신의 소유권을 알리고, 개인 작품을 머신러닝 연구 및 훈련 과정에 포함하거나 제외할 방법을 구체적으로 정하도록 하는 방법이라고 설명했다.

오픈AI는 크리에이터, 콘텐츠 소유자, 규제 당국과 미디어 매니저 개발을 위해 협력 중이며, 업계 표준을 설정하고자 한다고 밝혔다. 다만, 미디어 매니저 개발 과정의 협력자 이름이나 미디어 매니저를 운영할 정확한 방법 등은 구체적으로 밝히지 않았다.

미디어 매니저 시스템과 관련한 공개 의문 사항 중에는 콘텐츠 소유자가 단 하나의 요청으로 모든 작품을 다룰 가능성과 오픈AI가 이미 훈련 과정을 거쳐 출시된 AI 모델과 관련한 요청 수용도 포함된다. 현재 AI 시스템이 회고적으로 훈련 데이터의 한 부분에 기여한 바를 제거하도록 변경하는 과정인 머신 언러닝(machine unlearning) 연구를 진행 중이지만, 아직 머신 언러닝은 완벽하지 않다.

AI 기업의 윤리적 출처에서 수집한 훈련 데이터 사용 인증 스타트업 페어리트레인드(Fairly Trained) CEO 에드 뉴턴렉스(Ed Newton-Rex)는 오픈AI가 훈련 데이터와 관련하여 접근 방식을 전환하려는 추세는 환영할 만한 일이지만, 해당 시스템 구축이 중요하다고 전했다. 뉴턴렉스는 “오픈AI가 윤리적으로 수집한 훈련 데이터 채택 전환 문제에 참여한다는 소식은 반가운 소식이다. 아티스트가 훈련 데이터의 상세 사항을 통제하도록 도움을 줄 가능성은 아직 제공되지 않았다”라고 말했다. 뉴턴렉스는 오픈AI가 콘텐츠 소유자의 개인 데이터 제외 요청이 없는 한 허락을 받지 않고 데이터를 계속 이용하도록 하는 데이터 수집 비활성화 툴만 제공하는 데 그칠 가능성을 중요한 의문점으로 제기했다. 혹은 오픈AI의 사업 운영 방식의 포괄적인 변화일 가능성에도 의문을 제기했다. 오픈AI는 미디어 매니저 툴과 관련한 의견 공개 요청에 답변하지 않았다.
 
[사진=Freepik]
[사진=Freepik]

뉴턴렉스는 오픈AI가 다른 기업도 미디어 매니저를 사용하도록 하여 아티스트가 여러 AI 개발사에 적용할 우선순위를 한 번에 암시할 수 있을 가능성도 궁금해한다. 이미지 생성 AI 프로그램 스테이블디퓨전(Stable Diffusion) 개발사인 스테이빌리티AI(Stability AI)의 CEO였던 뉴턴렉스는 “그렇지 않는다면, 이미 복잡한 데이터 수집 비활성화 환경의 복잡함을 추가하는 것이다”라고 말했다.

오픈AI에 앞서 다른 기업도 아티스트와 콘텐츠 크리에이터의 AI 프로젝트 대상 개인 작품 및 개인 데이터 사용 우선순위를 나타내도록 할 방안을 모색했다. 어도비부터 텀블러까지 복수 테크 기업도 데이터 수집과 머신러닝과 관련하여 비활성화 툴을 제공한다. 스타트업 스포닝(Spawning)은 약 2년 전, 개인 작품을 당사자 동의 없이 AI 훈련 데이터로 이용하지 않도록 하는 등록 프로그램인 ‘두낫트레인(Do Not Train)’을 출시했다. 현재 많은 크리에이터가 두낫트레인을 통해 총 15억 개가 넘는 작품을 AI 훈련 데이터에 사용하지 않도록 등록했다.

스포닝 CEO 조던 메이어(Jordan Meyer)는 스포닝이 현재 오픈AI의 미디어 매니저 프로젝트 작업에 협력하지는 않지만, 추후 협력에 응할 의사가 있다고 전했다. 메이어는 “오픈AI가 AI 훈련 데이터에서 포괄적인 데이터 수집 비활성화가 수월해지도록 작품 등록이나 예술가, 콘텐츠 크리에이터의 요청 사항을 반영하고자 한다면, 스포닝은 기꺼이 미디어 매니저와 두낫트레인의 데이터를 통합할 것이다”라고 말했다.

다만, 메이어는 뉴턴렉스와 마찬가지로 여러 가지 활성화 시스템이 예술가와 크리에이터에게 너무 많은 설정 작업을 요구할 가능성을 우려한다. 메이어는 “AI 대기업이 개발한 각각의 비활성화 툴 확산은 피해야 하는 일이다. 데이터 수집 비활성화는 간단하면서도 포괄적으로 적용되어야 한다. 외부 기관이 개발한 공개 시스템이 필요하다고 확신하는 부분이다”라고 말했다.

주요 AI 개발사가 사용자에게 개인 데이터 사용 방식 관리 권한을 추가로 부여하고자 한 과거의 시도가 항상 원활하게 이루어진 것은 아니다. 2023년, 메타는 개인 데이터를 메타의 AI 훈련 데이터에 이용하는 것을 원하지 않는 사용자를 대상으로 개인 데이터 삭제 요청을 전송할 방법을 배포했다. 다수 아티스트가 이를 개인 작품을 메타의 AI 프로젝트 개발 및 훈련 목적 데이터 수집 비활성화 방식으로 해석하고, 메타가 요청을 거부하자 분노했다. (메타는 와이어드에 삭제 요청은 비활성화 기능이 아니라고 전했다.)

한편, AI의 훈련 데이터 대상의 움직임 증가는 다음과 같이 훨씬 더 급격한 변화를 옹호한다. 바로 AI 기업이 창작물과 권리자의 명확한 허락이 있는 데이터로만 알고리즘을 훈련하도록 방법을 전환하는 것이다. 종종 AI와 예술을 주제로 한 글을 작성한 컨셉 아티스트 겸 일러스트레이터인 레이드 사우든(Reid Southen)은 “대규모 이익 전환과 업계의 새로운 변화를 모색할 때 비활성화 작업은 전혀 고려하지 않는다. 데이터 수집 활성화만이 손쉽게 나아갈 유일한 방법이다”라고 말했다.

사우든과 뉴튼렉스 모두 비활성화 툴이 AI 훈련 데이터에서 제외하고자 하는 각각의 작품마다 별도의 요청 사항을 제출해야 할 때 특히 부담을 덜어주는 역할을 할 수 있다고 본다. 사우든은 “이미지 수백만 장을 보유한 사진작가라면, 직접 촬영한 사진 중 여러 사진을 AI 훈련 데이터에서 한꺼번에 제외할 수 없을 것이다”라고 말했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
OpenAI’s New Tool Will Give Artists Control Over Their Data—but It’s Unclear How
이 기사를 공유합니다
RECOMMENDED