챗GPT 암거래 시장, 중국서 성행 중

By CAIWEI CHEN, WIRED UK

유신 궈(Yuxin Guo)는 북경대학교 석사 과정을 밟고 있는 학생이다. 궈는 지난 몇 달간 인간의 텍스트 명령어에 따라 거의 자연스러운 듯한 언어를 생성하는 생성형 인공지능(AI) 툴인 챗GPT(ChatGPT)를 둘러싼 온라인 논쟁을 찾아보았다. 궈는 소셜 미디어 플랫폼 웨이보에서 미국 대학생이 챗GPT를 사용해 연구 논문을 작성하는 모습을 보여주는 영상 한 편을 보았다. 2023년 2월, 궈도 시험 삼아 연구 논문 작성 시 챗GPT를 이용하기로 결정했다.

궈는 “많은 이들이 챗GPT에 대해 이야기하는 것을 보고 호기심이 생겼다. 그러나 대다수 누리꾼이 어떤 경로로 챗GPT에 접근하는지는 확실하지 않다”라고 밝혔다.

챗GPT는 중국에서 사용할 수 없다. 중국 정부가 챗GPT 접근 자체를 막은 것은 아니지만, 챗GPT 개발사인 오픈AI는 중국에서 접근할 수 없다. 결국, 궈는 중국 상품 판매자 수십만 명이 아이폰 케이스부터 외국 운전면허증까지 다양한 상품을 판매하는 현지 최대 전자상거래 웹사이트인 타오바오에 접속했다.

챗GPT 로그인은 타오바오의 인기 판매 상품이 되었다. 외국 전화번호와 특히 인증 코드를 받을 수 있는 가상 번호가 있기 때문이다. 2023년 2월 초반 기준 타오바오에서 간단한 키워드를 검색했을 때, 챗GPT 로그인 정보 온라인 판매 스토어 600개 이상을 찾아볼 수 있었다. 로그인 정보 판매 비용은 최소 1위안(0.17달러), 최대 30위안(4.28달러)이었다. 일부 온라인 판매 스토어는 로그인 정보 수천 개를 판매했다. 텐센트 소유 온라인 메시지 플랫폼인 위챗에서는 챗GPT 불법 복제 상품이 대거 등장하여 시장이 성행하는 추세이다. 위챗에서는 주로 위챗의 하위 애플리케이션에 해당하는 미니 프로그램인 챗GPT 온라인(ChatGPT Online) 등을 통해 챗GPT의 불법 복제 상품을 찾아볼 수 있다. 챗GPT 불법 복제 상품은 사용자에게 몇 가지 무료 질문 서비스를 제공한 뒤 사용료를 청구한다. 챗GPT 불법 복제 상품 판매자 대부분 사용자 대신 챗GPT에 질문을 입력하고, 생성된 답변을 전달하는 중개업자이다. 중국 최대 검색 엔진인 바이두에는 “중국 내 챗GPT 사용 방법”이 수 주간 화제 검색어가 되었다.

중국의 챗GPT 접근 권한 판매 암거래 시장 규모와 불법 복제 서비스 확산 추세는 중국 내 생성형 AI 수요가 드러나지는 않았으나 매우 높다는 사실을 보여준다. 그와 동시에 생성형 AI를 개발하고자 하는 기업이 각종 어려움에 직면한 현실도 반영한다. 생성형 AI의 복잡함이라는 특성 때문에 챗봇이 생성하는 결과를 예측하기 어렵다. 간혹 정부가 엄격한 수준으로 통제하는 중국 인터넷 환경에서는 AI 기반 챗봇의 결과물이 위험할 수도 있다.

카네기 인터넷 평과 기부(Carnegie Endowment for International Peace)의 중국 AI 생태계 연구 펠로인 매트 시한(Matt Sheehan) 박사는 “챗GPT와 같은 프로그램을 개발 중인 중국 대기업은 AI 지도력과 정보 통제라는 중국 정부의 두 가지 최우선 과제를 두고 긴장 관계에 놓일 수 있다”라고 예상했다.

중국 테크 업계 대기업은 서둘러 오픈AI의 AI 연구, 개발 성과를 따라잡아 자체 개발 서비스를 시장에 출시하려는 모습을 보였다. 그러나 일부 기업은 수년 동안 대규모 언어 모델 연구를 이어왔다.

2023년 2월 7일(현지 시각), 바이두는 3월 중으로 내부 테스트를 위해 AI 챗봇인 어니봇(Ernie bot)을 출시할 계획이라고 발표했다. 어니봇은 바이두가 2019년부터 개발해온 대규모 언어 모델인 어니 3.0-타이탄(Ernie 3.0-Titan)을 기반으로 한다.

바이두는 어니봇이 영어로 작성한 명령어에 자연스러운 대화 형태의 답변을 제공하며, 주로 중국어 어조를 이해하려 할 수 있다고 설명했다. 바이두 CEO 로빈 리(Robin Li)는 바이두의 2022년 4분기 실적 발표 현장에서 어니봇을 검색 엔진과 샤오두(Xiaodu) 음성 비서에 통합하고, 바이두 AI 클라우드와 아폴로(Apollo) 자율주행 차량에 활용할 계획이라고 밝혔다.

어니봇 출시 계획 발표 당일 홍콩 증권거래소에서 바이두의 주가가 15% 급등했다.

바이두의 어니봇 출시 계획 발표 일주일 뒤 음성 인식 시스템으로 이름을 알린 AI 기업인 아이플라이테크(iFlyTech)가 자체 개발한 AI 봇을 공개했다. 아이플라이테크는 5월 중으로 자사 AI 봇을 정식 출시할 예정이며, 챗GPT와 비슷한 기술적 도약 달성을 확신한다고 밝혔다. 2월 27일(현지 시각), 텐센트는 자체 챗GPT 대안 프로그램인 훈위안에이드(HunyuanAide) 개발팀을 조직 내부에 형성했다고 발표했다. 반면, 알리바바, JD.com 등 전자 상거래 기업과 게임 업계 대기업 넷이즈(NetEase) 모두 AI 챗봇을 활용하여 작업 중이라고 밝혔다.

2023년 2월, 음식 배송 서비스 업계 대기업 메이투안(Meituan) 공동 창립자 왕휘원(Wang Huiwen)은 은퇴와 함께 SNS 플랫폼 자이크(Jike)에 오픈AI 경쟁사 창업에 함께할 직원을 채용한다는 내용의 글을 게재했다. 왕은 벤처 캐피털 투자를 통해 투자금 2억 3,000만 달러를 확보했으며, 그중 5,000만 달러는 AI 개발 기업 프로젝트 자금 지원을 위해 자비로 투자한 금액이라고 전했다.

중국 정부는 항상 생성형 AI 개발의 중요성을 인식했다. 2023년 2월 13일, 다수 중국 AI 스타트업 관리 및 규제 담당 기관인 베이징의 시 경제정보국(Municipal Bureau of Economy and Information)은 중국 최고 기업의 챗GPT 경쟁 모델 개발에 도움을 줄 것이라고 약속했다.

조지워싱턴대학교 정치과학 부교수 제프리 딩(Jeffery Ding)은 “중국에서 직접 개발한 챗GPT와 같은 AI 프로그램 개발 선두 기업은 이미 GPT-3와 같은 대규모 언어 모델을 기반으로 작업을 진행했다”라며, GPT-3와 같은 언어 모델이 챗GPT의 기본 기술이 된다. 딩 부교수는 바이두, 화웨이, 인스퍼(Inspur), 텐센트 모두 대규모 언어 모델을 개발했으며, 미국 기업의 대규모 언어 모델보다 부족하지는 않을 수도 있다고 전했다.

인스퍼 인포메이션(Inspur Information) 전무 겸 AI 총괄관리자인 리우 준(Liu Jun)은 와이어드와의 인터뷰에서 인스퍼의 위안 1.0(Yuan 1.0) 모델이 2,457억 가지 변수와 5TB 용량의 데이터세트를 갖추었으며, 현재 오픈소스 개발자 커뮤니티 구성원 3,000명 이상 확보했다고 전했다. 2021년, 바이두는 어니 3.0 타이탄이 2,600억 가지 변수와 4TB 용량의 데이터세트를 보유했다고 작성한 연구 논문을 발표했다. 반면, 오픈AI의 GPT-3는 약 1,750억 가지 변수를 갖추었다.

화웨이와 바이두, 텐센트는 와이어드의 문의에 답변하지 않았다.

챗GPT는 거의 영어로만 언어 모델을 훈련했으나 중국어 문자도 어느 정도 유창하게 작성한다. 그러나 와이어드의 무료 버전 자체 테스트 시 중국어 문장 작성 시 영어를 작성할 때보다 5초 더 느린 것을 확인할 수 있었다.

중국 인터넷 규모가 매우 큰 것과 달리 언어 모델을 형성할 데이터 수집 수단이 너무 적은 탓일 수도 있다. 딩 부교수는 “우수한 중국어 문자 생성 능력 부재가 문제가 될 수 있다”라며, 위키피디아의 영어 입력어가 중국어 입력어보다 두 배 더 많다는 사실을 지적했다.

그동안 중국어의 언어적 특성은 자연스러운 언어 프로그램 구축의 어려움으로 작용했다. 중국어는 종종 영어보다 문맥에 따른 특성이 강하며, 숙어와 복잡한 은유를 더 많이 사용한다. 그러나 2017년, 데이터세트를 이용해 문맥을 학습할 수 있는 트랜스포머 신경망이 개발된 덕분에 연구원의 자연스러운 중국어 언어 프로그램 생성 작업이 수월해졌다.

정치 행동 및 인터넷을 연구 중인 스탠퍼드대학교 박사학 과정 후보생 토마스 치통 차오(Thomas Qitong Cao)는 “중국어의 문맥 의존도가 높은 특성은 그동안 자연어 처리 작업의 걸림돌이 되었다. 그러나 사전 훈련 대규모 언어 모델 시대에는 중국어와 영어 처리 작업 능력의 격차가 놀라울 정도로 줄어들었다”라고 말했다.

차오는 중국어 AI 모델 훈련의 어려움으로 컴퓨터 전력 소모 문제와 데이터세트의 규모 및 품질을 언급했다.

기업은 정부가 민감하다고 판단하는 대상에 시행하는 검열에도 맞서야 한다. 중국 SNS 플랫폼은 알고리즘과 인간 관리자의 검토 작업을 결합하여 정부가 끊임없이 변경하는 규정에 위반하는 내용을 항상 감시하고 제거해야 한다.

테크 기업은 챗봇의 생성 결과도 철저하게 모니터링해야 할 것이다. 인간 관리자 배치가 필요한 작업에 해당한다. 차오는 “키보드 입력 차단 전략과 결합한 인간에 의존하는 검열을 공개적으로 접하는 챗봇에 적용하는 상황을 관측할 확률이 높아질 것이다”라고 내다보았다.

타임의 자체 조사 결과, 오픈AI는 챗GPT가 생성하는 결과물의 피해를 줄이려 시급 2달러 미만을 지급하면서 케냐 근로자를 채용하는 것으로 나타났다.

하지만 시한 박사가 지적한 바와 같이 사용자의 입력 내용을 항상 예측하거나 개발자가 예측할 수 없는 챗봇의 특성상 챗봇 개발 기업은 문제를 겪을 수밖에 없다.

시한 박사는 “현재 공개 AI 법률은 각각 추천 알고리즘과 딥페이크에 초점을 맞춘다. 두 가지 사항 모두 사용자가 온라인에서 소비하는 콘텐츠 모니터링 과정에서 중국 정부가 최우선 순위로 두는 사항이다. AI가 생성한 콘텐츠는 온라인 콘텐츠 모니터링 대상에 해당하며, 챗GPT와 같은 프로그램을 개발하는 기업은 국가인터넷정보판공실(Cyberspace Administration of China)과의 문제를 겪게 될 것이다”라고 예측했다.

중국 테크 플랫폼은 그동안 챗GPT 접근 권한 암거래 시장 단속을 시작했다. 2023년 2월 말, 와이어드는 타오바오에서 ‘챗GPT’와 ‘오픈AI’라는 키워드 검색이 금지된 사실을 확인했다. 위챗에서는 ‘챗GPT 온라인’ 및 그와 유사한 서비스 이름이 ‘AI 스마트 챗(AI Smart Chat)’과 같이 중립적인 느낌의 명칭으로 바뀌었다.

챗GPT 불법 복제 서비스 중개업자는 개발자에게 챗GPT 백엔드 접근 권한을 제공하는 API와 대규모로 등록된 계정에 의존한다. 뉴욕 지식재산권 전문 변호사 이반 왕(Ivan Wang)은 “중개업자는 챗GPT에 직접 접근할 수 없는 사용자를 챗GPT 서비스와 연계하면서 돈을 번다. 중국 사용자와 챗GPT 서비스 사용 연결 과정만 보면, 중개업자는 챗GPT 사용 약관과 기타 상표권 및 관련 특허를 위반했다”라고 설명했다.

중국의 제한 조치 우회 방식을 겨우 찾아낸 챗GPT 사용자 수 통계 자료를 보았을 때 중국 내 챗GPT 사용이 불가능한 것은 아니지만, 적어도 챗GPT 비밀 접근 지점 확산이 생성형 AI 활용 사례를 어느 정도 제공한 것으로 보인다.

테크 제품 관리자 에코 리우(Echo Liu)는 챗GPT 사용자에게 우선 접근 권한을 제공하는 시점 구독 서비스인 챗GPT 플러스(ChatGPT Plus)에 가입한 오픈AI 계정 사용료 189위안(약 27.5달러)를 결제했다. 리우는 “특히, 챗GPT가 직접적인 언어로 복잡한 언어 설명을 할 수 있다는 사실에 놀랐다”라고 말했다. 리우는 중국어로 챗GPT를 입력한 뒤 응답 지연 문제를 겪은 뒤 챗GPT 플러스로 업그레이드했으며, 지금은 챗GPT를 이용해 코드 작성 방법을 학습 중이다.

외국 서비스를 판매하는 소수 기업가는 챗GPT를 일상 업무에 통합했다.

글로벌 운송 서비스 OL 웨어하우스(OL Warehouse) 대표인 타오 예(Tao Ye)는 와이어드와 인터뷰 도중 OL 웨어하우스가 이미 소규모 고객 질의응답 서비스에 챗GPT를 사용하기 시작했다고 전했다. 예는 “챗GPT의 고객 서비스 메시지 작성 작업을 실험 중이다. 지금까지 챗GPT의 응답 내용은 훌륭했다”라고 말했다.

영어를 구사하는 고객을 대상으로 하는 소규모 전자상거래 웹사이트 운영자인 레이첼은 사본 초안 작성 작업에 챗GPT를 사용했다. (레이첼은 당국의 감시를 피하고자 이름만 밝혔다.) 레이첼이 중국 라이프스타일 소셜미디어 플랫폼 RED에 게재한 해외 전자상거래 서비스 설명에 사용할 챗GPT 통합 방법 공유 게시물의 ‘좋아요’ 수는 2,000건을 넘어섰다. 레이첼은 그동안 프리랜서 업무 웹사이트 피버(Fiverr)를 이용해 인도 프리랜서 작가를 채용하여 한건당 20달러를 지급하면서 블로그 게시글을 작성했다. 그러나 이제는 블로그 게시글 작성 시 챗GPT만 사용하기로 결정했다.

레이첼은 “그동안 자연스러운 영어 문장으로 제품 설명문과 블로그 게시물을 작성하는 일이 어려웠다. 챗GPT 덕분에 제품 등록 과정과 소통 속도를 놀라울 정도로 빨라졌다”라고 말했다.

** 위 기사는 와이어드UK(WIRED.co.uk)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
China’s ChatGPT Black Market Is Thriving

와이어드 코리아=Wired Staff Reporter iufcsol0122@spotv.net

이 기사를 공유합니다