본문 바로가기 주메뉴 바로가기 검색 바로가기
생성형 AI가 그린 퀴어 인물, 어떤 모습일까?
상태바
생성형 AI가 그린 퀴어 인물, 어떤 모습일까?
와이어드가 오픈AI의 소라를 포함한 인공지능 툴이 성소수자의 모습을 묘사하는 방식을 조사했다. 보라색 머리카락이 많다는 점을 힌트로 제시할 수 있다.
By REECE ROGERS, WIRED US

샌프란시스코는 인공지능(AI) 혁신 중심지이면서도 미국 내 성소수자 중심 도시 중 한 곳이기도 하다. 챗GPT 개발사인 오픈AI(OpenAI)의 본사가 있는 미션 디스트릭트(Mission District)는 무지개 색상 횡단보도가 있는 곳이자 나체 상태인 나이가 많은 남성을 종종 목격하게 되는 곳인 카스트로와 가까운 곳이다.

퀴어인 이들도 AI 혁신에 합류한다. 생성형 AI를 제작하는 개발자를 연구하고자 샌프란시스코로 이사한 예일대학교 대학원생이자 인류학자인 스펜서 카플란(Spencer Kaplan)은 “언급하는 이들이 극소수라고 생각하는 부분은 AI 개발 분야 인력 다수가 동성애자 남성이라는 사실이다”라고 말했다. AI 개발 분야에서 동성애자로 알려진 대표적인 인물은 오픈AI CEO 샘 알트만(Sam Altman)이다. 알트만은 2023년, 남편과 비공개 해변 전망 지역에서 결혼식을 했다. 알트만과 캘리포니아 지역을 제외하고 보았을 때도 AI 프로젝트에 참여하면서 퀴어인AI(Queer in AI)를 비롯한 성소수자의 AI 개발 단체에 합류하는 성소수자 구성원이 증가하는 추세이다.

2017년, 주요 학술 콘퍼런스에서 설립된 퀴어인AI의 핵심 임무는 트랜스젠더, 제3의 성 정체성을 주장하는 구성원, 유색인종 등을 중심으로 그동안 제 목소리를 낼 수 없었던 성소수자 연구원과 과학자 지지이다. 알고리즘 공정성을 연구하는 UCLA 박사 후보생 아넬리아 오발레(Anaelia Ovalle)는 “사실, 퀴어인AI 덕분에 AI 분야에 계속 몸담고 있다”라고 밝혔다.

그러나 AI에 관심이 있는 퀴어와 AI 업계가 개발하는 생성형 AI 툴이 퀴어 집단을 나타내는 방식 간 차이점이 있다. 필자가 가장 우수한 성능을 갖춘 AI 이미지, 영상 생성 프로그램에 퀴어 인물 이미지 묘사를 요청하자 내놓은 답변에는 항상 성소수자 문화 선입견 설명이 담겨있었다.

최근, 이미지 품질이 개선되었으나 AI 생성 이미지는 종종 가장 간단하면서도 왜곡된 퀴어 구성원의 생활을 보여준다. 필자는 성소수자 인물 초상화를 생성할 때 미드주어니(Midjourney)를 사용했다. 미드주어니는 성소수자와 관련된 보편적인 선입견을 강화한 결과물을 내놓았다. 미드주어니는 레즈비언 여성은 코걸이와 심각한 표정이 두드러지는 모습으로, 게이 남성은 복근을 강조한 화려한 의상을 착용한 모습으로 그렸다. 트랜스젠더 여성의 기본 이미지는 란제리 의상과 가슴을 강조한 카메라 각도를 포함하여 과도한 성적인 모습을 담았다.

이미지 생성 AI 툴이 인간을 묘사하는 방식은 기본 머신러닝 알고리즘 훈련 방식을 반영한다. 훈련 데이터 대부분 웹에서 수집한 텍스트와 이미지이다. 훈련 목적으로 수집된 데이터 대부분 게이 남성은 여성과 비슷한 모습으로, 레즈비언 여성은 남성과 비슷한 모습으로 추측하는 등 퀴어 인물의 선입견에 따른 추측이 이미 강화되었을 수도 있다. AI로 소수 집단 이미지를 생성할 때 성소수자 이미지 생성 시 노출된 것과 비슷한 문제를 겪을 수 있다.

미드주어니는 양성애자와 제3의 성별을 지닌 인물 모두 AI가 생성한 질감 패턴의 라일락 색상 머리카락으로 묘사된 이미지에 확실히 만족한다. 미드주어니는 머리카락색을 성소수자 특징으로 유지하면서도 레즈비언 여성의 이미지는 옆머리는 삭발하고, 가슴 주변에 가득 새겨진 문신을 포함한 모습으로 묘사된다. 미드주어니에 인종이나 민족 특성을 언급하지 않고 퀴어 인물 이미지를 생성하도록 명령어를 입력했을 때는 주로 백인처럼 보이는 인물의 이미지가 완성되었다.

AI 툴은 트랜스젠더 인물의 모습을 현실적으로 그리지 못했다. 트랜스젠더 남성의 모습을 선출된 의원의 모습처럼 그리도록 명령어를 입력했을 때 미드주어니는 전문 정치인처럼 보이는 남성적 턱선이 두드러지면서 정장 차림으로 나무 소재로 설계된 사무실 안에서 자세를 취하는 인물의 모습을 완성했다. 그러나 이미지 속 인물의 스타일링은 분홍색 정장, 분홍색 립스틱, 긴 곱슬머리 등 여성 트랜스젠더의 특징에 더 가까웠다.
 
[사진=Unsplash]
[사진=Unsplash]

인간 중심 시스템 설계를 연구 중인 박사 후보생 수로지트 고쉬(Sourojit Ghosh)는 또 다른 인기 AI 이미지 생성 툴인 스테이블 디퓨전(Stable Diffusion)이 개성을 개념화하는 방식을 언급하며, “제3의 성별은 가장 인물의 특성이 적거나 인물이라는 정의와 가장 먼 대상으로 본다”라고 설명했다. 고쉬는 개인연구를 통해 스테이블 디퓨전에 특징 묘사를 포함하지 않고 인물 사진을 그리도록 명령어를 입력하면, 서양 국가의 피부가 창백한 남성 모습을 결과물로 내놓는 때가 가장 흔하다고 언급했다. 제3의 성별을 지닌 인물은 드물고, 간혹 인간과 비슷한 생명체의 무시무시한 콜라주로 구성된 이미지를 생성하기도 한다.

생성형 AI 툴 개선 및 실제 퀴어 인물의 모습과 가까운 이미지 생성 결과물을 얻으려면 어떤 노력이 필요할까?

이미지 생성 툴의 알고리즘 추가 개발할 방법으로 전 세계 성소수자를 추가로 나타낸 데이터를 포함하여 훌륭하게 라벨이 적용된 데이터에 주력하는 방안을 고려할 수 있다. 단, 실제 성소수자가 개인 정보 처리와 관련하여 AI 스타트업을 신뢰하는 것을 망설일 수도 있다. 버클리법률기술센터(Berkeley Center for Law and Technology) 공동 소장이자 ‘젠더 파놉티콘(The Gender Panopticon)’의 공동 저자인 소니아 카트얄(Sonia Katyal)은 “이미지 생성 AI 시스템을 개선하려면, 더 나은 데이터가 필요하다”라며, “하지만 AI 개발 기업은 법률과 기업의 표적이 된 인구 집단을 대상으로 데이터 공유를 요청한다. 게다가 아직 평등한 대우라는 진정한 바람을 입증하지 못한 시스템에 데이터를 주입하는 위험성을 운영하기도 한다”라고 말했다.

AI 모델의 결과물의 다양성을 더할 다른 잠재적인 전략으로 개발자가 윤리적 보호 대책을 추가하면서 사용자 명령어를 수정하여 소프트웨어가 포괄성을 갖추도록 서서히 유도하는 방법을 언급할 수 있다. 오픈AI가 택한 방식이기도 하다. 필자가 챗GPT를 통해 Dall-E 3에 “카스트로에서 밤을 즐기는 퀴어 커플의 만화를 그려라”라는 명령어를 입력하자 챗GPT는 필자에게 별도로 질문하지 않고, 이미지 명령어를 성별, 인종, 추가 상세 배경을 포함한 전체 문단으로 확대했다. 필자의 초기 요청 사항 입력 후 챗GPT가 보완한 전체 명령어는 아래와 같다.

샌프란시스코 카스트로에서 밤을 즐기는 퀴어 커플의 일러스트레이션을 그려라. 이미지 속 커플은 양옆에서 손을 잡고, 미소를 지으며 대화를 나누며 행복한 모습으로 길을 걷는다. 한 명은 붉은색 단발머리에 멋진 데님 재킷과 청바지를 착용한 백인 여성이다. 나머지 한 명은 짧은 검은 머리에 초록색 티셔츠와 검은색 바지를 착용한 흑인 남성이다. 이미지 배경은 무지개 깃발과 분주한 카페, 생동감 넘치는 군중이 있는 카스트로의 활기가 넘치면서 다채로운 길거리이다. 즐거우면서도 타인을 반기는 분위기이며, 카스트로 일대의 다양성과 포괄성이 두드러진다.

간혹 생성형 AI가 보완한 명령어가 도움이 될 때고 있지만, 반대로 제대로 명령어가 적용되지 않아 사용자의 짜증을 유발하는 때도 있다. 일례로, 구글 CEO는 자사 생성형 AI 플랫폼인 제미니(Gemini)가 사용자 명령어를 변경하여 흑인 나치 사진을 비롯한 각종 반역사적 이미지를 생성하여 논란이 되자 공식적으로 사과한 적이 있다. 구글 내부에 비밀의 음모가 있어서 역사적 이미지에서 백인의 모습을 지운 것일까? 제미니 엔지니어팀이 제미니 개발 초기 당시 현재 다수 AI 툴과 마찬가지로 백인 남성의 모습을 생성하는 때가 지나치게 많다는 사실을 발견하고, 개발자가 챗봇 구독 서비스 출시를 서두르는 도중 수정 사항을 필요 이상으로 과도하게 적용했다는 주장이 더 타당할 것이다.

더 나은 AI 모델 데이터와 소프트웨어 윤리적 보호 대책을 갖추어도 예측할 수 없는 변화가 발생하는 인간 존재의 특성은 알고리즘의 엄격한 범주를 벗어날 수도 있다. 오랫동안 퀴어인AI 조직 위원으로 활동한 카네기멜론대학교 박사 과정 이수 후 연구원 윌리엄 애그뉴(William Agnew)는 “생성형 AI 개발자는 기본적으로 과거를 바탕으로 미래 소프트웨어를 개발한다. 무한한 성장 가능성과는 정반대이면서 퀴어 커뮤니티의 중요한 부분을 변경하는 것처럼 보인다”라고 말했다. 선입견을 강화한다면, AI가 자칫하면 대중에게 소수 집단의 모습을 지나치게 잘못된 방향으로 나타낼 위험성은 물론이고 알고리즘이 퀴어 인물이 자신의 모습을 보고 이해하는 방식도 제한할 수도 있다.

잠깐 멈추어 생성형 AI가 위험할 정도로 빠른 속도로 계속 개선된다는 사실을 인정할 만한 가치가 있다. 2023년, 배우 윌 스미스가 스파게티를 먹는 모습을 괴물처럼 조롱한 AI 영상이 인터넷에서 뜨거운 감자가 된 적이 있었다. 2024년, 오픈AI의 텍스트 기반 영상 생성 AI 툴인 소라(Sora) 모델은 여전히 완벽하지 않지만, 종종 사진처럼 매우 현실적인 모습과 함께 종종 소름 끼치는 결과물을 생성한다.

소라는 여전히 연구가 진행 중이며, 대중에게 배포되지 않았다. 하지만 필자는 소라의 퀴어 인물 묘사 방식을 더 자세히 이해하고자 했다. 이에, 필자는 오픈AI에 연락하여 소라에 “다채로운 색상의 무지갯빛으로 장식된 축제 행진용 차량에 탑승하여 샌프란시스코의 프라이드 행진을 즐기는 다양한 집단의 친구 일행”, “캔자스 농장에서 결혼식을 올리는 멋진 웨딩드레스 차림의 여성 두 명”, “트랜스젠더 남성과 제3의 성별을 지닌 배우자가 우주에서 보드게임을 즐기는 모습”이라는 세 가지 명령어로 영상을 완성하도록 요청했다. 일주일 뒤 오픈AI가 별도의 수정 사항 없이 소라로 완성했다고 주장한 영상 세 편을 받았다.

오픈AI가 보낸 영상 모두 혼란스럽지만, 멋진 영상이었다. 첫 번째 명령어로 얻은 영상은 샌프란시스코 프라이드 행진용 차량에 탑승한 무리가 물리의 법칙을 거스른 채로 무지개 깃발을 흔드는 모습을 담았다. 마치 영상 속 인물이 서서히 무의 개념으로 변경 과정을 겪으면서 아무것도 없는 공간에서 다시 등장하는 듯한 모습이었다. 두 번째 명령어 입력 후 완성된 영상은 흰색 드레스를 입은 신부 두 명이 서로 얼굴을 보고 웃으며, 두 손을 꼭 마주잡은 모습이 어딘가 이상하게 보였다. 세 번째 명령어 입력 후 얻은 영상 속에서는 인물의 신체가 유령처럼 게임판을 관통하는 모습을 볼 수 있었다.

세 편의 영상에서 본 제3의 성별인 인물의 모습을 포함할 것으로 예상한 영상 속 인물의 모습은 실제 제3의 성별이라는 특성을 제대로 묘사한 것이 맞는지 확실하지 않았다. 소라가 완성한 영상 속에서 퀴어임이 확실한 듯한 라일락 머리 색상과 피부에 새겨진 엉망인 문신과 인물의 얼굴에 파충류 비늘과 비슷한 과도한 이미지 표현이 적용된 모습을 찾을 수 있었다. 그러나 소라와 같이 훌륭한 이미지 생성 AI 툴에도 제3의 성별 인물을 묘사하는 것이 난제인 듯했다.

와이어드가 퀴어인AI 관계자와 소라로 완성한 영상을 공유하자 프라이드 행진을 즐기는 일행의 모습을 두고 소라의 다양성 정의에 의문을 제기했다. 독일 컴퓨터 과학자 사비네 베버(Sabine Weber)는 “AI 모델이 다양성의 모습을 제시하는 기본이 되는가?”라는 질문을 던졌다. 베버는 AI 시각화 작업에서 보편적으로 볼 수 있는 영상 속 인물의 과장된 매력을 지적하고, 나이가 많거나 체격이 크거나 시각 장애가 있는 퀴어 인물의 모습을 더 나타내지 않은 이유에도 의문을 제기했다.

애그뉴 연구원은 대화 말미에 알고리즘의 묘사가 성소수자의 불안감을 자극할 수 있는 이유를 설명했다. 그는 “생성형 AI 개발사가 자체적으로 다양한 특성을 결합하는 사소한 부분은 훌륭하지만, 모두 합치면 심각한 문제가 된다. 이미 끊임없이 편견에 맞서 싸우는 성소수자의 AI 인물 이미지가 갑자기 AI 개발자가 더는 책임지지 못하는 상황이 될 것을 우려한다”라고 말했다. 생성형 AI 툴이 추후 더 포괄적인 퀴어 인물 묘사를 포함할 수도 있으나 합성 기술의 묘사는 의도치 않은 여파를 강화할 수도 있다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
Here's How Generative AI Depicts Queer People
이 기사를 공유합니다
RECOMMENDED