본문 바로가기 주메뉴 바로가기 검색 바로가기
챗봇 훈련, 인간 업무 처리 위해 완료했으나 대가 얻지 못해...왜?
상태바
챗봇 훈련, 인간 업무 처리 위해 완료했으나 대가 얻지 못해...왜?
가장 우수한 직원의 데이터는 모든 사용자의 생산성을 강화할 수 있는 AI 챗봇을 생성하는 데 도움이 된다. 그러나 공정한 비용 부담을 둘러싼 새로운 우려가 제기되었다.
By CAITLIN HARRINGTON, WIRED US

2020년, 주로 필리핀에 거주하는 고객 서비스 담당 직원 5,000명이 2023년 시급성을 느끼게 된 의문 사항의 실험 대상이 되었다. 바로 오픈AI의 텍스트 생성 기술인 인공지능(AI) 어시스턴트가 직원의 생산성을 높일 가능성이라는 질문에 대한 답을 찾기 위한 실험이다.

자동화된 AI 어시스턴트는 고객 서비스 담당 직원에게 기술 지원을 원하는 영세기업 소유주의 문의에 답변하도록 했다. AI 챗봇은 고객 문의 응답 시 최고의 성과를 기록한 답변을 특별히 강조한 조건에 따라 과거 고객과의 대화 기록으로 훈련받았다. MIT와 스탠퍼드대학교 연구팀이 그 결과를 분석했을 때, AI 툴이 고객 지원팀의 생산성을 14% 향상한 것으로 나타났다.

비영리단체인 전미경제연구소(National Bureau for Economic Research)는 2023년 4월, AI 어시스턴트의 생산성 향상 분석 결과 보고서를 발행하면서 챗GPT와 같은 형태의 AI 챗봇이 실제로 업무의 대대적인 변화를 가져올 수 있다는 사실을 확인하며, AI 챗봇의 이점을 인정했다. 그러나 AI 챗봇의 생산성 향상 도움을 주제로 연구한 연구팀에게는 연구 결과가 다음과 같이 논란이 될 수 있는 새로운 의문점을 제기하게 되었다. 과거 고객 응대 기록을 AI 챗봇 훈련 데이터로 제공한 가장 우수한 성과를 거둔 직원이 얻는 보상이 있을까?

MIT 박사학 후보생인 린제이 레이몬드(Lindsey Raymond), 스탠퍼드대학교 디지털 경제 연구소 소장 에릭 브리놀프손(Erik Brynjolfsson)과 함께 연구 논문의 공동 저자로 이름을 올린 MIT 슬론경영대학원 경제학자 다니엘리 리(Danielle Li) 박사는 “문제 해결을 위해 고객 센터에 연락하여 고객 센터에서 문제를 해결한 상황을 생각해 보자”라고 말했다. AI 챗봇이 없는 세계에서는 경제학자가 지칭하는 생산성을 형성할 수 있을 것이다. 그러나 챗GPT 시대에는 귀중한 데이터도 생성한다. 리 박사는 “이제 데이터를 이용해 다른 고객의 문제를 해결할 수 있다. 따라서 같은 답변으로 더 많은 결과를 얻을 수 있다. AI 챗봇의 생산성 측정 및 그에 따른 보상 방법을 찾는 것이 매우 중요하다고 생각한다”라고 말했다.

레이몬드 박사는 업무 도중 생성한 데이터로 생산성 강화 AI 시스템 구축을 실현한 직원에게 보상할 방법을 찾는 것이 기업의 관심사가 될 것이라고 주장한다. 결국, 기업은 모델을 유지와 데이터 주입을 위해 분명한 이해가 필요하다. 레이몬드 박사는 “기업 운영 상황 중 새로운 문제가 전혀 없는 상황은 거의 없다. 따라서 뛰어난 성과를 거두는 직원이 미래에 기본 작업 관행을 계속 생성하도록 해야 할 필요가 있다”라고 말했다.

직원이 제공한 업무 데이터가 AI 시스템을 훈련하여 작업을 처리하도록 하는 과정에 도움이 되었을 때, 직원에게 보상하는 일은 챗GPT나 DALL-E와 같은 이미지 생성 프로그램 등 생성형 AI 툴과 관련하여 가장 최근 제기된 우려 사항에 해당한다. AI 시스템 훈련에 사용하는 단어나 이미지는 AI 시스템이 완성될 때 입지를 잃을 수 있는 인간이 제작한다. 일례로, 코드 작성자와 아티스트 집단은 AI 기업을 제소하며, 당사자 허가 없이 저작권이 있는 작업물을 AI 시스템에 사용하였다고 주장했다. 레딧(Reddit)과 프로그래밍 웹사이트 스택오버플로는 AI 기업에 자사 플랫폼의 모든 대화 접근 비용을 청구할 것이라고 발표했다. 그런데 AI 시스템 훈련 목적으로 데이터의 가치를 이용하는 기업이 근무 중인 직장이라면 어떨까? 그리고 직장에서 우수한 업무 성과를 거둘수록 데이터의 가치가 높아진다면 어떨까?

MIT와 스탠퍼드대학교 합동 연구팀의 연구는 생성형 AI 툴을 사용하는 기업 내부에서 직원의 데이터 사용 보상과 같은 문제로 기업과 직원, 심지어 직원 간 갈등이 고조될 수 있음을 시사한다. 연구팀이 연구 당시 살펴본 고객 서비스 담당 직원은 포춘 500대 기업에 포함된 소프트웨어 기업에서 근무했다. 연구팀은 해당 기업의 이름 공개를 허락받지 않았다. 해당 기업 직원은 스트레스를 유발할 수 있으며, 종종 성가신 고객을 상대하면서 고객 지원팀의 높은 퇴사율로 이어질 수 있는 급여와 세금 등과 관련된 문제를 해결하고자 하는 미국 중소기업에 대화 기반 고객 지원 서비스를 제공했다.
 
[사진=Freepik]
[사진=Freepik]

결과적으로 해당 기업은 퇴사자의 자리를 채우려 충원한 신입 직원 훈련에 오랜 시간을 할애해야 했다. 연구팀은 고객 지원 담당 직원에게 필요한 역량 대부분이 이른바 ‘간접적 지식’이다. 손쉽게 규정할 수 없지만, 대규모 언어 모델이 대화 기록을 흡수하고는 흉내 내도록 하는 경험으로 쌓은 노하우를 칭한다. 연구팀이 조사한 기업의 챗봇은 기술적 역량과 사회적 역량을 모두 도우며, AI 어시스턴트가 고객의 문의 사항과 관련된 기술 문서를 지목하고는 “문제를 즉시 해결하도록 도움을 주어 기쁘다!”와 같이 짜증이 난 고객을 달랠 희망적인 문구를 입력하기도 한다.

AI 챗봇이 고객 지원 업무에 도움을 주기 시작한 뒤 고객 지원팀이 해결한 문제가 14% 증가했다. 게다가 AI 챗봇 사용 후 일정한 달의 고객 지원팀 직원의 퇴사율이 9% 감소했으며, 고객의 태도도 개선되었다. 또, 해당 기업은 관리자와의 대화 요청 시 고객이 거부할 확률이 25% 감소한 사실도 확인했다.

그러나 연구팀이 역량 단위로 결과를 나누어 보았을 때 챗봇의 장점 대부분 생산성이 35% 상승한 숙련도가 가장 낮은 직원이 누리는 것으로 확인됐다. 반면, 숙련도가 가장 높은 직원은 AI 챗봇의 장점으로 얻는 이익이 없었다. 심지어 AI 챗봇 도입 후 고객 만족도가 약간 감소한 것으로 나타났다. AI 챗봇이 업무 집중도를 분산하는 요소가 되었음을 시사한다.

반면, 숙련된 직원의 가치는 두 배 증가했다. AI 어시스턴트가 숙련도가 낮은 직원과 같은 고객 응답 기법 사용을 기피했기 때문이다.

직원이 개인 협상 가치로 보상을 받을 가능성에도 의문을 제기할 만한 근거가 있다. 시러큐스대학교 역사학자이자 『자동화와 미래 일자리(Automation and the Future of Work)』 저자인 애론 베나나프(Aaron Benanav) 교수는 19세기 말, 기계 엔지니어 프레데릭 테일러(Frederick Taylor)가 개발하고, 추후 헨리 포드(Henry Ford)의 자동차 공장이 채택한 생산성 시스템인 테일러리즘(Taylorism)의 역사적 맥락과 AI 챗봇이 생산성에 미치는 영향이 평행하다고 본다.

테일러는 스톱워치를 사용하여 신체적 과정을 부품 구성요소로 나누어 가장 효율적인 작업 완료 방식을 판단했다. 테일러는 업계에서 가장 숙달된 직원에 특별히 주목했다. 베나나프 교수는 그 이유가 “숙련도가 낮은 직원이 숙련도가 높은 직원과 같은 방식으로 근무하도록 하기 위한 목적”이라고 설명했다. 이제는 스톱워치를 들고 생산성을 측정하는 꼼꼼한 엔지니어 대신 머신러닝 툴이 근로자의 가장 훌륭한 업무 관행을 수집하고는 공개한다.

테일러의 시대에는 테일러리즘이 일부 직원에게는 매우 훌륭한 성과를 거두지 못했다. 테일러의 생산성 측정 방식은 숙련도가 높은 직원의 소득을 연결 짓는 것을 거부한다. 기업이 같은 작업을 하는 숙련도가 낮은 직원에게도 급여를 지급할 수도 있기 때문이다. 업무 성과가 뛰어난 일부 직원이 필요한 인력으로 남더라도 기업이 필요로 하는 인재는 더 적으며, 업무 성과가 뛰어난 직원 간 경쟁이 더 치열해진다.

베나나프 교수는 “일부 측면에서 테일러리즘은 1930년대에 숙련도가 낮거나 중간 수준인 직원 사이에서 노동조합 형성을 촉발하는 데 큰 역할을 했다. 그러나 처벌 정도가 비교적 적은 제도가 등장했다. 테일러의 지지자 중 한 명인 기계 엔지니어 헨리 간트(Henry Gantt)는 모든 직원의 최저 임금을 보장하면서 추가 목표를 달성하는 일부 직원에게는 보너스를 지급하는 제도를 마련했다.

기업이 AI 시스템 훈련을 위해 높은 성과를 거두는 직원에게 혜택을 부여하거나 직원이 스스로 AI 시스템의 혜택을 누리도록 하더라도 더 심각한 상황을 분리하기는 까다로울 수도 있다. 예를 들어, 데이터는 일부 기업에서 공유하고, 모델 구축을 담당하는 AI 기업에 전송된 후 각각의 기업에 판매하게 될 수도 있다.

버지니아 공과대학 전기 공학 박사 지아 루오시(Ruoxi Jia)가 언급한 바와 같이 AI 시스템 시범 도입을 원하는 기업은 노벨 경제학상을 수상한 로이드 섀플리(Lloyd Shapley)의 이름에서 유래된 섀플리 값(Shapley value)이라는 게임 이론의 개념을 채택하려 할 수도 있다. 지아 박사는 섀플리 값을 주제로 작성한 논문의 공동 저자 중 한 명이다. 섀플리 값은 여러 직원이 각각 다른 수준의 단체 목표 달성에 기여했을 때 공정한 수익 분배를 할 때 사용할 수 있다. 또한, 환자가 각각 다른 값으 의학 데이터를 연구원에게 공유한 뒤 보상을 지급할 때도 이용할 수 있다.

그러나 섀플리 값 계산에 동원하는 컴퓨터 장비 비용이 비싸다. 따라서 섀플리 값은 챗GPT와 같은 봇의 근간이 되는 복잡한 머신러닝 시스템인 대규모 언어 모델에 적용된 적이 없다. 또한, 머신러닝 맥락 적용 시 임의성의 정도를 포함할 수도 있다.

MIT와 스탠퍼드대학교 연구팀의 연구에서 시범 도입한 것과 같은 챗봇이 보편적이라면, 일부 직원은 자체 역량을 이용하여 새로운 보상 접근 방식을 추진할 수도 있다. 베나나프 교수는 집단 협상법에 비교적 우호적인 독일, 스웨덴과 같은 국가를 언급했다. 독일과 스웨덴은 미국 기업보다 직원에게 투자하는 비용이 더 많다. 설문 조사 결과는 로봇에 일자리에 빼앗길 가능성에 대한 스웨덴 시민의 우려는 비교적 낮은 편임을 시사한다. 그 부분적인 원인은 기업이 새로운 기술을 도입하면, 종종 직원의 역량 향상 대가를 지급하기 때문이다. 베나나프 교수는 “직원의 역량을 향상한다면, 더 많은 임금을 받는다. 오래 존재하고 지속 가능성이 더 우수한 접근 방식이다”라고 말했다.

MIT와 스탠퍼드대학교 연구팀이 연구한 챗봇은 고객 지원 담당 인력과 고객 간 소통을 개선하면서 일부 직원의 직장 내 무례함이라는 문제가 줄어든다는 사실에도 주목했다. 그러나 일각에서는 같은 기술이 알고리즘적 운영을 형성하면서 자동화 시스템을 이용한 감시와 직원 통제 관행을 생각할 수 있다. 급여와 직업 만족도가 제한된 콜센터 직원은 이미 AI 기술 적용의 실험 대상이 되었다. 

연구팀은 AI 툴이 미치는 영향을 계속 연구하고자 한다. 직원이 챗봇을 통해 새로운 작업 처리 방식을 배웠는지 혹은 AI 챗봇에 의존하게 되었는지 살펴보는 데 관심이 있다. 리 박사는 “마치 구글 맵을 이용하여 운전할 수 있는지 묻는 것과 같다”라고 말했다. 만약, “구글 맵을 이용해 운전할 수 없다”라는 답변을 얻는다면, AI 챗봇의 등장이 무조건 암울하다고만 할 수는 없을 것이다. 리 박사는 경제학자로서 진행한 자체 연구에서 통계 분석 소프트웨어가 일부 매뉴얼 계산 역량을 대체한 사실에 주목했다. 이에, 리 박사는 “기계가 일부 업무 영역을 대체한 것이 무조건 나쁘다고만 말할 수 없다. 근로자도 AI 기술에 접근할 수 있기 때문이다. 그리고 새로운 역량을 쌓는 것을 생각할 수도 있다”라고 설명했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
You Trained the Chatbot to Do Your Job. Why Didn’t You Get Paid?
이 기사를 공유합니다
RECOMMENDED