본문 바로가기 주메뉴 바로가기 검색 바로가기
AI, 부유한 국가 환자에게만 일부 질환 진단 도움준다?
상태바
AI, 부유한 국가 환자에게만 일부 질환 진단 도움준다?
안구 질환 진단 알고리즘이 주로 미국과 유럽, 중국 출신 환자의 데이터로 훈련받았다. 따라서 그 외 다른 인종 집단이나 다른 국가의 환자에게는 효과가 없을 수도 있다.
By WILL KNIGHT, WIRED US

인공지능(AI)은 의학 이미지와 스캔에서 전문가 수준의 질병 진단을 약속한다. 그러나 안구 질환 진단용 알고리즘 훈련에 사용된 데이터를 면밀히 살펴보면, AI가 의료 불평등을 지속해서 발생시킬 수 있다는 사실이 나타난다.

영국의 어느 한 연구팀은 주로 안구 질환 진단용 AI 알고리즘 훈련에 사용되는 총 50만여 개의 이미지가 포함된 94개의 데이터 세트를 분석했다. 연구팀은 거의 모든 데이터가 북미와 유럽, 중국 환자의 데이터임을 확인했다. 남아시아의 데이터 세트는 4개, 남미는 2개, 아프리카는 1개뿐이었다. 오세아니아의 데이터 세트는 없었다.

이번 연구에 참여한 버밍엄대학교 연구원 겸 안과의사 샤오수안 리우(Xiaoxuan Liu) 박사는 안구 이미지 출처의 불균형이 의미하는 바는 AI 안구 진단 알고리즘이 부유하지 않은 국가의 인종 집단의 진단 결과가 비교적 정확하지 않을 수 있음을 의미한다고 설명했다. 리우 박사는 “특정 인구 집단에서 안구 질환의 변화가 눈에 띄지 않을 정도로 매우 미묘하더라도 AI는 매우 심각할 정도로 제대로 진단하지 못할 수 있다”라고 말했다.

미국 안과의사 협회(American Association of Ophthalmologists)는 AI 툴을 적극적으로 적용하려는 열의를 보여왔다. 협회는 AI 툴이 진료의 표준을 개선하는 데 도움이 된다고 주장했다. 그러나 리우 박사는 의사가 AI 툴이 주로 백인 환자를 위해 구축됐다는 사실을 알게 되면, 소수 민족 출신 환자에게 AI 툴을 사용하는 것을 꺼릴 수 있다고 말한다. 또, 그는 알고리즘이 의사가 발견하기에는 매우 미세한 차이 때문에 실패할 수 있다고 말한다.

연구팀은 데이터에서 다른 여러 가지 문제를 발견했다. 많은 데이터 세트가 연령, 성별, 인종 등 핵심적인 인구 데이터를 보유하지 않아, 다른 방식으로 편견을 지니고 있는지 판단하기 어렵다. 또한, 그동안 데이터 세트는 녹내장과 당뇨망막병증, 노인황반변성 등 소수 질병 진단을 위해 생성되었다. 알고리즘 훈련에 사용된 데이터 세트 46개는 데이터를 사용할 수 없도록 만들었다.
 
“특정 인구 집단의 특정 부분에만 이익을 주는 혁신을 하는 것이다.”
샤오수안 리우, 버밍엄대학교 연구원 겸 안과의사

미국 식약청(FDA)은 지난 몇 년간 안과 진단용 AI 툴 2가지를 비롯한 일부 AI 이미지 제품을 승인했다. 리우 박사는 알고리즘 제작을 담당한 기업이 일반적으로 알고리즘 훈련 과정을 상세히 밝히지 않는다고 지적한다. 리우 박사와 연구 논문의 다른 공동 저자 모두 규제 당국에 AI 툴 검증 시, 데이터 훈련의 다양성을 고려할 것을 촉구한다.

안구 이미지 데이터 세트에서 발견된 편견은 해당 데이터로 훈련을 받은 알고리즘이 아프리카나 남미, 남아시아에서는 진단 정확도가 더 낮을 수 있다는 사실을 의미한다. 이는 AI 진단의 가장 큰 이점으로 추정되는 사항을 저해할 수 있다. 바로 의료 인력이 부족한 빈곤 지역에 자동화된 의료 전문 기술을 보급할 수 있는 잠재적인 가능성이다.

리우 박사는 “특정 인구 집단의 특정 부분에만 이익을 주는 혁신을 하는 것이다. 특정 우편 주소 경로를 찾지 못하는 구글 지도를 갖는 것과 같은 일이다”라고 지적했다.

연구진이 ‘데이터 빈곤’이라고 일컬은 것과 같이 다양한 인종의 안구 이미지를 확보하지 못한 것은 여러 의학용 AI 알고리즘에 영향을 미칠 가능성이 크다.
 
[사진=Freepik]
[사진=Freepik]

스탠퍼드대학교 의과대학 부교수 아밋 코샬(Amit Kaushal)은 미국 환자의 데이터를 이용한 AI의 의학적 용도 사용 연구 74건을 분석한 연구에 참여했다. 코샬 교수 연구팀은 미국 데이터 대부분이 캘리포니아주(22개), 뉴욕(15개), 매사추세츠(14개) 지역에서 수집됐다는 사실을 확인했다.

코샬 교수는 “인구의 하위집단이 조직적으로 AI 훈련 데이터에서 배제됐다면, AI 알고리즘은 배제된 집단을 대상으로 진단 정확도가 낮은 모습을 계속 보이게 될 것이다. 부유하지 않은 이들이 직면한 각종 문제는 AI 연구원의 연구도 이루어지지 않을 것이다. 사용할 수 있는 데이터가 없기 때문이다”라고 설명했다.

코샬 교수는 해결책으로 AI 연구원과 의사가 AI 알고리즘의 문제점을 인지하도록 해, 더 다양한 데이터 세트를 찾도록 하는 방안을 언급했다. 그는 “AI 연구를 위해 다양한 데이터에 접근하도록 하는 기술적 인프라를 구축해야 한다. 또한, 다양한 데이터를 사용하는 연구 지원 및 보호를 위한 규제 환경 조성도 필요하다”라고 주장했다.

방사선학에서의 AI 활용 연구를 하는 플로리다주 메이오클리닉 소속 과학자 비카쉬 굽타(Vikash Gupta) 박사는 단순히 다양한 데이터를 추가하기만 한다면 편견이 사라질 것이라고 말한다. 그는 “현재, AI 알고리즘의 편견 문제를 해결하는 방법을 설명하기 어렵다”라고 전했다.

그러나 굽타 박사는 어느 순간이면 알고리즘이 인구의 부분 집합에 중점을 둔 알고리즘이 유용해질 것이라고 설명했다. 특정 집단에 지나치게 심각한 영향을 주는 질병을 진단할 때 AI 알고리즘을 사용하는 것을 한 가지 예시로 언급할 수 있다.

리우 박사는 의학용 AI 알고리즘을 더 넓은 영역에서 사용할 수 있어, 의학용 AI 훈련 데이터의 다양성이 확대되기를 바란다. 그는 “10년 후, 우리가 AI로 질병 진단을 할 때, 유색인종 환자를 진찰하는 상황에서 ‘죄송합니다. AI가 인종에 따라 제대로 진단 결과를 내놓지 못해서 다른 방식으로 진찰하겠습니다’라고 말하는 일이 없었으면 한다”라고 말했다.

관련 기사: AI, 의사가 기술을 이해할 때만 환자에게 도움된다?

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
AI Can Help Diagnose Some Illnesses—If Your Country Is Rich
이 기사를 공유합니다
RECOMMENDED