본문 바로가기 주메뉴 바로가기 검색 바로가기
“나 로봇 아니라고!”...캡차가 나를 믿지 못하는 이유는?
상태바
“나 로봇 아니라고!”...캡차가 나를 믿지 못하는 이유는?
횡단보도 사진을 클릭해야 하는 것이 짜증나는가? 다른 사람도 똑같다. 다행히도 짜증을 줄이는 방식으로 캡차의 문제를 해결할 몇 가지 꿀팁이 있다.
By SHARON WATERS, WIRED US

2020년 겨울, 많은 사람과 마찬가지로 노린 맥매흔(Norine McMahon)은 코로나19 백신 접종 예약 정보를 검색하며 계속 새로 고침 버튼을 눌렀다. 워싱턴DC에 거주하는 맥매흔은 2021년 말에 백신 접종 장소가 개방된다는 사실에 기뻐했으나 기쁨은 곧 실망으로 바뀌었다. 철자와 연락처 등 입력 정보를 올바르게 입력했는데도 캡차(captcha)의 사용자 검증 테스트를 거쳐야 했기 때문이다.

어느 한 편의 시설의 61세 총괄인 맥매흔은 “캡차 때문에 내가 입력한 정보가 모두 맞는지 서서히 의심했다. 캡차의 압력 때문이다. 약 12회에나 캡차의 사용자 검증 테스트 창이 떴다. 캡차는 사용자 정보를 제대로 검증하지 못했다”라고 말했다. 맥매흔은 결국 캡차 사용자 검증 요구가 뜬 당일에 예약을 포기했으나 다른 날에 성공적으로 백신 접종 예약을 했다.

워싱턴DC 보건 당국 포털 사이트의 캡차 대란은 당시 대대적으로 보고된 몇 가지 기술적 문제 중 하나였다. 그러나 캡차는 코로나19가 발병하기 훨씬 전부터 많은 사용자에게 분노를 일으키고는 했다.

캡차는 완전히 자동화된 공공 튜링 테스트에 의존해, 컴퓨터와 인간에게 별도로 내용을 이야기하는 것을 나타낸다. 튜링 테스트는 1950년, 인공지능(AI)의 창시자로 알려진 영국 수학자 앨런 튜링(Alan Turing)이 인간과 비슷한 지능적 행동을 할 수 있는 컴퓨터의 능력 보유 여부 판단에 도움이 되도록 제작한 것이다. 튜링은 이를 ‘이미테이션 게임(imitation game)’이라고 칭했다. 과테말라 기업가 루이스 폰 안(Luis von Ahn)이 카네기멜론대학교 대학원생이었을 당시 현대화된 캡차 개발에 도움을 주었다. 그는 현재 카네기멜론대학교 교수로 근무 중이며, 이후 구글이 인수한 리캡차(reCaptcha)를 개발했다.

캡차의 목표는 인간은 풀 수 있지만, 봇은 풀지 못하는 테스트나 퍼즐을 생성하는 것이다. 따라서 그저 인간인 우리는 오전 10시 1초, 스프링틴(Springteen) 콘서트 좌석 판매가 시작될 때, 양호한 좌석을 구할 수 있는 것이다.

그러나 기계가 갈수록 첨단화되고 있어, 봇이 아닌 인간임을 인증하기 위한 검증 절차의 균형을 맞추기 까다로울 수도 있다.

이탈리아 파두아대학교의 마우로 미글리아디(Mauro Migliardi) 부교수는 “일반적으로 AI 시스템은 인간보다 더 나은 작업을 다룰 능력을 지니고 있다. 그 한 가지 이유로 AI는 인간과 달리 분노를 느끼지 않기 때문이라고 언급할 수 있다. AI는 무한한 인내심을 지니고 있으며, 시간 낭비를 걱정할 일이 없다”라고 설명했다. 미글리아디 부교수는 최근, 20년간 개발된 캡차 버전과 그 효과를 요약하는 논문을 공동 저술했다.

구글은 캡차 시장에서 보유한 지분을 밝히지 않을 것이다. 그러나 리캡차라는 이름이 여러 사이트에서 자주 등장해, 미국에서 지배적인 장악력을 지닌 것으로 나타났다. 구글은 질문을 작성한 글 형태로 제출하고는 직접 답을 입력할 것을 요구했다. 직접적인 인용 구문을 사용할 수 없기 때문이다.

구글은 리캡차 도움 페이지를 두고 있지만, 자주 문의하는 내용에 대한 답변은 실망스럽다. 일례로, ‘이 캡차의 검증이 너무 어렵다’라는 질문에 구글은 "걱정 마라. 몇 가지 캡차는 검증이 어렵다. 이미지 옆의 재로드 버튼을 클릭해, 다른 이미지로 검증을 하면 된다"라는 답변을 한다. 또, 해당 페이지에는 구글이 AI 훈련에 캡차를 사용한다는 사실에 주목하며, 캡차를 풀기 위한 인간의 노력이 구글의 텍스트와 주석 이미지 등을 자동화하는 제품 품질 향상으로 이어진다고 밝혔다.

구글의 지원 페이지는 특히, 사진 그리드와 관련된 사항 등 그 외 많은 사용자가 자주 하는 질문에 답변하지 않았다. 만약, 매우 작은 정사각형 안에 버스 사진이 있다면, 이를 클릭해야 하는가? 구글은 버스나 신호등 사진이 포함된 주요 정사각형을 선택하라는 조언을 했다.

그리고, 흐린 사진이 있다. 모두 사용자가 사진에 더 가까이 이동해, 인식이 어려운 먼 거리에 굴뚝 사진이 있는지 찾아내도록 한다. 리캡차 사진이 종종 흐린 이미지로 등장하는 이유와 관련된 질문에 구글은 매일 사용자가 풀어야 할 캡차의 수를 줄이고자 열심히 노력한다고 밝혔다. 그와 동시에 ‘로봇이 아닙니다’라는 체크 박스 표시가 등장할 때, 캡차가 단계적으로 발전해, 인간에게 문제가 되는 테스트를 보여주지 않는다.
 
[사진=Freepik]
[사진=Freepik]

이탈리아 제노바대학교 연구원인 메리엠 게라르(Meriem Guerar) 박사는 좋지 않은 화질을 지닌 이미지 문제를 더 간단하게 설명했다. 미글리아디 부교수와 함께 캡차 논문을 공동 저술한 게라르 박사는 “종종 화질이 좋지 않으면서 흐린 이미지가 등장하는 문제는 최신 기술을 사용하는 봇이 이미지 인식을 어렵게 하기 위한 목적 때문이다. 화질이 좋지 않고 분산된 이미지는 흐릿하게 보인다. 이를 인식 반대 메커니즘이라고 칭한다”라고 설명했다.

간혹 캡차가 완전히 틀릴 때도 있다. 라디오쇼 사이언스 프라이데이(Science Friday)의 진행자인 찰스 버그퀴스트(Charles Bergquist)는 주차 미터기 이미지 선택을 요청하는 캡차를 보았을 때, 기쁨과 분노가 뒤섞인 감정을 느꼈다. 미터기 이미지 하나만 선택하자 로봇이 아니라는 사실 검증을 거부당했으며, 미터기와 두 개의 메일함이 포함된 사진만 선택했을 때 검증을 통과했기 때문이다. 버그퀴스트는 “잘못된 사진을 선택하지 않았는데도 캡차 검증을 통과하지 못해, 페이지 접속을 할 수 없었을 때 짜증이 났다”라고 말했다.

위의 사례와 같은 캡차의 실수는 잘못된 캡차의 희극과도 같은 사례를 찾은 SNS나 온라인 커뮤니티 레딧의 /r/captcha 그룹(/r/captcha Reddit group)에서 자주 논의되는 문제이다. 회원 수 약 2만 명을 보유한 레딧의 또 다른 그룹인 /r/CaptchaArt는 캡차를 만화나 다른 예술 작품에 포함시킨다.

캡차가 조만간 사라질 기미가 보이지 않기 때문에 캡차를 해결하는 과정에서 발생하는 짜증 수준을 줄일 몇 가지 팁을 아래와 같이 설명한다.

캡차는 보호 기능을 제공한다는 사실을 기억하라
형편없는 퍼즐이 등장해, 캡차를 풀지 못한다면 그리 편하지 않을 것이다. 그러나 캡차는 사용자가 방문하는 웹사이트, 그리고 궁극적으로는 사용자를 보호할 목적으로 설계된 것이다.

영국 햄프셔 스타트업 블리스 디지털(Bliss Digital)의 기술 총괄인 매트 블리스(Matt Bliss)는 “앨런 튜링의 캡차 개념은 그 자체적으로 천재적이다. 그러나 로봇의 능력이 갈수록 고도로 발전해, 캡차 시스템도 갈수록 복잡해지는 추세이다. 따라서 결과적으로 사용자 경험에 간혹 매우 큰 지장을 줄 수 있다”라고 설명했다. 4가지 캡차를 연속으로 푼 뒤, 짜증을 느낀 블리스 총괄은 캡차의 문제를 ‘횡단보도와 소화전을 따로 선택하도록 하는 복잡하면서 기이한 참을성 테스트’라는 표현으로 다시 지칭했다.

건축가 겸 개발자인 블리스는 캡차에 숨겨진 목적을 이해하며, 캡차를 사용하는 무료 툴은 웹 디자이너와 개발자가 쉽게 구축할 수 있다는 사실에 주목한다. 블리스 총괄은 “안타깝게도 사용자 경험에 더 적은 지장을 주면서 사용자 친화성이 더 뛰어난 방식이 더 적합하지만 불가피하게 더 많은 디자인과 적용에 큰 비용이 든다는 점에서 결과적으로 캡차를 저렴한 해결책으로 구현할 수 있다”라고 설명했다.

캡차는 날이 갈수록 계속 개선된다는 사실을 이해하라
아닌 것처럼 보이지만, 캡차 설계자는 사용자의 불편을 줄이고자 한다. 구글은 고객과 함께 계속 협력해, 사용자의 목표 달성 방해와 이를 중단하는 봇 간의 최상의 균형을 유지할 방안을 찾는다. 구글의 리캡차 제품은 봇이 짧은 시간에 빠르게 분석하기 어려운 단어로 시작한 뒤, 박스와 횡단보도 사진을 클릭해 단순히 봇뿐만 아니라 봇의 사기 행위도 막는다. 리캡차의 3번째 버전은 사용자 상호작용이 없고, 그 대신 행동 분석에 의존한다. 따라서 구글은 리캡차가 사용자 경험에 방해가 되지 않는다고 주장한다.

4번째 버전은 리캡차 엔터프라이즈(reCaptcha Enterprise)이다. 구글은 기업 전용으로 구축된 독특한 능력과 함께 추가 세분화 점수와 고위험 점수의 위험 코드, 위험 분석을 사이트의 특정한 요구에 맞추어 조정 능력을 갖춘 엔진 등을 제공한다고 설명한다.

게라르 박사의 주장대로 최근, AI가 발전하면서 자동화 프로그램의 인식 작업 능력이 인간보다 나아졌다. 게라르 박사 연구팀은 어려운 인지 문제 대신 신체적 작업을 수행할 인간의 능력을 기반으로 캪차(cappcha)라는 대체 툴을 생성했다. 캪차의 기반이 된 행동에는 스마트폰 기울이기, 노트북에 키보드를 입력하면서 미세한 움직임 선보이기 등이 포함됐다. 게라르 박사는 “캪차의 이면에 있는 논리적 기반은 여러 코드로 형성된 봇이 신체적 작업을 수행할 수 없다는 사실이다. 인간만 할 수 있는 행동이 있다”라고 말했다.

브라우저를 업데이트하라
게레라 박사와 미글리아디 교수의 설명에 따르면, 오래된 브라우저를 사용한다면, 검증이 어려울 수도 있다. 이어, 최신 브라우저 업데이트는 인간임을 입증할 수 있는 또 다른 요소라고 언급한다. 미글리아디 교수는 “봇은 소프트웨어 업데이트에 신중한 모습을 보이지 않을 것이다”라고 말했다.

구글의 리캡차 도움 페이지는 브라우저에 자바스크립트를 사용할 수 있도록 하고, 리캡차에 반대될 수 있는 플러그인을 비활성화할 것을 권고한다.

인간임을 증명할 수 있는 행동을 하라
방문하고자 하는 웹사이트가 구글의 리캡차를 사용한다면, 지메일 계정에 접속한 뒤 콘서트 티켓을 예약하고, 코로나19 백신 접종 예약을 하면 된다.

또, 게레라 박사와 미글리아디 교수는 검색 시작 전, 쿠키 검색 허용을 할 것을 권고한다. 미글리아디 교수는 “쿠키가 사용자를 추적하도록 두어라”라고 말한다. 아무도 모르게 뒤에서 이루어지는 이른바 프라이버시 침해 문제를 일으키는 캡차의 작업에서 사용자를 검증할 한 가지 방식은 브라우저 검색 이력 분석이다.

게레라 박사와 미글리아디 교수는 프라이버시 우려에 주목하며, 사용자가 검색 이력 및 쿠키 제거 목적으로 툴을 사용한다고 주장했다. 그러나 웹사이트에 빨리 접근하는 것을 우선순위로 둔다면, 미글리아디 교수는 쿠키를 허용하는 짧은 웹 서핑을 해, 사람임을 인증하는 것을 추천한다.

미글리아디 교수는 “몇 가지 웹사이트에만 접속하고, 원하는 쿠키를 모두 제공하기만 하면 된다. 그렇다면, 아마도 사용자가 인간임을 증명할 수 있을 것이다. 백신 접종 예약 후 쿠키를 제거하라. 기온이 높은 엔진으로 배출 테스트를 하는 것과 같다고 볼 수 있다”라고 설명했다.

더 주목할 가치가 있는 캡차를 적극적으로 받아들이기
간혹 검증 과정을 참을 만하면서도 흥미로운 방식으로 검증 요청을 하는 캡차가 존재한다.

필자는 2021년 3월, 전미농구대회(NCAA) 토너먼트 경기 티켓 검색을 하면서 티켓마스터(Ticketmaster)가 자전거와 티셔츠, 망치 등 임의의 사물을 겹친 채로 만화와 같은 이미지를 보여주는 새로운 유형의 캡차를 사용한다는 사실을 확인했다. 모두 특정 명령에 따라 클릭하기만 하면 된다. 필자는 힌클 필드하우스(Hinkle Fieldhouse)에서 열리는 경기 티켓 사수에 고도로 집중했으나 새로운 형태의 캡차가 등장한 사실과 이미지가 흐릿하게 보이지 않았다는 점에 감사했다. 2014년에 마지막으로 공식 블로그에 캡차 관련 내용을 설명한 티켓마스터는 최신 캡차 관련 정보를 얻고자 여러 가지 사항을 요구하지 않으며, 티켓마스터가 적용한 캡차는 구글은 자체 개발한 리캡차 유형과는 다르다고 설명했다.

버그퀴스트는 캡차가 인구 조사 기록이나 화물 목록 등 오래된 문서의 모습을 담은 사진에 적힌 손글씨 한 문장을 입력하도록 요청해도 개의치 않는다. 버그퀴스트는 캡차의 오래된 문서 이미지를 두고 ‘멋지면서 예스러운 글씨 작성’이라고 말한다.

또, 그는 웃으면서 “오래된 문서의 손글씨 입력을 요구하는 것과 같은 캡차가 멋지다고 생각했다. 불편한 현실에 대한 집중력을 분산하는 수단이라고 할 수 있다. 또, 개인적으로 이미지에 등장한 옛날 사진 속 인물이나 물건의 정체를 생각하고는 한다. 그리고, 누군가에게 더 쉽게 접근할 수 있는 무언가를 만들어주고 있다고 느낀다. 예를 들어, 누군가는 캡차에 등장한 이미지의 인구조사나 고대 선박 화물 등과 같은 정보를 언젠가 실제로 사용할 수도 있을 것이다”라고 말했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
I’m Not a Robot! So Why Won’t Captchas Believe Me?
이 기사를 공유합니다
RECOMMENDED