본문 바로가기 주메뉴 바로가기 검색 바로가기
청각장애인과 난청 사용자를 위한 일상 속 자막 지원 앱 등장
상태바
청각장애인과 난청 사용자를 위한 일상 속 자막 지원 앱 등장
XRAI 글래스는 379달러짜리 AR 글래스와 함께 연결하여 사용할 때, 대화가 이루어지는 즉시 실시간 자막을 제공한다. 다만, 몇 가지 중대한 경고사항이 있다.
By SIMON HILL, WIRED US

청각 장애나 난청이 있다면, 대화 내용을 바로 따라가는 일이 어려울 수도 있다. 만약, 안경에 대화 도중 실시간으로 자막을 띄울 수 있다면 어떨까? 바로 새로 배포된 앱인 XRAI 글래스(XRAI Glass)가 사용자에게 약속하는 기능이다. XRAI 글래스 개발사와는 관련이 없는 기업이 별도로 판매하는 AR 글래스인 엔리얼 에어(Nreal Air)와 호환하여 대화 내용을 자막으로 제공한다.

XRAI 최고 마케팅 책임자 미셸 펠드만(Mitchell Feldman)은 ‘엑스레이’라고 읽는 XRAI라는 이름이 혼합현실(MR)을 망라하는 기술인 확장현실(XR)과 인공지능(AI)을 지칭한다고 설명했다. 필자는 XRAI 글래스 시연을 위해 펠드만을 만났다. XRAI 글래스를 사용하려면, AR 글래스를 스마트폰에 연결해야 한다. 즉, 스마트폰에 XRAI 앱을 설치해야 한다는 의미이다. (현재 앱은 안드로이드 버전만 지원한다.)

필자가 AR 글래스를 착용했을 때, 시야 중앙 부분에 글자가 떠다니는 것을 볼 수 있었다. 펠드만이 이야기를 이어가는 내내 펠드만이 말하는 내용을 꽤 정확하게 자막으로 읽을 수 있다는 사실을 확인했다. 처음에는 영화 스타워즈 도입 부분의 화면이 서서히 흐려지기 전 텍스트를 스크롤하듯 글자가 잘린 것처럼 보였다. 그러나 글래스 설정을 약간 변경한 뒤 대화 도중 자막을 선명하게 볼 수 있었다. 필자는 XRAI 글래스를 실행하면서 자막을 볼 수 있는 상태로 한동안 대화를 이어갔다. 상대방이 말을 한 뒤 자막이 등장할 때까지 약간의 시간 지연이 있다. 필자가 말하기 시작한 뒤에는 대화 당사자마다 다른 문장을 말하기 때문에 자막이 등장할 때까지 시간이 더 오래 지연됐다. 바로 클라우드에서 발생하는 화자 분할 현상이다.

XRAI는 단순히 실시간 대화 자막만 제공하지 않는다. 각각의 대화에서 검색할 수 있는 자막을 저장한다. 펠드만은 필자에게 말이 되지 않는 내용을 이야기하면서 XRAI에 “미셸에 대해 말하라”라고 지시하면서 자신의 대화를 재생하도록 명령했다. 대화의 자막 모두 스마트폰으로 볼 수 있다. 대화는 클라우드에서 암호화와 등록 과정을 처리하며, 그 직후 삭제한다. XRAI 직원도 대화 자막을 볼 수 없다. 사용자는 대화 자막을 다시 불러올 수 있다. XRAI 최고 경영 관리자 댄 스카프(Dan Scarfe)는 “XRAI 직원은 원할 때도 사용자의 대화 자막에 접근할 수 없다. XRAI는 의도적으로 데이터 흐름을 직접 설계했다”라고 말했다.
 
[사진=XRAI Glass Twitter]
[사진=XRAI Glass Twitter]

다시 말하기
XRAI 글래스는 개인 사용 사례와 사용자의 개인적인 의학 기록에 상당 부분 의존하지만, 인공와우나 청력 보조 기구를 사용해도 대화를 판독하기 위해 집중해야 한다. 일부 음성과 단어는 구분이 매우 어려울 정도로 비슷하다. 입 모양에 의존해 상대방이 말하는 내용을 파악하는 이가 모든 단어를 명확하게 구분하는 것은 불가능한 일이다. 미국 질병통제예방본부(CDC)의 연구 결과로 알려진 바와 같이 이상적인 대화 상황을 기준으로 영어 발음 중 단 40%만 말하는 이의 입 모양으로 구분할 수 있다.

개인의 시야 범위에서 대화 자막을 볼 수 있다는 전망은 흥미롭다. 청력을 상실한 탓에 사회적으로 고립된 이들이 대화를 더 많이 이해하도록 여러 측면에서 도울 수 있다. XRAI 앱은 TV 시청 도중에도 자막을 제공하므로 항상 자막이 제대로 제공되지 않는 라이브 콘텐츠를 간단하게 접하기 좋다. (혹은 자막이 없는 영화관에서 활용하기도 좋다.)

그러나 몇 가지 중요한 주의 사항이 있다. XRAI 앱은 안드로이드 스마트폰 기기로 실행할 수 있으나 379달러짜리 엔리얼 에어 AR 글래스와 USB-C로 연결해야만 한다. 물론, 머리부터 주머니까지 선이 길게 늘어질 것이다. 가격 조건을 논하지 않고 따져보더라도 인공와우나 청력 보조 장치를 착용한 상태에서 AR 글래스를 함께 착용하기 불편하다는 단점이 있다. 엔리얼 에어의 AR 글래스는 상대적으로 가벼운 편이지만, 여전히 일반 안경보다는 두껍고 무거운 편이다. 필자는 24시간 내내 엔리얼 에어 AR 글래스를 착용하는 것을 상상할 수 없었다.

또 다른 주의 사항이 궁금한가? 청력을 상실한 이가 자막을 원하는 주된 이유 중 하나는 카페와 같이 시끄러운 환경이나 여러 명이 동시에 말하는 단체 대화에 참여하는 상황이다. 그러나 펠드만은 XRAI 글래스 시연 시 조용한 공간으로 이동해야 한다고만 거듭 주장했다. 그리고 XRAI 글래스가 소음이 있거나 여러 명이 동시에 대화할 때는 자막을 제대로 지원하지 못한다는 사실을 인정했다.

그리고 엔리얼 에어 AR 글래스가 아닌 XRAI 글래스 앱 비용 문제를 이야기할 수 있다. XRAI 글래스 에센셜(XRAI Glass Essentials)은 무료이며, 무제한 자막과 1일간의 대화 기록을 지원한다. 그러나 10시간 동안 대화하거나 30일간의 대화 기록 저장, 자막 위치 고정, 사용자 인터페이스 맞춤 설정 등을 원한다면, 1달간 무료로 제공한 뒤 매달 20달러를 청구하는 프리미엄 서비스를 사용해야 한다. 무제한 대화 지원과 대화 기록 저장, 개인 AI 어시스턴트를 원한다면, 월 사용료 50달러인 얼티메이트(Ultimate) 버전을 사용해야 한다. 사용료가 비싸다.
 

실시간 자막 서비스 개발 초기
이상적인 실시간 자막은 한동안 존재했다. 구글은 2020년, 웨어러블 기기 자막을 연구하고, 2022년 I/O 개발자 컨퍼런스 현장에서 AR 글래스의 실시간 자막 제공 가능성을 공개했다. 구글은 실시간 번역 기능과 청각장애인을 위한 자막 기능을 제공하는 AR 글래스 영상을 공개했다. 구글은 실시간 자막 제공 기능을 지원할 최적의 시기가 아니라고 밝혔으며, 여전히 사용자가 시야에 들어오는 자막을 편안하게 읽을 수 있는 경험을 지원하는 데 문제가 있다.

필자의 간편한 시연 경험을 바탕으로 이야기하자면, XRAI 글래스는 사용자가 자막을 볼 때 발생하는 문제점을 해결하지 않았다. 크고 비싼 AR 글래스를 착용하고 시야 중앙에 떠다니는 자막을 보는 것은 이상적인 사용 경험이 아니다. (게다가 3D 공간에서 자막을 고정하려면, 유료 서비스에 가입해야 한다. 필자가 XRAI 글래스를 시범 사용할 때는 자막이 고정된 모습을 보지 못했다.)

자막의 정확성에도 의문을 제기할 수 있다. 첫 번째 시연 도중 펠드만이 블루투스 마이크를 사용해 말했을 때 등장한 자막은 완벽함에 가까웠다. 그러나 블루투스 마이크 대신 스마트폰 마이크를 사용했을 때, 자막의 정확도가 현저히 줄어들었다. 필자는 구글 픽셀 6 프로의 녹음기 앱을 사용해 인터뷰 내용을 기록했다. XRAI 글래스보다 픽셀 6 프로 녹음기 앱의 대화 자막이 조금 더 정확했다. XRAI는 여러 서비스 중 아마존 트랜스크라이브(Amazon Transcribe) 서비스를 사용한다.

필자는 데모 마지막 단계에서 XRAI 글래스가 제공하는 또 다른 기능인 언어 번역 기능을 시범 사용해보았다. 펠드만이 영어로 말한 내용이 AR 글래스 렌즈에 중국어 자막으로 등장했다. 다만, 필자는 번역 정확도를 입증할 수는 없다. 실시간 번역 기능은 유료 서비스 가입자만 사용할 수 있다. 간편하게 번역 기능을 접할 수 있지만, XRAI 관계자가 나중에 생각한 기능처럼 느껴졌다.

신제품임을 고려하면, 세련되지 않은 점을 이해할 수 있다. 스카프와 펠드만 모두 XRAI가 여전히 개발 초기 단계이므로 시간이 지나면서 기능을 개선할 것이라는 점을 강조했다. 필자는 별도로 불쾌한 부분을 언급하고 싶지 않다. 많은 기업이 여러 측면에서 청력을 상실한 이들을 위한 혁신 가능성이 있는 접근성 기술 개발 작업을 한다는 사실은 기쁜 일이기 때문이다. 다만, XRAI 글래스가 엔리얼 에어 글래스보다 더 나은 자막 전달 체계가 필요하다고 느낀 것은 어쩔 수 없었다.

대규모 시장과 저렴한 가격, 가벼운 AR글래스나 혼합현실 글래스라는 조건을 모두 갖추었다면, XRAI 글래스와 같은 앱 판매가 훨씬 더 쉬웠을 것이다. 펠드만은 필자가 언급한 모든 조건이 실현된다면, XRAI 글래스 앱을 여러 AR 글래스 제품에 적용하고자 한다고 밝혔다. 그러나 지금 당장 기능이 훌륭하지 않은 AR 글래스와 앱 구독 서비스에 수백 달러를 지출하는 것을 추천하기에는 한계가 너무 많다.

만약, XRAI 글래스에 관심이 있다면, 안드로이드 스마트폰으로 무료 버전을 사용해볼 수 있다. 스마트폰으로 대화 자막을 제공한다. 혹은 화면에 자막을 띄울 수도 있다. 필자는 별도의 지침을 통해 스마트폰에 자막과 대화 내용을 글로 옮길 다양한 방법을 강조한 바 있다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
An App Wants to Subtitle Life for Deaf and Hearing-Impaired Users
이 기사를 공유합니다
RECOMMENDED