본문 바로가기 주메뉴 바로가기 검색 바로가기
구글 제미나이 라이브, 그 정체와 사용법은?
상태바
구글 제미나이 라이브, 그 정체와 사용법은?
구글이 신규 음성 비서를 배포하여 챗봇과 자연스러운 실시간 대화가 가능해졌다. 구글의 새로워진 챗봇의 특징을 설명한다.
By Julian Chokkattu, WIRED US

2024년 8월, 구글이 픽셀 9 스마트폰부터 무선 이어버즈까지 최신 하드웨어를 대거 공개했다. 구글이 새로 공개한 하드웨어의 근간이 되는 기능은 구글 제미나이(Gemini) 인공지능(AI) 어시스턴트이다. 2024년 초반 출시된 AI 챗봇은 픽셀 9 시리즈의 기본 음성 비서가 되어 이미 전 세계 안드로이드 기기 사용자 수백만 명을 사용자로 보유했다. 하지만 이제 AI 챗봇과 새로운 소통 방식을 지원하는 ‘제미나이 라이브(Gemini Live)’가 배포되었다.

구글이 오픈AI GPT-4o의 대항마로 선보인 제미나이 라이브는 AI 음성 비서의 자연스러운 대화 방식을 지원한다. 이전보다는 인간 두 명이 주고받는 평범한 음성 대화와 비슷한 소통 방식을 지원한다. (적어도 제미나이 라이브의 목표라고 말할 수 있다.) 제미나이 라이브는 월간 구독료 20달러를 부담하는 제미나이 어드밴스 구독자에게 영어로 대화 서비스를 지원한다. 제미나이 앱 하단에 등장하는 작은 ‘라이브’ 버튼을 누르면, 제미나이 라이브에 접근할 수 있다. 추후 iOS 앱으로도 배포되고, 지원 언어도 추가될 예정이다.

구글 제미나이 경험 부사장 시시 샤오(Sissie Hsiao)는 와이어드에 제미나이 라이브는 단순히 구글 어시스턴트를 다시 설계하기만 한 앱이 아니라고 말했다. 대신, 생성형 AI를 활용하여 인터페이스를 완벽하게 재설계했다고 설명했다. 샤오는 “먼저, 많은 사용자가 융통성이 더 우수하면서도 이전보다 더 자연스러운 음성 비서를 요구했다. 같은 명령을 말하는 방식을 바꿀 일 없이 음성 비서와 자연스러운 대화를 이어가는 것을 원했다. 두 번째로 작업 처리 능력이 더 우수한 음성 비서 요청도 있었다. 사용자는 간단한 작업 처리를 넘어선 실제 문제를 해결하는 데도 도움을 줄 수 있는 음성 비서를 원했다”라고 설명했다.

구글 기기에서 실시간 소통 지원
제미니를 실행하면, 하단에서 옅은 빛이 나는 빈 화면이 나타난다. 스마트폰과 화면 잠금 설정이 되었더라도 제미니 실행 시 등장하는 빈 화면에서 음성 비서와 대화를 시작하면서 대화를 계속 이어갈 수 있다. 구글의 최신 무선 이어버즈인 픽셀 버즈 프로 2(Pixel Buds Pro 2)에서도 음성 비서에 접근할 수 있다. 따라서 스마트폰을 가방에 넣었더라도 가방에서 꺼낼 필요 없이 간편하게 대화를 이어갈 수 있다. 음성 비서의 음성은 다양한 어조, 억양, 어투 등이 제각각인 음성 10가지 중 하나를 선택할 수 있다. 대화가 끝나면, 전체 대화 내용의 자막이 생성된다. 대화 자막은 제미니 앱에서 언제든지 접근할 수 있다.

오래된 음성 비서와 달리 제미니 라이브는 전체 경험에 지장을 주지 않고도 대화에 개입하도록 한다. (제미니가 말을 많이 하는 경향이 있다는 점에서 유용하다.) 사용자의 대화 개입은 확장 프로그램을 통해 다른 앱과 연결하도록 지원하기 위한 방안이다. 하지만 아직은 제미나이 라이브와 연결할 수 있는 앱이 많지 않다. 예를 들어, 제미나이 라이브에 지메일에서 파티 초대장을 모아 시간과 장소 정보를 알려달라고 요청할 수 있다. 이때는 직접 메일 수신함에서 초대장을 찾을 필요가 없다. 혹은 요리법을 찾고는 구글 킵(Google Keep)에 재료를 장바구니에 추가하라는 명령을 내릴 수도 있다. 구글은 자사의 여러 앱에서 확장 프로그램처럼 제미나이 라이브를 사용하는 기능을 조만간 출시할 예정이라고 밝혔다.

2024년 말, 구글은 제미나이 라이브를 2024년 5월 개발자 콘퍼런스에서 공개한 컴퓨터 비전 기술인 프로젝트 아스트라(Project Astra)의 영향력을 잔뜩 적용할 계획이다. 프로젝트 아스트라를 적용한 제미나이 라이브는 사용자가 스마트폰 카메라 앱을 사용하여 실제 세계에서 사용자가 보는 사물 정보를 실시간으로 질문하도록 지원한다. 예를 들어, 길거리에서 우연히 콘서트 포스터를 발견했을 때 카메라 앱을 실행하고는 제미나이에 콘서트 일정을 캘린더에 추가하도록 명령하고는 티켓 구매를 잊지 않도록 리마인더 알람을 보내도록 지시할 수 있다.
 
[사진=Google]
[사진=Google]

나에게 직접 말하는 AI 챗봇
지금까지 대다수 사용자의 음성 비서 사용 경험은 주로 업무적인 어조의 대화였다. 따라서 필자는 제미나이 라이브로 음성 비서와 대화했을 때 AI 챗봇과 대화를 시작하는 것이 약간은 어색하다고 느꼈다. 구글 어시스턴트나 알렉사가 날씨 정보 보고 요청을 처리하던 단계에서 기기 실행을 요청하거나 사용자의 반려견이 샐러리를 먹을 수 있는지 물어보는 것이 크나큰 도약이라고 평가할 수 있다. 사용자는 어느 지점에서든 추가 질문을 할 수 있다. 하지만 제미나이 라이브가 과거 대화를 이어가던 방식의 대화 흐름을 중심으로 설계되지는 않았다.

샤오 사장은 차를 운전하면서 출퇴근길을 오가는 내내 제미나이 라이브를 사용하는 것을 좋아한다고 말했다. 샤오 사장은 파리올림픽과 셀린 디온의 개막식 공연을 주제로 제미나이 라이브와의 대화를 시작했다. 샤오 사장은 “셀린 디온이 부른 노래 정보를 조금 알려줄 수 있나?”라고 질문했다. 이후 제미나이 라이브는 셀린 디온이 부른 곡의 원곡과 작곡가, 노래의 의미 등을 알려준 뒤 맥락에 따라 대화를 이어갔다. 샤오 사장은 제미나이 라이브와 대화를 이어가면서 셀린 디온이 중국어 노래도 부를 수 있다는 사실을 알게 되었다.

샤오 사장은 “제미나이 라이브의 대화 능력에 놀랐다. 하지만 내가 보여준 예시는 실제로 제미나이 라이브에서 찾을 수 있는 기능의 일부 예시에 불과하다. 과거에는 제미나이가 선보인 능력과 같은 수준으로 AI 챗봇을 향한 호기심과 대화를 통한 정보 탐색 경험을 누릴 수 없었다. 구글이 제미나이 어시스턴트로 나아가고자 하는 미래 기술 발전은 이제 시작되었다”라고 말했다.

필자는 데모를 통해 제미나이에 저녁 메뉴를 추천해달라고 명령했다. 제미나이는 필자의 질문을 듣고 가볍고 신선한 메뉴나 따뜻한 음식 중 어떤 메뉴를 원하는지 물어보았다. 이를 시작으로 대화를 이어가다가 제미나이가 새우 요리를 추천했을 때 필자는 새우 알레르기가 있다고 말했다. 이때 제미나이는 연어 요리를 새로 추천했다. 그리고 “그릴로 구운 닭가슴살을 그릴로 구운 샐러드에 넣고, 식초 드레싱을 약간 추가하여 먹을 수 있다”라고 말했다. 필자가 자세한 조리법을 묻자 단계별 조리법을 알려주었다. 제미나이가 말하던 중 잠깐 대화를 중단해도 제미나이 앱에 다시 접속하여 조리법을 이어서 설명하도록 질문할 수 있었다.

이후 필자는 무언가를 배우고자 할 때 같은 방식으로 제미나이 라이브를 사용했다. 그리고 제미나이가 첫 번째 질문에 대답한 뒤 대화를 계속 이어갔다. 하지만 필자는 지금도 제미나이 라이브의 기능 중 여러 부분을 우려한다. 제미나이가 제시한 정보나 출처에 직접 접속하도록 지원하지 않는 이유는 무엇일까? 제미나이가 말한 내용을 100% 신뢰할 수 있을까? 샤오 사장은 제미나이 라이브를 종료한 뒤 대화 자막 아래에 등장하는 G 아이콘을 눌러 구글 검색 기능을 통해 제미나이가 말한 내용이 사실인가 직접 찾아볼 수 있다고 답변했다.

그러나 필자는 AI 챗봇 기능을 더 깊이 탐색할수록 제미나이 라이브가 미래의 검색 방식이 될 수 있다고 생각했다. 음성 비서에 질문을 건네면서 대화를 시작하고, 대화를 이어가면서 새로운 정보를 얻을 수 있다. 문제는 제미나이 앱이 말을 너무 많이 한다는 점이다. 제미나이의 답은 장황하다. 따라서 다음 질문을 하기 전, 제미나이가 말을 끝낼 때까지 기다려야 한다. 혹은 중간에 제미나이의 말을 끊고 추가 질문을 할 수 있다. 하지만 음성 비서가 말을 멈추도록 하는 것이 어색하다. 무례한 행동을 하고 싶지 않다!
 

구글 어시스턴트는 도대체 어디에 있는가?
제미나이, 제미나이 라이브에 많은 이들의 이목이 쏠린 가운데, 구글 어시스턴트는 어디에 있는가 궁금해질 수도 있다. 제미나이 앱에서 프로필 아이콘을 클릭한 뒤 ‘구글 어시스턴트로 변경(Switch to Google Assistant)’을 선택하면, 예전처럼 음성 비서를 사용할 수 있다. 그러나 구글 어시스턴트 전환 옵션을 사용할 수 있는 기간이 얼마나 될 것인지는 장담할 수 없다. 현재 구글 어시스턴트는 제미나이가 실행하지 못하는 몇 가지 기능을 지원하므로 다른 음성 비서로 손쉽게 전환할 수 있다. 샤오 사장은 “제미나이는 자체적으로 구글 어시스턴트 전환 기능을 실행할 수 있다”라고 말했다.

2024년 8월 초, 구글은 네스트(Nest) 신제품을 공개했다. 구글은 네스트도 구글 어시스턴트가 더 자연스러운 음성을 갖추고, 일부 기능은 제미나이의 대규모 언어 모델과 함께 업그레이드될 것이라고 안내했다. 페덱스 배달 기사가 물품 배송을 완료했는지 물어보면, 네스트가 현관문 영상 피드를 분석한다. 움직임 경고는 단순히 인간을 감지한 사실을 알리는 것을 넘어서 더 자세한 설명을 전달한다.

두 가지 음성 비서를 사용할 수 있다는 의미이며, 구글이 현재 음성 비서 지원 상황에 100% 만족하는 것처럼 들린다. 샤오 사장은 제미나이가 사용자의 약속과 이메일 초대장 관련 질문을 처리하는 등 개인 데이터를 바탕으로 질문을 처리하는 등 개인 비서 역할을 하게 될 것이라고 말했다. 네스트가 가정용 기기에 더 가깝다는 점에서 가정에서는 구글 어시스턴트가 동반자 역할을 한다. 샤오 사장은 “손님이 거실에서 구글 음성 비서에 사용자의 이메일 수신함 내용을 물어보는 등 가정용 스피커로 음성을 통해 개인 이메일에 접근하는 것을 원하는 사용자는 없을 것이다”라고 전했다.

구글의 브랜드 재앙을 해소할 해법이 될 것으로 보인다. 이미 제미나이의 변형 프로그램을 모두 추적하기 매우 어려운 상태가 되었기 때문이다. (그리고, 2023년 사전 공개된 AI 챗봇인 바드(Bard)를 기억하라.) 사용하는 기기를 기준으로 특정 기능을 제한하여 이메일 정보 유출 문제를 막을 수 있다는 의미로 볼 수 있다. 스마트폰을 통해 제미나이에 작업 처리를 요청하는 일에는 익숙해질 수 있다. 하지만 스마트폰을 손에서 놓고, 다른 방에서 네스트 스피커를 통해 구글 어시스턴트에 추가 작업을 요청했을 때 어시스턴트가 추가 작업을 이어가는 것을 거부한다면, 짜증 나지 않을까?

샤오 사장은 “구글 내부에서 AI 어시스턴트의 브랜드화 방안을 탐색 중이다. 또, 구글은 현재 AI 어시스턴트 개발 초기 단계에 있다. 브랜드 측면을 제외하고 논해도 사용자가 스마트폰을 사용할 때나 가정용 기기를 사용할 때나 가장 유용한 AI 음성 비서를 사용하게 된다는 사실을 보장할 필요가 있다. 이를 통해 많은 사용자의 사용 사례와 관련한 문제를 해결할 수 있다”라고 설명했다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
What Is Gemini Live and How Do You Use It?
이 기사를 공유합니다
RECOMMENDED