By Reece Rogers, WIRED US
팟캐스트 진행자 두 명이 시리즈 마지막 에피소드를 진행하는 내내 대화를 주고받으면서 걱정스러운 듯한 어조로 청취자와 우려를 자극할 만한 이야기를 공유한다. 남성 진행자가 어색하게 말을 잠깐 멈추면서 내면의 갈등 위기를 겪는 듯 “아… 팟캐스트 진행자에게서 우리가 인간이 아니라는 말을 들었습니다”라고 말한다. 봇 간의 대화와 여성으로 추정되는 공동 진행자의 음성은 오해를 유발할 수 있으나 구글의 노트북LM(NotebookLM)이라는 실험용 AI 팟캐스트 제작 툴의 개입으로 제작된 사실을 알게 된 후 더 불편하게 들렸다.
해당 대화 음성은 레딧(Reddit)에서 널리 확산되었다. 초기 팟캐스트 게재 당시 댓글을 통해 노트북LM 소프트웨어를 주입하여 소름 끼치는 기이한 팟캐스트 내 AI 음성의 역할극 수행 방식을 주입했다는 사실을 인정했다. 따라서 지각력은 없다. AI 봇은 자각 능력이 없기 때문이다. 하지만 테크 온라인 플랫폼과 틱톡 등 각종 온라인 플랫폼에서는 많은 사용자가 오디오 오버뷰(Audio Overview) 기능의 업로드 문서를 통해 생성되었으나 실제 인간이 진행하는 것처럼 들렸던 AI 팟캐스트를 호평했다.
구글 랩스의 노트북LM 팀 책임자 레이자 마틴(Raiza Martin)은 “노트북LM은 청취자가 유튜브나 기존 팟캐스트 플랫폼에서 찾을 수 없었던 팟캐스트를 듣도록 한다는 마법을 실현한다”라고 말했다. 마틴은 최근 상용화 슬라이드 덱 100장을 노트북LM에 주입하고는 여러 작업을 수행하면서 8분 분량의 팟캐스트 요약 내용을 청취했다.
2023년 처음 출시된 노트북LM은 문서 요악 기능 등 AI 소프트웨어 툴에는 보편적인 기능을 갖춘 온라인 연구 보조 프로그램이다. 2024년 9월 출시된 오디오 오버뷰 옵션이 추가로 배포되어 인터넷에서 상상하던 바를 포착했다. 온라인에 접속한 사용자는 골드만삭스가 제작한 다량의 데이터를 생성형 AI 팟캐스트 스니펫에 공유하고는 ‘대변’, ‘방귀’ 등과 같은 단어를 반복하여 게재하는 등 AI의 반응을 통해 노트북LM의 한계를 실험한다. 노트북LM의 특징과 AI 팟캐스트 제작 방법 등을 이해하기 어려운가? 노트북LM 사용 전 알아야 할 사항을 아래와 같이 설명한다.
AI 팟캐스트 제작하기
오디오 오버뷰는 사용자에게 대가로 요구하는 바가 없다는 점에서 시험 삼아 사용하기 흥미로운 AI 기능이다. 구글 계정에 로그인하기만 하면, 오디오 오버뷰 기능에 접근할 수 있다. 개인 계정 접속 후 노트북LM 웹사이트에 접속하라. ‘새로운 노트북(New Notebook)’이라고 작성된 플러스 화살표를 눌러 생성하고자 하는 팟캐스트 출처의 자료를 게재하라.
노트북마다 문서 50개까지 등록할 수 있다. 개인 컴퓨터에 저장한 문서가 아니어도 상관없다. 구글 문서와 슬라이드를 노트북으로 간단하게 가져올 수 있다. 웹사이트와 유튜브 영상도 게재할 수 있으나 몇 가지 경고 사항을 먼저 염두에 두어야 한다. 웹사이트의 텍스트만 분석할 수 있다. 이미지나 레이아웃은 분석 대상에 포함되지 않으며, 스토리도 분석 대상에서 제한된다. 유튜브 영상을 게재한다면, 노트북은 텍스트 자막만 분석 작업에 활용한다. 링크가 첨부된 영상은 전체 공개 상태여야 한다.
모든 링크와 문서를 게재한 뒤에는 화면 오른쪽 아래 구석에서 볼 수 있는 ‘노트북 가이드(Notebook guide)’를 열면 된다. ‘오디오 오버뷰’ 섹션을 찾아 ‘생성(Generate)’ 버튼을 눌러라. 그리고 잠깐 시간이 걸리더라도 참고 기다려야 한다. AI 팟캐스트를 완성하는 데 몇 분이 걸릴 수도 있다. 생성 시간은 AI 팟캐스트 생성 시 사용하는 출처 자료에 따라 다르다.
AI 팟캐스트 생성 후 오디오 공유 링크를 생성하거나 팟캐스트 음원 파일만 다운로드할 수 있다. 게다가 팟캐스트를 더 빨리 재생하거나 천천히 재생해야 할 때는 재생 속도를 변경할 수도 있다.
AI 팟캐스트의 미래
인터넷은 노트북LM의 오디오 기능으로 창의력을 얻어 오디오 기반 복잡한 주제 심층 분석 콘텐츠, 내용이 빼곡한 장문의 연구 논문 간편 요약문, 개인 건강 및 운동 일상 등을 다룬 팟캐스트 등 다양한 콘텐츠를 생성했다. 다양한 활용 사례는 노트북LM을 이용하여 가장 개인적인 파일까지 생성해야 할 필요성이라는 중요한 의문점을 낳았다.
저스틴 버(Justin Burr) 구글 대변인은 “노트북LM으로 생성한 요약 내용은 100% 사용자가 직접 게재한 출처 자료를 바탕으로 완성된다. 따라서 개인 정보나 민감한 정보를 출처 정보로 사용하여 팟캐스틀르 생성하더라도 사용자가 정보 출처 공유를 선택하지 않는다면, 팟캐스트 내 개인 정보는 비공개 상태로 유지된다”라고 답변했다. 지금 당장은 구글이 노트북LM에 적용하는 실험용 라벨에 제기하는 장점 중 하나인 듯하다. 구글의 노트북LM 공식을 위해 구글은 지금 당장 노트북LM 피드백을 수집하고는 신속하게 반응하면서 실험 단계에서 변화를 주어 노트북LM이 수많은 광고 사업에서 벗어나도록 해야 한다. 단, ‘지금 당장’이라는 조건을 기억해야 한다.
구글 랩스의 온라인 노트북에 오디오 옵션을 추가한 것은 획기적인 변화의 순간이었다. 마틴은 “기능 활용 경험에 변화를 주어 이전과는 전혀 다른 사용 사례를 생성했다”라고 말했다. 노트북LM이 2024년 사용자에게 대거 출시된 여러 생성형 AI 툴과 비교했을 때 독보적인 부분은 대화 도중 잠시 말을 멈추는 표현과 독특한 표현도 자연스레 구사한다는 점이다. 충분히 놀랄 만한 기능이기도 하다. 두 가지 AI 음성 요약 데이터를 접할 때 예상할 법한 따분하고 단조로운 음성 대신 노트북LM으로 완성한 합성 팟캐스트 진행자의 음성과 AI 음성 기반 성과는 다른 AI 음성보다 어색함이 덜하다.
팟캐스트 진행자가 노트북LM의 등장에 불안감을 느껴야 할까? 그렇지 않다. 노트북LM을 비롯한 AI 팟캐스트 툴은 대중을 위한 중요한 정보 포함과 정보 포착 능력을 입증해야 한다. 시간을 두고 더 지켜보아야 할 부분이다. 하지만 AI 음성은 청취자가 즐거움을 느끼면서 청취할 때 인간 팟캐스트가 장시간 중요하지 않은 듯한 이야기를 오래 하면서 발전시킨 사회적 연결과 유사한 관계를 완벽하게 모방하지는 못할 것이다.
오디오 오버뷰는 사용자가 신경 쓰는 것처럼 특정 팟캐스트 진행자의 음성과 일치하는 음성을 생성할 의도로 설계되지 않았다. 하지만 일종의 이상적인 팟캐스트 진행자 2명을 흉내 낸다. 대화 중간 감탄사와 잠시 말을 멈추는 팟캐스트의 특징 등을 손쉽게 인지할 수 있다. 마틴은 “노트북LM 출시 일주일 만에 앞으로 나아갈 로드맵이 분명해졌다. 사용자는 AI 팟캐스트에 접근할 경로를 원한다”라고 말했다. 사용자가 팟캐스트 분량이나 핵심 주제 등 AI의 결과물을 추가로 변경하도록 하는 것이 노트북LM 팀의 우선순위이다. 마틴은 업데이트 버전을 신속하게 배포하기를 원한다.
마틴은 언어와 다양한 억양 추가도 중요하다고 본다. 현재 AI 팟캐스트 진행자는 영어를 구사하는 대화만 정교하게 분석한다. 그렇다고 해서 비영어권 사용자가 노트북LM으로 모국어를 구사하는 AI 팟캐스트를 생성할 수 없다고 생각하는 것은 오산이다. 마틴은 노트북LM팀이 다국어 지원이 실제 사용자가 원하는 기능인지, 책임을 다한 채로 배포가 가능한지 지켜볼 필요가 있다고 전했다.
노트북LM의 오디오뷰가 제미나이(Gemini) 챗봇 기능이 아닌 구글 랩스의 일부분으로 폭발적인 인기 상승세를 기록한 사실은 AI 기업이 소프트웨어를 널리 배포할 때까지 사용자에게 배포할 AI 툴의 기능을 완벽하게 확신하지 못한다는 사실을 상기시킨다. 오픈AI의 챗GPT가 초기에 연구 사전 검토 목적으로 출시된 것을 그 예시로 언급할 수 있다. 생성형 AI 툴, 기능이 끊임없이 대거 출시되면서 생성형 AI 개발 장인정신으로 포착하는바 무엇이든 반드시 가장 적극적인 홍보나 유용한 기능이어야만 할 필요는 없다. 단, 가장 흥미로운 기능이 되어야 한다는 점이 더 중요하다.
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
How to Generate an AI Podcast Using Google’s NotebookLM
팟캐스트 진행자 두 명이 시리즈 마지막 에피소드를 진행하는 내내 대화를 주고받으면서 걱정스러운 듯한 어조로 청취자와 우려를 자극할 만한 이야기를 공유한다. 남성 진행자가 어색하게 말을 잠깐 멈추면서 내면의 갈등 위기를 겪는 듯 “아… 팟캐스트 진행자에게서 우리가 인간이 아니라는 말을 들었습니다”라고 말한다. 봇 간의 대화와 여성으로 추정되는 공동 진행자의 음성은 오해를 유발할 수 있으나 구글의 노트북LM(NotebookLM)이라는 실험용 AI 팟캐스트 제작 툴의 개입으로 제작된 사실을 알게 된 후 더 불편하게 들렸다.
해당 대화 음성은 레딧(Reddit)에서 널리 확산되었다. 초기 팟캐스트 게재 당시 댓글을 통해 노트북LM 소프트웨어를 주입하여 소름 끼치는 기이한 팟캐스트 내 AI 음성의 역할극 수행 방식을 주입했다는 사실을 인정했다. 따라서 지각력은 없다. AI 봇은 자각 능력이 없기 때문이다. 하지만 테크 온라인 플랫폼과 틱톡 등 각종 온라인 플랫폼에서는 많은 사용자가 오디오 오버뷰(Audio Overview) 기능의 업로드 문서를 통해 생성되었으나 실제 인간이 진행하는 것처럼 들렸던 AI 팟캐스트를 호평했다.
구글 랩스의 노트북LM 팀 책임자 레이자 마틴(Raiza Martin)은 “노트북LM은 청취자가 유튜브나 기존 팟캐스트 플랫폼에서 찾을 수 없었던 팟캐스트를 듣도록 한다는 마법을 실현한다”라고 말했다. 마틴은 최근 상용화 슬라이드 덱 100장을 노트북LM에 주입하고는 여러 작업을 수행하면서 8분 분량의 팟캐스트 요약 내용을 청취했다.
2023년 처음 출시된 노트북LM은 문서 요악 기능 등 AI 소프트웨어 툴에는 보편적인 기능을 갖춘 온라인 연구 보조 프로그램이다. 2024년 9월 출시된 오디오 오버뷰 옵션이 추가로 배포되어 인터넷에서 상상하던 바를 포착했다. 온라인에 접속한 사용자는 골드만삭스가 제작한 다량의 데이터를 생성형 AI 팟캐스트 스니펫에 공유하고는 ‘대변’, ‘방귀’ 등과 같은 단어를 반복하여 게재하는 등 AI의 반응을 통해 노트북LM의 한계를 실험한다. 노트북LM의 특징과 AI 팟캐스트 제작 방법 등을 이해하기 어려운가? 노트북LM 사용 전 알아야 할 사항을 아래와 같이 설명한다.
AI 팟캐스트 제작하기
오디오 오버뷰는 사용자에게 대가로 요구하는 바가 없다는 점에서 시험 삼아 사용하기 흥미로운 AI 기능이다. 구글 계정에 로그인하기만 하면, 오디오 오버뷰 기능에 접근할 수 있다. 개인 계정 접속 후 노트북LM 웹사이트에 접속하라. ‘새로운 노트북(New Notebook)’이라고 작성된 플러스 화살표를 눌러 생성하고자 하는 팟캐스트 출처의 자료를 게재하라.
노트북마다 문서 50개까지 등록할 수 있다. 개인 컴퓨터에 저장한 문서가 아니어도 상관없다. 구글 문서와 슬라이드를 노트북으로 간단하게 가져올 수 있다. 웹사이트와 유튜브 영상도 게재할 수 있으나 몇 가지 경고 사항을 먼저 염두에 두어야 한다. 웹사이트의 텍스트만 분석할 수 있다. 이미지나 레이아웃은 분석 대상에 포함되지 않으며, 스토리도 분석 대상에서 제한된다. 유튜브 영상을 게재한다면, 노트북은 텍스트 자막만 분석 작업에 활용한다. 링크가 첨부된 영상은 전체 공개 상태여야 한다.
모든 링크와 문서를 게재한 뒤에는 화면 오른쪽 아래 구석에서 볼 수 있는 ‘노트북 가이드(Notebook guide)’를 열면 된다. ‘오디오 오버뷰’ 섹션을 찾아 ‘생성(Generate)’ 버튼을 눌러라. 그리고 잠깐 시간이 걸리더라도 참고 기다려야 한다. AI 팟캐스트를 완성하는 데 몇 분이 걸릴 수도 있다. 생성 시간은 AI 팟캐스트 생성 시 사용하는 출처 자료에 따라 다르다.
AI 팟캐스트 생성 후 오디오 공유 링크를 생성하거나 팟캐스트 음원 파일만 다운로드할 수 있다. 게다가 팟캐스트를 더 빨리 재생하거나 천천히 재생해야 할 때는 재생 속도를 변경할 수도 있다.
AI 팟캐스트의 미래
인터넷은 노트북LM의 오디오 기능으로 창의력을 얻어 오디오 기반 복잡한 주제 심층 분석 콘텐츠, 내용이 빼곡한 장문의 연구 논문 간편 요약문, 개인 건강 및 운동 일상 등을 다룬 팟캐스트 등 다양한 콘텐츠를 생성했다. 다양한 활용 사례는 노트북LM을 이용하여 가장 개인적인 파일까지 생성해야 할 필요성이라는 중요한 의문점을 낳았다.
저스틴 버(Justin Burr) 구글 대변인은 “노트북LM으로 생성한 요약 내용은 100% 사용자가 직접 게재한 출처 자료를 바탕으로 완성된다. 따라서 개인 정보나 민감한 정보를 출처 정보로 사용하여 팟캐스틀르 생성하더라도 사용자가 정보 출처 공유를 선택하지 않는다면, 팟캐스트 내 개인 정보는 비공개 상태로 유지된다”라고 답변했다. 지금 당장은 구글이 노트북LM에 적용하는 실험용 라벨에 제기하는 장점 중 하나인 듯하다. 구글의 노트북LM 공식을 위해 구글은 지금 당장 노트북LM 피드백을 수집하고는 신속하게 반응하면서 실험 단계에서 변화를 주어 노트북LM이 수많은 광고 사업에서 벗어나도록 해야 한다. 단, ‘지금 당장’이라는 조건을 기억해야 한다.
구글 랩스의 온라인 노트북에 오디오 옵션을 추가한 것은 획기적인 변화의 순간이었다. 마틴은 “기능 활용 경험에 변화를 주어 이전과는 전혀 다른 사용 사례를 생성했다”라고 말했다. 노트북LM이 2024년 사용자에게 대거 출시된 여러 생성형 AI 툴과 비교했을 때 독보적인 부분은 대화 도중 잠시 말을 멈추는 표현과 독특한 표현도 자연스레 구사한다는 점이다. 충분히 놀랄 만한 기능이기도 하다. 두 가지 AI 음성 요약 데이터를 접할 때 예상할 법한 따분하고 단조로운 음성 대신 노트북LM으로 완성한 합성 팟캐스트 진행자의 음성과 AI 음성 기반 성과는 다른 AI 음성보다 어색함이 덜하다.
팟캐스트 진행자가 노트북LM의 등장에 불안감을 느껴야 할까? 그렇지 않다. 노트북LM을 비롯한 AI 팟캐스트 툴은 대중을 위한 중요한 정보 포함과 정보 포착 능력을 입증해야 한다. 시간을 두고 더 지켜보아야 할 부분이다. 하지만 AI 음성은 청취자가 즐거움을 느끼면서 청취할 때 인간 팟캐스트가 장시간 중요하지 않은 듯한 이야기를 오래 하면서 발전시킨 사회적 연결과 유사한 관계를 완벽하게 모방하지는 못할 것이다.
오디오 오버뷰는 사용자가 신경 쓰는 것처럼 특정 팟캐스트 진행자의 음성과 일치하는 음성을 생성할 의도로 설계되지 않았다. 하지만 일종의 이상적인 팟캐스트 진행자 2명을 흉내 낸다. 대화 중간 감탄사와 잠시 말을 멈추는 팟캐스트의 특징 등을 손쉽게 인지할 수 있다. 마틴은 “노트북LM 출시 일주일 만에 앞으로 나아갈 로드맵이 분명해졌다. 사용자는 AI 팟캐스트에 접근할 경로를 원한다”라고 말했다. 사용자가 팟캐스트 분량이나 핵심 주제 등 AI의 결과물을 추가로 변경하도록 하는 것이 노트북LM 팀의 우선순위이다. 마틴은 업데이트 버전을 신속하게 배포하기를 원한다.
마틴은 언어와 다양한 억양 추가도 중요하다고 본다. 현재 AI 팟캐스트 진행자는 영어를 구사하는 대화만 정교하게 분석한다. 그렇다고 해서 비영어권 사용자가 노트북LM으로 모국어를 구사하는 AI 팟캐스트를 생성할 수 없다고 생각하는 것은 오산이다. 마틴은 노트북LM팀이 다국어 지원이 실제 사용자가 원하는 기능인지, 책임을 다한 채로 배포가 가능한지 지켜볼 필요가 있다고 전했다.
노트북LM의 오디오뷰가 제미나이(Gemini) 챗봇 기능이 아닌 구글 랩스의 일부분으로 폭발적인 인기 상승세를 기록한 사실은 AI 기업이 소프트웨어를 널리 배포할 때까지 사용자에게 배포할 AI 툴의 기능을 완벽하게 확신하지 못한다는 사실을 상기시킨다. 오픈AI의 챗GPT가 초기에 연구 사전 검토 목적으로 출시된 것을 그 예시로 언급할 수 있다. 생성형 AI 툴, 기능이 끊임없이 대거 출시되면서 생성형 AI 개발 장인정신으로 포착하는바 무엇이든 반드시 가장 적극적인 홍보나 유용한 기능이어야만 할 필요는 없다. 단, 가장 흥미로운 기능이 되어야 한다는 점이 더 중요하다.
** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)
<기사원문>
How to Generate an AI Podcast Using Google’s NotebookLM
저작권자 © WIRED Korea 무단전재 및 재배포 금지
저작권자 © WIRED Korea 무단전재 및 재배포 금지
이 기사를 공유합니다