챗GPT에서 개인 데이터 삭제하기, ‘이 방법’ 따라하라

By MATT BURGESS, WIRED UK

챗GPT가 사용자의 개인적인 상세 정보를 알 수도 있다. 그렇지 않다면, 단순히 무언가를 구성하기만 할 것이다. 지난 6개월간 오픈AI의 생성형 텍스트 챗봇인 챗GPT의 인기가 상승함과 동시에 웹에서 수집한 데이터로 훈련한 시스템의 위험성이 더 분명하게 드러났다.

세계 각국의 데이터 규제 당국은 오픈AI의 대규모 언어 모델 훈련에 사용된 데이터 수집 문제와 사용자의 질문에 따라 생성한 답변의 정확도, 그 외 생성형 텍스트 시스템 사용 관련 법적 우려 등을 조사 중이다. 유럽 데이터 규제 당국은 이탈리아의 챗GPT 사용 임시 금지 이후 오픈AI 조사에 나섰다. 캐나다는 오픈AI가 개발한 기술의 잠재적 프라이버시 위험성을 조사 중이다.

유럽에서는 개인정보보호 규정(GDPR)에 따라 기업과 기관을 대상으로 사용자 개인 정보 관리의 합법적 타당성을 설명하고, 사용자가 자신의 정보에 접근하도록 할 것을 요구한다. 또, 규정에 따라 사용자 정보 사용 방식을 알려야 하며, 사용자가 정보 수정을 요청하도록 허용한다. 간혹 특정 데이터 삭제 요청이 발생할 수도 있다. 훈련 데이터에 이용된 사용자 개인 정보는 유럽연합 규제 당국의 초기 우려 사항이 되었다.

많은 사용자가 챗GPT를 시험 삼아 사용하고, 개인 생활 및 친구 관련 질문을 하면서 광범위한 잠재적 문제가 급부상했다. 오픈AI는 챗GPT가 정확하지 않은 정보를 제공할 수 있다는 점을 경고했다. 사용자는 챗GPT가 여러 일자리와 취미를 구성한다는 사실을 발견했다. 챗GPT는 인간 작성자로 추정되는 인물이 실존 인물인지도 의심할 정도로 거짓 정보를 만들어 낸다. 챗GPT는 어느 한 법학 교수가 성희롱 파문에 연루되었다는 정확하지 않은 발언을 생성했다. 또, 호주의 어느 한 지역 시장이 뇌물 파문에 개입했다는 거짓 정보를 생성하기도 했다. 현재 챗GPT의 거짓 정보로 피해를 본 시장은 명예훼손 소송을 준비한다고 밝혔다.

개인만 챗GPT의 사용 방식을 우려하는 것이 아니다. 삼성은 자사 직원의 생성형 AI 툴 사용을 금지했다. 그 부분적인 이유는 챗GPT와 같은 AI 툴이 외부 서버에 데이터를 저장하는 방식과 기업 기밀이 다른 사용자에게 유출될 위험성 우려이다. (별도로 저작권, 지식 재산권 관련 문제도 있다.)

오픈AI가 서비스 변경 사항을 제작한 뒤 현재 자국 시민의 챗GPT 사용을 다시 허용한 이탈리아 데이터 규제 당국을 중심으로 챗GPT 검증이 시행되는 상황에 맞서 오픈AI는 사용자가 적어도 일부 개인 데이터 관리를 강화하도록 할 툴과 과정을 도입했다. 사용 방법을 아래와 같이 설명한다.

챗GPT에서 개인 데이터 제거하기
챗GPT와 GPT-4는 통계적으로 인간과 같은 답변을 생성한다. 보통 인간이 작성한 예시 문장 수백만 개를 본 뒤 다음에 사용할 만한 단어를 예측하는 방식을 채택한다. 오픈AI는 대규모 언어 모델 훈련에 사용한 데이터를 공개하지 않았다. 따라서 오픈AI 관계자가 아니라면, 그 누구도 오픈AI가 훈련 데이터 확보 과정에서 개인 정보를 포함한 웹에서 수집한 데이터가 얼마나 많은가 정확히 알 수 없다.

오픈AI는 자사 대규모 언어 모델이 ‘웹에서 수집한 데이터’, ‘오픈AI가 라이선스를 확보한 기업의 데이터’, ‘사용자가 챗GPT와의 대화 중 입력한 정보’라는 세 가지 정보 출처를 바탕으로 수집한 데이터를 훈련한다고 밝혔다. 오픈AI는 “인터넷에 존재하는 데이터 다수가 인터넷 사용자와 관련이 있다. 그러므로 오픈AI가 사용한 훈련 정보가 의도치 않게 개인 정보를 포함할 수도 있다”라고 발표했다. 오픈AI는 공식 게시글을 통해 수집하는 데이터양을 줄이기 위한 단계를 거치고 있다고 밝혔다.

오픈AI는 사용자가 오픈AI의 시스템에서 개인 정보를 삭제하도록 요청할 수 있는 ‘개인 데이터 제거 요청(Personal Data Removal Request)’을 도입했다. ‘개인 데이터 제거 요청’은 주로 유럽에 배포된 기능이지만, 일본에서도 사용할 수 있다. 오픈AI는 블로그 게시글을 통해 자사 언어 모델 개발 방식을 설명했다.

개인 데이터 제거 요청 양식은 주로 훈련 데이터가 아닌 챗GPT가 사용자에게 제공한 답변에 포함된 정보를 삭제하도록 요청할 수 있도록 나타난다. 개인 데이터 제거 요청 양식은 이름과 이메일, 거주 국가, 자신의 정보 삭제 요청 혹은 타인의 정보 삭제 요청(의뢰인을 대신하여 삭제 요청하는 변호사 등) 여부 등을 물어본다. 그리고 정보 삭제 신청자가 연예인 등 공인인지 물어본다.

이어서 오픈AI는 자사 시스템이 정보 삭제를 원하는 인물을 언급했다는 증거를 요청한다. 또한, 특정 인물의 정보를 언급한 결과로 이어진 관련 명령어와 시스템이 정보 삭제 신청자의 개인 정보를 직접 언급한 화면 스크린샷 제출도 요청한다. 양식에는 “삭제 요청을 제대로 처리할 수 있도록 오픈AI의 모델이 명령어의 영향을 받은 데이터 정보를 보유했다는 명확한 증거가 필요하다”라고 명시되었다. 또한, 개인 데이터 삭제 요청 신청자에게 상세 정보가 명확하며, 오픈AI가 항상 데이터를 삭제하지 않을 수도 있다는 점을 이해할 것을 요청한다. 그리고 사용자의 삭제 요청을 받을 때는 프라이버시와 표현의 자유 간 균형을 맞출 것이라는 점도 안내한다.

디지털 권리 비영리단체 액세스 나우(Access Now) 수석 정책 애널리스트 다니엘 로이퍼(Daniel Leufer)는 오픈AI가 지난 몇 주간 적용한 변경 사항이 준수하지만, 데이터 보호 측면에서 특별한 노력 없이 손쉽게 다룰 수 있는 부분이라고 지적한다. 로이퍼는 “오픈AI는 언어 모델 훈련 목적으로 이용하는 사용자 데이터 사용 방식과 관련하여 여전히 더 복잡하면서 체계적인 문제를 전혀 다루지 않았다. 개인적으로 유럽연합 데이터 보호 위원회(European Data Protection Board) 챗GPT 형성을 특히 고려하면, 단순히 그대로 둘 문제가 아니라고 본다”라며, 유럽 규제 당국이 오픈AI 조사에 협력한다는 점을 언급했다.

오픈AI 도움 지원 센터 페이지에는 “사용자 개인은 오픈AI의 훈련 정보에 포함된 개인 정보 접근, 수정, 제한, 삭제 혹은 전송 권한을 지닐 수 있다”라고 명시되었다. 오픈AI는 개인 정보 접근, 수정, 제한, 삭제, 전송을 원하는 사용자는 데이터 보호 담당팀에 메일을 전송할 것을 권고한다. 이미 오픈AI에 개인 데이터 접근, 수정, 제한, 삭제, 전송 등을 요청한 사용자는 오픈AI의 대응에 만족하지 않았다. 이탈리아 규제 당국은 오픈AI가 현재 부정확한 점을 수정하는 것이 사실상 불가능하다고 주장한 사실을 전했다.

챗GPT 대화 기록 삭제하기
특히, 오픈AI의 데이터 삭제 옵션이 제한된 점을 고려하여 챗GPT에 입력하는 내용에 유의해야 한다. 챗GPT와 주고받은 대화는 기본적으로 오픈AI의 미래 대규모 언어 모델에 훈련 데이터 형태로 이용될 수 있다. 적어도 이론상 사용자 개인 정보를 이용하여 사용자의 미래 질문에 대한 답변을 재생성할 수 있다는 의미이다. 4월 25일(현지 시각), 오픈AI는 사용자의 거주지를 떠나 챗GPT 대회 이력 기록 중단 설정 기능을 새로이 도입했다.

챗GPT에 접속한 뒤 화면 왼쪽 아래 구석에 있는 사용자 프로필에 접속하여 ‘설정’, ‘데이터 제어’를 순서대로 클릭하면 된다. 이후 ‘채팅 기록&훈련’ 비활성화가 가능하다. 오픈AI는 대화 기록을 비활성화한다면, 사용자가 대화 도중 입력하는 데이터가 언어 모델 훈련 및 개선 목적으로 이용될 일이 없다고 설명했다.

결과적으로 챗GPT에 입력한 자신과 자신의 삶, 업무 등 개인 정보는 추후 오픈AI의 대규모 언어 모델에 다시 등장할 일이 없다. 오픈AI는 대화 이력을 비활성화하면, 악용 사례 감시 목적으로 사용자의 대화를 30일간 보관한 뒤 영구 삭제할 것이라고 안내했다.

데이터 이력을 비활성화하면, 챗GPT는 대화 이력 기록 활성화 옵션을 제공하는 사이드바에 버튼을 배치하는 방식으로 데이터 수집을 다시 허용하도록 유도한다. 데이터 수집 비활성화 버튼이 설정 메뉴 안에 숨겨진 것과 매우 비교된다.

** 위 기사는 와이어드UK(WIRED.co.uk)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
How To Delete Your Data From ChatGPT

와이어드 코리아=Wired Staff Reporter iufcsol0122@spotv.net

이 기사를 공유합니다