인공지능 생성 코드의 강력한 힘과 잠재적 위험성

By WILL KNIGHT, WIRED US

2021년 6월, 깃허브(GitHub)가 오픈AI의 텍스트 생성 기술 기반 컴퓨터 코드 자동 완성 툴인 코파일럿(Copilot)을 공개했다. 코파일럿은 생성형 인공지능(AI)이 중요한 작업을 자동화할 수 있는 잠재적인 능력을 엿볼 기회를 주었다. 2년이 지난 현재 코파일럿은 과거 인간이 직접 수동으로 처리하던 작업을 기술이 수행할 수 있는 방식의 가장 완벽한 예시 중 하나가 되었다.

2023년 6월 말, 깃허브는 코파일럿 유료 서비스를 사용한 프로그래머 약 100만 명의 데이터를 바탕으로 작성한 보고서를 발행했다. 보고서는 생성형 AI 코딩이 지금까지 선보인 변화 수준을 다루었다. 프로그래머의 코파일럿 전체 사용 시간 중 AI의 추천 코드를 채택한 시간은 30%에 해당했다. 코파일럿 시스템의 유용한 코드 예측 능력이 뛰어나다는 점을 시사한다.

코파일럿은 보고서와 함께 사용자가 코파일럿을 수개월 더 사용하면서 코파일럿의 추천 툴을 더 많이 받아들이는 경향을 보여주는 차트를 제시했다. 보고서는 AI 추천 코드 채택률과 프로그래머의 생산성 간의 관계를 다룬 이전의 코파일럿 연구 보고서를 바탕으로 시간의 흐름에 따라 AI 툴을 사용한 개발자의 생산성이 향상되었다는 결론을 내렸다. 깃허브는 경험이 적은 개발자 집단의 생산성 향상 수준이 가장 높다고 발표했다.

겉으로 보았을 때는 생성형 AI라는 새로운 기술이 빠른 속도로 가치를 입증한 것처럼 보인다. 인간의 생산성 강화와 미숙련 인력의 능력 향상에 도움이 된 기술은 무엇이든 개인과 광범위한 경제적 측면에도 축복이 될 수 있다. 깃허브는 어느 정도 정확하지 않은 추측을 제기하며, AI 코딩의 영향으로 2030년까지 세계 GDP를 약 1조 5,000억 달러 규모로 성장할 것으로 추산했다.

그러나 필자는 깃허브가 코파일럿을 사용하는 프로그래머의 AI 추천 코드 채택률 및 생산성 향상 수준을 제시한 차트를 보고, 최근 일리노이즈대학교 어바나샴페인 캠퍼스 교수 타리아 린저(Talia Ringer)와 대화 도중 접한 코파일럿과 같은 AI 코딩 툴과 개발자의 관계를 제시한 다른 연구 결과를 떠올렸다.

2022년 말, 스탠퍼드대학교 연구팀은 직접 개발한 코드 생성 AI 어시스턴트 사용 관행이 개발자가 생성한 코드의 질에 미치는 영향을 다룬 연구 논문을 게재했다. 연구팀은 AI 추천 코드를 채택한 프로그래머의 최종 완성 코드에 버그가 더 많다는 사실을 발견했다. 그러나 AI 코딩 툴을 사용한 개발자는 코드를 직접 작성할 때보다 AI를 활용하여 완성한 코드의 보안 수준이 더 높다고 생각한다는 사실도 드러났다. 린저 교수는 AI를 사용한 코딩 작업과 관련, “AI 코딩 툴을 사용하면, 장점과 위험성이 모두 존재한다. 코드가 더 많다고 해서 더 나은 코드를 작성하는 것은 아니다”라고 설명했다.

프로그래밍의 특성을 고려하면, 린저 교수 연구팀의 연구 결과가 놀라운 결과라고 보기 어렵다. 2022년, 클리브 톰슨(Clive Thompson) 기자가 와이어드 기사를 통해 설명한 바와 같이 코파일럿은 기적과 같은 코드 작업 결과물을 제시하는 듯하지만, 실제로 코파일럿과 같은 AI 코딩 툴이 제시하는 추천 코드는 결함이 존재할 수도 있는 다른 프로그래머의 작업 패턴을 바탕으로 한다. AI 코딩 툴의 추천 코드는 감지하기 매우 어려운 버그를 생성할 수 있다. 특히, 사용하는 AI 코딩 툴의 사용자 작업 통제 수준이 훌륭하다면, 추천 코드 속 버그를 감지하기 더 어렵다.

코딩 이외에도 여러 엔지니어링 분야에서도 인간이 자동화 기술에 지나치게 의존하는 사례를 찾아볼 수 있다. 미국 연방항공청(US Federal Aviation Authority)은 일부 조종사가 오토파일럿 기술에 의존하여 개인의 비행 기술 수준이 저하된다는 점을 거듭 경고했다. 지금까지는 드물지만, 치명적일 수도 있는 결함이 발생할 상황에서 보호하도록 운전자의 추가 주의가 필요한 자율주행차에서도 비슷한 문제를 찾아볼 수 있다.

자동화 기술의 역설은 생성형 AI 개발 이야기의 중심 사안이자 자동화 기술이 인간에게 미치는 영향이 될 수 있다. 생성형 AI는 이미 웹 콘텐츠의 질이 급격히 저하하는 상황이 확산하는 결과를 견인했다. 실제로 유명 웹사이트에 AI가 생성한 저급한 콘텐츠가 넘쳐나며, 스팸 웹사이트가 확산되고 챗봇이 인위적으로 사용자의 참여도를 끌어모으려 하는 것을 생성형 AI의 문제로 언급할 수 있다.

앞서 언급한 문제점 모두 생성형 AI가 결함이 있는 기술이라는 의미는 아니다. 그러나 갈수록 많은 연구 단체가 생성형 AI로 고객 지원 전화 상담 담당자를 포함한 일부 근로자의 업무 성과와 만족도를 향상할 수 있다는 사실을 입증하고자 한다. 반대로 일각에서는 AI 툴을 사용할 때 코드의 보안 버그가 증가하지 않았다는 사실을 발견한 연구 결과를 발표하기도 했다. 또, 깃허브가 AI 보조 툴을 이용한 안전한 코드 작성 방법을 연구한다는 사실에는 칭찬할 만하다. 2023년 2월, 코파일럿에는 기본 모델로 생성한 취약점을 감지하고자 하는 새로운 기능이 추가되었다.

그러나 코드 생성의 복잡한 효과는 생성형 알고리즘을 다른 사용 사례에 적용하고자 하는 기업에 주의할 만한 사례를 제공한다.

각국 규제 기관과 국회의원은 AI 관련 우려 사항이 더 커진다는 사실을 인지해야 한다. 생성형 AI의 잠재적 가능성과 생성형 AI가 세계를 장악할 것이라는 정확하지 않은 추측에 전 세계가 큰 관심을 보이는 가운데, AI 배치 효과의 눈에 띄지 않지만 중요한 증거를 간과할 수 있다. 인류의 미래에는 소프트웨어가 모든 것의 기반이 될 것이다. 따라서 주의하지 않는다면, AI가 생성한 버그가 넘쳐날 것이다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
The Huge Power and Potential Danger of AI-Generated Code

와이어드 코리아=Wired Staff Reporter iufcsol0122@spotv.net

이 기사를 공유합니다