본문 바로가기 주메뉴 바로가기 검색 바로가기
숨겨진 데이터는 코로나 발병의 실제 규모를 보여준다
상태바
숨겨진 데이터는 코로나 발병의 실제 규모를 보여준다
위성 이미지, 인터넷 속도, 교통 정보... 정부가 모르는 정보 밝혀내
By Gian Volpicelli, WIRED UK

지난 3월 13일, 말레이시아의 인터넷 서비스에 문제가 생겼다. 사이먼 앵거스(Simon Angus)는 데이터를 반복적으로 살핀 결과, 말레이시아가 코로나바이러스 위기를 겪는 중이라는 의심을 확신하게 됐다.  

사이먼 앵거스는 호주 모나쉬(Monash) 대학교 교수이자 멜버른에 소재한 카스퍼 데이터하우스(Kaspr Datahaus) 공동창업자이다. 이 회사는 경제 및 사회적 현상에 대한 정확한 분석력을 얻고자 전 세계 인터넷 연결망의 품질을 분석하는 기업이다.

현재 세계의 인터넷 속도를 측정하고자 인터넷에 연결된 수백 만개의 기기를 추적 관찰 중이다. 카스퍼 데이터하우스 관계자에 따르면, 한 국가의 인터넷 속도가 갑자기 악화되면 네트워크에 과부하가 걸렸다는 의미라고 한다.

최근 몇 주간 사이먼 앵거스는 코로나19 전염병과 연관 있다는 가설을 세웠다. 사람들이 코로나19에 대한 예방책으로 재택근무, 격리 혹은 자가 격리를 하게 되면서 평소보다 인터넷 접속량이 많아졌다.

앵거스는 “이동 통제를 하고 있거나 공황 상태에 있거나 자가 격리에 들어간 사람에게 인터넷은 정보를 얻는 중요한 원천이자 오락 수단이 됐다”고 말했다.

직설적으로 말해서, 수백만 명이 넷플릭스를 틀어놓거나 틱톡 영상을 보거나 줌으로 영상통화를 하거나 포트나이트 게임을 하거나 트위터 게시물을 한가롭게 스크롤 하기만 해도 한 국가의 인터넷 품질에 영향을 미칠 수 있다. (티에리 브르통(Thierry Breton) 유럽연합 집행위원이 긴급상황이 끝날 때까지 넷플릭스가 고화질 스트리밍 서비스를 중지해야 한다고 권고한 이유는 이 때문이다.)

현재까지 앵거스가 조사한 바에 따르면, 말레이시아에서는 3월 12~13일 동안 인터넷 속도가 5% 이상 느려졌다. 모든 생산활동과 사업장이 폐쇄된 이탈리아 보다도 더 인터넷이 악화됐다. 공식적으로, 말레이시아에서는 코로나19 확진 건수가 최근 1주일간 소폭 오르긴 했지만 상대적으로 적은 129건만 확인됐다.

일반 대중은 정부가 코로나19 대처가 미숙하다는 사실을 알아차리기 시작했다. 지난 2월 말, 당국은 말레이시아 수도인 쿠알라 룸프르에서 개최된 대규모 종교집회를 허가했다. 이 것이 치명적인 실수였다. 이 행사를 기점으로 확진자가 나오기 시작하자, 정부는 서둘러 이 행사에 참가한 모든 인원을 찾아 나섰다.

그러나 숫자를 잘못 헤아렸다. 처음 말레이시아 거주민 5000명이 참가했다고 밝혔다가 나중에는 1만 명이라고 수정하고 다시 1만 4500명 이라고 정정했다. 이런 오류가 드러난 뒤, 많은 말레이시아 사람들은 생존을 위해 자택에 머물기로 결정한 듯 보였다.

앵거스는 “다수의 사람들은 이미 무슨 일이 일어났는지 알아챘고 불안 했으며, 행동 양식을 바꾸기 시작했다. 우리는 이러한 신호를 감지했다”고 설명했다. 그는 이어 “말레이시아의 인터넷 연결망 사정이 좋지 못해서인지 인터넷은 이미 취약성을 드러냈다”고 말했다.

말레이시아는 지난 16일에 이동 통제를 시작했다. WHO(세계보건기구)에 따르면, 18일 기준으로 코로나19 확진 사례가 553명이었으나 최근 보도자료에 따르면 이 확진자 수는 900여 명으로 불어났다.

앵거스는 “직접 입수한 데이터에 따르면, 각국의 인터넷 연결망이 코로나19로 인해 심각한 상황에 놓였으며 우리는 이 점을 인지했다”고 말했다.
 
몇몇 국가에서 위성 이미지, 인터넷 속도, 교통 정보는 정부가 알아내지 못한 내용을 밝혀낸다. [사진=GETTY IMAGES]
몇몇 국가에서 위성 이미지, 인터넷 속도, 교통 정보는 정부가 알아내지 못한 내용을 밝혀낸다. [사진=GETTY IMAGES]

코로나19 위기가 전 세계를 엄습한 지금, 이 상황을 파악하고자 공식 발표자료를 인용하지만 그 효용성은 한계가 있다는 게 일부 생각이다. 중국 정부가 코로나19 발발 초기에 그랬던 것처럼, 각국 정부는 나라 안에서 일어나고 있는 일에 대해 의도적으로 애매한 태도를 취할 수도 있다.

이탈리아처럼 확진자 사례 수집을 잘 못하거나 지역마다 자료수집 방식의 차이로 인해 확진자와 사망자 수가 정확하지 않을 수 있다. 일반적으로 현장에서는 실시간으로 늘어나는 확진자 수를 공식적인 집계하는 데 어려움이 따른다.

젠스 노르드비그(Jens Nordvig) 뉴욕 소재 엑산테 데이터(Exante Data) 대표는 지금 상황에서 누가 2분기 GDP를 신경 쓰겠냐며 반문했다. 엑산테 데이터는 중국의 소셜네트워크서비스(SNS) 바이두로부터 공급받은 GPS 데이터를 활용해 중국에서 발생한 코로나19를 추적해 관찰 중이다.

노르드비그는 “엑산테 데이터가 정말로 신경을 쓰는 부분은 사람들의 이동과 사회적 거리 두기가 어떻게 작용 하는 지에 대한 것이다. 잘 사용한다면, 믿을 수 없을 만큼의 양질의 데이터를 확보할 수 있다”고 말했다. 금융기관, 투자자, 기업, 보험회사가 카스퍼 데이터하우스나 엑산테 데이터와 같은 회사들에 의지하는 이유이다.

카스퍼 데이터하우스나 엑산테 데이터는 대체 데이터를 분석해 고객사에 각 나라가 코로나19 비상사태에 어떻게 맞서는 지에 대해 간접적인 자료를 제공한다. 말레이시아의 경우처럼 이는 사회적 추세와 연관된다. 그러나 이러한 데이터 분석은 종종 경제와 더 관련성이 있다. 

예를 들자면, 앵거스는 “팬데믹 동안 중국의 인터넷을 추적 관찰한 결과, 신종 코로나바이러스가 가장 심한 지역에서 서버와 컴퓨터를 운용 중인 생산공장이 어떻게 문을 닫게 됐는지가 드러났다”고 말했다.

지난 몇 주간 코로나19의 확산이 잦아들면서, 비록 코로나19가 발생하기 전 수준에는 한참 못 미치지만 점진적으로 상황이 정상화되기 시작했다. 정부가 시행한 전력 소비량 목표치를 충족하기 위해 생산공장이 재가동됨에 따라 증거는 오염될 수도 있다. 앵거스는 “중국이 아직 정상화 되지 못했다”며 “중국의 인터넷 지연 속도(latency)로 보면 코로나19로 부터 중국이 회복세를 보이고 있지만 여전히 집에서 활동하는 인구가 많다는 것을 보여준다”고 말했다.
 
인터넷을 살펴보는 게 코로나19 시대의 동향을 파악하는 유일한 수단은 아니다. 사미르 마다니(Samir Madani)는 전세계 원유 산업과 관련한 상황을 중소상인들 이해를 돕기 위해 오픈소스 정보를 공급하는 회사 탱커트래커스(TankerTrackers) 설립자이다. 신종 코로나바이러스 전염병이 확산됨에 따라, 마다니는 코로나19 대혼란 상황을 알아보고자 다방면에 걸쳐 자료를 참고했다.

마다니는 위성 이미지와 선박에 있는 무선응답기에 기록된 데이터를 결합해, 중국 측에 화물을 인도하지 못해 정박 중인 유조선이 몇 대인지 주기적으로 확인했다. 이 지표는 모두 전염 확산세인 중국 내 항구가 원활하게 작동하고 있는지, 산업생산이 계속 이어지고 있는지를 알려 준다.

마다니는 또한 중국과 이탈리아 도시들이 통행 제한과 격리로부터 어떤 영향을 받았는지 이해하고자 이 도시들에 대한 ‘톰톰(TomTom)의 도로교통 자료’를 이용하고 있다. 마다니는 “지난 2주간 교통이 다시 혼잡해졌다는 사실을 알게 되었다”며 “우한 시를 제외하고 중국 대도시에서 교통량이 늘고 있다”고 말했다.

마다니는 “특히 대규모 공업지역과 상업지구가 자리한 충칭시나 광동시 같은 도시 통행량이 많았다”며 “다시 북적거리기 시작하는 거 같다”고 분석했다. 그러나 다른 사람과 접촉하는 일을 경계하기 때문에 대중 교통 대신 자가용을 이용한 사람 때문에 통행량이 증가한 경향도 있다.

감염 데이터는 또다른 유형의 귀중한 정보이다. 지난 몇 주간, 사람들은 트위터 상에서 다양한 국가의 위성 사진을 공유했다. 이 사진을 보면 코로나바이러스가 야기한 각종 시설의 폐쇄로 인해 오염도가 하락했다는 사실을 알 수 있다. 재택 근무를 하는 트위터 사용자들이 그 상황에서도 위로를 가지게 되는 것에서, 마다니는 석유 소비와 관련된 냉담한 현실과 마주한다.

예를 들어, NASA(미국 항공우주국) 웹사이트에 주기적으로 게재되는 이산화질소(NO2) 배출량은 탈공업화 시대에 이루어지는 인간의 활동을 보여 주는 간접적 자료이다. 마다니는 “이산화질소는 어디서든 배출 된다. 차, 산업 등. 거의 모든 영역에서 배출 된다”며 “지난 한 달간 이산화질소 배출량에는 제법 큰 변화가 있었다. 미국 동해안 지역에서 이산화질소 배출량이 크게 줄었다. 미국 동해안 지역에는 많은 산업 시설들이 자리한다. 중국에서는 많이 증가했다” 말했다. 

마다니는 “중국을 보면 배출양이 전년대비 2/3에서 3/5 수준으로 상당한 반등세를 보이고 있다”고 말했다. 

** 위 기사는 와이어드UK(WIRED.co.uk)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 문재호 에디터)

<기사원문>
Hidden data is revealing the true scale of the coronavirus outbreak
와이어드 코리아=Wired Staff Reporter wiredkorea@wired.kr
이 기사를 공유합니다
RECOMMENDED