강화 학습된 Eva, 기존 방식보다 최대 4배 코로나 무증상 감염자 찾아
PLF 정보와 과거 검사 결과로 코로나 유병률 측정
본지와 이메일 인터뷰, "제한된 수의 데이터 사용, 알고리즘 예측 기능 제한"
GDPR 규제에 맞게 만들어 개인 데이터 수집 제한..."상황에 맞는 규제 필요"

(출처= 셔터스톡)
(출처= 셔터스톡)

머신러닝으로 코로나 무증상 감염자를 기존 방식보다 최대 4배 더 많이 찾을 수 있다는 연구 결과가 나왔다.

네이처(Nature)지는 알고리즘 '에바(Eva)'를 이용한 코로나 무증상 감염자 선별 연구 결과를 22일 발표했다.

해당 연구는 함사 바스타니(Hamsa Bastani) 미 펜실베이니아 대 와튼스쿨 정보운영처리학과 교수와 키몬 드라코풀로스(Kimon Drakopoulos) USC 마셜 비즈니스스쿨 데이터사이언스학과 교수가 주도했다. (원문 링크)

연구진은 Eva를 통해 "누구를 우선적으로 검사해야 할지 예측할 수 있다"고 말했다. 이는 기존 방식보다 코로나 무증상 감염자를 최대 4배 더 많이 찾을 수 있다. 그러나 까다로운 개인 데이터 수집 정책을 극복할 수 있을지는 미지수다.

이번 연구는 그리스 전역에 있는 공항, 국경 검문소(land crossing), 항구에서 2020년 8월 6일부터 11월 1일까지 실시됐다. 결과에 따르면, 모든 입국자들을 검사하는 무작위 테스트(Random testing) 보다 약 2배 더 많은 무증상 감염자를 선별했다. 여행 성수기에는 2~4배 더 많이 찾았다. 단순 역학 조사만 하던 방법보다는 1.25~1.45배 더 많은 무증상 감염자를 선별했다.

Eva는 인공지능 강화학습(Reinforcement learning) 알고리즘이다. 인구통계학적 정보와 코로나 검사 결과 데이터를 수집해 훈련했다. 모아둔 정보를 바탕으로 무증상 감염자를 예측한다. 연구진은 Eva 알고리즘이 "기존 방식보다 무증상 감염자를 더 정확하고 많이 찾는다"고 강조했다. 일반적으로 사용하는 무작위 테스트 또는 국적에 따른 선별 검사보다 기능이 우수하다는 의미다.

Eva 알고리즘, 어떻게 무증상 감염자 고르나?

Eva를 통한 코로나 검사 과정 (출처=Nature)
Eva를 통한 코로나 검사 과정 (출처=Nature)

그리스에 방문하는 외국인 여행객은 공항, 국경 검문소, 항구에 도착하기 하루 전, PLF(Passenger Locator Form)을 작성해야 한다. PLF란 일부 국가에서 외국인 여행객에 대한 세부 정보를 얻기 위해 사용하는 양식이다. 일반적으로 성별, 연락처, 입국 목적, 숙박 세부 정보 등을 요청한다.

Eva는 모아둔 PLF 정보와 과거 승객 검사 결과를 가지고 여행자별 코로나 유병률을 측정한다. 이를 바탕으로 누구를 검사해야 하는지 직접 선별한다. Eva가 고른 입국자는 최대 2일 자가 격리한다. 그동안 의료진은 코로나 검사를 진행한다. 

검사 결과가 양성이면 격리되거나 추적 검사를 실시한다. 음성이 나오면 무사히 입국할 수 있다. 코로나 검사 결과에서 받은 데이터는 Eva에 그대로 저장한다. 풍부한 데이터로 Eva 기능을 개선함으로써, 높은 예측률을 달성하기 위함이다.

Eva는 의미 없는 데이터까지 저장하는 게 특징이다. 연구를 주도한 드라코풀로스(Drakopoulos) 교수는 "코로나는 우리가 예측할 수 없는 질병이다"며 "현재는 무의미하지만, 향후에는 유용한 데이터가 될 수 있다"고 말했다. Eva가 볼 수 없는 '데이터 사각지대(Blind spot)' 발생과 공공의료에 미칠 악영향을 미리 예방하자는 차원이다.  

GDPR 규정대로 만들었더니...데이터 수집 제한

미 유에스씨 뉴스(USC News) 22일자 보도에 따르면, Eva는 EU의 일반 데이터 보호 규정(GDPR)대로 만들어졌다. 윤리적인 문제를 피하기 위해서다. 연구진은 "개인 정보 전문 변호사와 학자를 만나 시스템 설계에 대해 직접 자문도 받았다"고 말했다.

GDPR 규정대로 설계해 윤리적 문제는 피했지만, Eva에 사용할 수 있는 데이터는 제한된 실정이다. 개인 정보 보호를 위해 Eva에 개인 데이터를 의도적으로 제한했다는 의미다. 이러한 규제는 궁극적으로 "예측할 수 없는 코로나19 상황으로부터 국민 건강을 보호할 수 있는 Eva의 장점을 해칠 수 있다"고 네이처는 24일 밝혔다. 

키몬 드라코풀로스(Kimon Drakopoulos)교수. (출처=USC Marshall)
키몬 드라코풀로스(Kimon Drakopoulos)교수. (출처=USC Marshall)

드라코풀로스(Drakopoulos) 교수는 AI 타임스와의 이메일 인터뷰에서 "많은 데이터를 모아 더 높은 유병률을 예측할 수 있음에도, Eva는 제한된 수의 데이터만 사용할 수 있다"고 말했다. "이는 알고리즘 예측 기능을 제한한다"며 "Eva가 가진 유일한 기술적 한계다"고 밝혔다. 

그는 "Eva 알고리즘 기술보다는, AI 거버넌스의 문제다"고 말했다. "머신러닝이 윤리와 프라이버시를 얼마나 존중하는지 정부가 직접 평가해야 한다"며 "해당 알고리즘 시스템에 맞는 규제를 해야 한다"고 강조했다.

한편, Eva알고리즘은 2020년 여름 드라코풀로스 교수가 키리아코스 마초타키스(Kyriakos Mitsotakis) 총리에 보낸 메일 한 통에서 시작했다고 유에스씨 뉴스(USC News)는 22일 보도했다. 코로나 확진자가 폭발적으로 증가하고 있음에도 여행객을 받겠다는 그리스 정부 정책에 의구심이 들어서다. 그는 총리에게 "국경을 연 후 앞으로의 계획은 있는지, 혹시 도울 건 없는지" 물었다. 총리는 바로 "정부는 도움이 필요하다 답했다"고 유에스씨 뉴스가 보도했다.

드라코풀로스 교수는 즉시 와튼스쿨 바스타니 교수와 'Eva 개발 프로젝트'에 착수했다. 수개월동안 정부 코로나 과학 기관과 협업한 끝에 Eva가 탄생하게 됐다.

AI타임스 김미정 기자 kimj7521@aitimes.com

[관련 기사] 의료분야에 AI 도입이 지연되는 이유 ..."기술개발보다 실제 적용에 대한 연구를 해야"

[관련 기사] 어느 병원에서도 의사들 내 진료기록 보고 '아하~'…광주시가 앞당기는 AI 스마트 의료시대

키워드 관련기사
  • 미래AI에게 어떻게 법인격 부여할까... 과기부, AI 법적지위 논하는 세미나 개최
  • 페이스북AI, GAN 훈련 보강하는 IC-GAN 모델 개발
  • “AI 시대에는 여성과학기술인 일자리 확대될 것"