포브스, 차세대 AI 기술로 ▲비지도 학습 ▲연합 학습 ▲트랜스포머 꼽아
비지도 학습, 끊임없이 탐색ㆍ추론하며 AI 스스로 학습
연합 학습, 개인정보보호 이슈 고려한 AI 학습법
트랜스포머, 언어 AI 분야 병렬 처리 가능...효율성 높일 것

 

(사진=셔터스톡)
(사진=셔터스톡)

인공지능(AI) 기술 변화가 빠르게 움직이고 있다. 2012년 열린 이미지넷 챌린지에서 심층신경망(딥러닝)을 구현한 시스템 '알렉스넷' 등장 이후 딥러닝 기술을 이용해 AI 성능을 대폭 상승시켰다. 하지만 이후 딥러닝은 대부분 지도 학습의 결과물로 머물렀다.

지난달 27일 소프트웨어정책연구소(SPRi)가 발표한 'SPRi AI BRIEF : 인공지능 최신 동향과 시사점' 보고서에 따르면, 차세대 AI 기술은 인간처럼 복잡한 문제를 해결할 수 있어야 하며 기술 발전에 개인정보보호 확대를 고려해야 한다.

AI 기술의 발전 속도는 계속해서 빨라지고 있으나 현재 최첨단으로 각광받고 있는 AI 기술ㆍ서비스가 미래 시대까지 신기술로 대접받을 수 있을 지 미지수다.

이에 포브스는 지난달 12일 차세대 AI 기술을 이끌 3가지를 선정해 소개했다.

1. 비지도 학습(unsupervised Learning)

현재까지 AI 분야에서 지배적인 패러다임은 지도 학습이다. 지도 학습은 인간 감독자가 정답이 정해진 데이터를 적용해 AI를 학습시키는 방법이다. 지도 학습 속에서 AI 모델은 인간이 미리 정의한 범주에 따라 큐레이션한다.

하지만 지도 학습의 경우 사람이 직접 수작업으로 데이터 라벨링을 수행해 머신러닝(ML)을 구현하기까지 많은 시간과 비용이 든다.

또 인간이 정의한 방식대로 학습하기 때문에 편협하고 제한적인 형태의 학습을 보인다. 주어진 데이터 집합의 잠재적 정보를 탐구하지 못하며 인간 감독자가 사전에 파악한 개념과 범주에 한정해 학습한다.

이에 대다수 AI 전문가는 비지도 학습이 미래 AI 기술로 꼽는다. 비지도 학습은 텍스트, 영상 등 다양한 데이터를 바탕으로 패턴과 관계를 관찰하고 시스템 스스로 환경을 이해한다. 정교한 데이터 라벨링 작업이 필요하지 않아 빠른 학습이 가능하다.

SPRi 보고서는 비지도 학습이 모든 정보로부터 모든 것을 예측하는 것으로 이해할 수 있다며 끊임없이 탐색하고 추론하는 과정을 연속한다고 설명했다.

비지도 학습은 자연어 처리(NLP) 분야 발전에 큰 영향을 끼쳤으며, AI 분야 전반에서 비지도 학습 접목을 시도하고 있다. 자율주행 소프트웨어(SW) 스타트업 헬름닷에이아이는 자율주행차 산업에 비지도 학습을 적용할 목표로 다양한 연구를 수행 중이다.

딥러닝 분야의 대표적 선구자 얀 르쿤 뉴욕대 컴퓨터공학 박사는 "차세대 AI 혁명은 감독받지 않을 것이다"라며 "딥러닝은 ML과 AI 분야에서 가장 큰 도전이다"라고 말했다.

2. 연합 학습(federated learning)

연합 학습은 지난 2017년 구글 연구진이 처음으로 공식화한 개념으로 개인정보보호를 강화한 AI 학습 방식이다.

일반적으로 딥러닝은 학습 데이터를 클라우드나 서버 등 한 곳에 집중한 뒤 학습한다. 하지만 국가별 개인정보 보호 정책이 달라 전 세계 데이터를 한 곳에 모으는 데 한계가 있다. 따라서 대규모 데이터 확보가 어렵다.

연합 학습은 다수 소형 장치를 활용해 AI 모델을 학습시키는 방식이다. 이에 한 곳에 데이터를 집중할 필요가 없어 기존 딥러닝 방식보다 개인정보 보호를 강화한다.

포브스는 연합 학습 적용이 가장 유망한 분야로 의료를 꼽았다. 헬스케어 분야는 AI 기술 활용 사례가 많다. 하지만 많은 사람이 환자 식별 가능 정보를 비롯한 의료 데이터 보호에 민감하다. 미국 의료 정보 보호법(HIPAA)을 비롯한 다양한 국제적 규제가 의료 데이터 이동ㆍ활용을 제한한다.

하지만 연합 학습을 적용할 경우 민감 정보를 정보 근원지에서 이동시키지 않고 의료 AI 개발에 활용할 수 있다. 연합 학습을 바탕으로 한 헬스케어 스타트업도 등장하고 있으며 파리에 본사를 둔 오우킨이 대표적이다.

3. 트랜스포머(transformer)

트랜스포머는 2017년 구글이 처음으로 제안한 기술로 언어 AI를 위한 핵심이다. 최근 이슈로 떠오른 언어 AI 모델 GPT-3의 기술적 기반이기도 하다.

이전까지 NLP 분야는 반복적인 신경망 기술을 바탕으로 했다. 반복적 신경망은 데이터를 순차적으로 처리한다. 단어가 나타나는 순서에 따라 한 단어씩 처리한 것이다.

하지만 트랜스포머는 병렬 방식으로 언어 처리를 하기 때문에 주어진 텍스트를 동시에 분석한다. 트랜스포머는 병렬화 지원을 위해 '어텐션(Attention)'이란 AI 메커니즘에 의존한다. 어텐션은 AI 모델이 단어 사이 관계를 고려할 수 있도록 한다.

트랜스포머의 병렬 처리 능력은 연산 성능을 효율적으로 만들기 때문에 대규모 데이터를 바탕으로 한 학습을 보다 수월하게 한다.

포브스는 구글과 페이스북 등 주요 AI 기업이 트랜스포머 모델 생산을 시작했으나 대부분 기술을 제품화ㆍ상용화하는 데 초기 단계라고 설명했다.

하지만 매체는 트랜스포머가 NLP 분야를 시작으로 향후 몇 년 동안 차세대 AI 역량의 토대가 될 것이라고 기대했다.

 

[관련 기사]인공지능 GPT가 시나리오를 썼다, 단편영화 개봉박두!

[관련 기사]GPT3 능가하는 자연어 모델 훈련 알고리즘 등장

키워드 관련기사
  • 'AI 대부' 요슈아 벤지오·얀 르쿤은 삼성 AI 포럼에서 무슨 말을 했나?
  • ETRI, 40Gbps급 데이터 전송 가능한 네트워크 기술 개발