FAIR, 16일 최신 정보 기반 챗봇 블렌더봇 2.0 개발, 오픈소스에 공개
대화 중 인터넷 최신 정보 검색 후 장기 메모리 저장...기존 챗봇 단점 보완
GPT-3와 블렌더봇 1.0, 새로운 정보저장 불가능,모델 생성시 학습정보에 머물러 있어

16일(현지시간) 페이스북 AI 블로그(링크)에 따르면, 페이스북 AI 리서치(FAIR)는 실시간 접속 가능한 장기기억장치 구축을 통해 최신 정보 기반 챗봇 블렌더봇(BlenderBot) 2.0을 개발하고 이를 오픈소스에 공개했다.

블렌더봇 2.0은 실시간 인터넷 검색을 통해 상대방의 질문에 답한다. (사진=Facebook AI 블로그)
블렌더봇 2.0은 실시간 인터넷 검색을 통해 상대방의 질문에 답한다. (사진=Facebook AI 블로그)


◆ 페이스북 챗봇 블렌더봇 2.0

블렌더봇 2.0은 성격, 공감, 지식과 같은 여러 대화 기술이 결합된 단일 시스템이다.
사람들과 대화할 때 블렌더봇 2.0은 이전 버전보다 여러 대화 주제에 대해 더 많은 지식을 갖춰 장시간 사람과 대화 가능하다.

이 모델은 대화 중에 수집한 최신 정보를 취합해 장기 메모리에 저장한다. 챗봇은 저장된 지식을 며칠, 몇 주 또는 몇 개월 동안 이어질 수 있는 지속적인 대화에 활용할 수 있다. 대화 중 챗봇은 사람들의 질문과 의견에 대답할 때 상황에 맞는 인터넷 검색 쿼리를 생성하고 정보를 통합할 수 있다. 

블렌더봇 2.0은 대화중 인터넷을 통해 최신 정보를 저장하고 대화를 확대해 나갈 수 있다는 점에서 대화형 시스템의 단점을 극복했다고 볼 수 있다. 페이스북 AI는 블렌더봇 2.0의 기술이 일상생활과 비즈니스에 유용하게 활용될 것이라고 예측했다.

◆ GPT-3와 블렌더봇 1.0의 한계

GPT-3와 블렌더봇1.0과 같은 자언어 생성(NLP) 모델들은 진행 중인 대화에서 자신들을 명확하게 표현하고 사실에 기반한 문장을 생성할 수 있다. 하지만 대화를 통해 얻은 새로운 정보를 저장하지 못하고 모델 생성 당시 학습했던 정보에 머물러 있다는 한계가 있다.

예를 들어, GPT-3와 블렌더봇 1.0은 톰 브래디가 여전히 뉴잉글랜드 패트리어츠 소속이며 2021년 탬파베이 버캐너스와의 대결로 슈퍼볼 우승을 한 사실을 모른다. 마찬가지로 과거 인기 TV 쇼와 영화에 대해서는 알지만 최근 방영된 TV 시리즈는 모른다.

GPT-3는 기존에 학습한 톰 브래디의 2017년 정보까지만 답할 수 있다. 반면, 블렌더봇 2.0은 인터넷을 활용해 톰 브래디의 최근 소식을 저장하고 대답한다. (사진= Facebook AI 블로그)

만약 사람이 GPT-3나 블렌더봇 1.0에게 새로운 정보를 말해도 저장되지 않는다. 다음 날 같은 정보에 대해 다시 물어봐도 기존 챗봇은 대답을 내놓지 못한다. 혹은 알고리즘 결함으로 잘못된 데이터를 학습한 뒤, 옳지 않은 정보를 사실로 받아들이는 환각을 일으키기도 한다.

◆ 블렌더봇 2.0 학습 과정

페이스북 AI 대화형 챗봇 블렌더봇 2.0은 다양한 형태의 대화 모델을 공유하고 학습, 평가하기 위해 오픈소스 통합 플랫폼 팔에이아이(ParlAI)를 기반으로 한다. 또, 환각을 줄이기 위해 블렌더봇 2.0은 공감, 지식, 성격 등 다양한 대화 기술이 혼합된 AI 챗봇 블렌더봇 1.0 기술을 기반으로 한다.

블렌더봇 2.0은 자연어 처리(NLP) 모델 생성을 간소화하는 검색 증강 생성(Retrieval Augmented Generation) 모델을 기반으로 한다. 이 접근 방식은 대화 도중 획득한 지식은 물론 인터넷 검색을 통해 정보를 최신화한다. 대화중 정보 검색 기능과 시퀀스 대 시퀀스(seq2seq) 생성기를 결합한 블렌더봇 2.0 모델은 장기 메모리와 인터넷 검색을 통해 정보를 찾는다.

 *시퀀스 대 시퀀스(seq2seq) : 자연어 처리에 활용되는 기계 학습 기반 모델. 한 도메인의 시퀀스에서 다른 도메인의 시퀀스로 변환시켜주는 모델.

이를 위해 대화 도중 정보 관련 키워드 검색 쿼리를 생성하는 신경망 모듈로 기존 인코더-디코더 구조를 보강한다. 그런 다음 블렌더봇 2.0은 퓨전 인 디코더(Fusion-in-Decoder) 방법을 사용해 인코딩된 대화 기록에 새로운 정보를 추가한다.

블렌더봇 2.0이 최신 정보를 저장하고 대화에 활용하는 방법을 구조화. (사진=Facebook AI 블로그)
블렌더봇 2.0이 대화를 통해 알게된 정보를 저장하고 코드화하는 방법. (사진=Facebook AI 블로그)

마지막으로, 부호화한 지식을 활용해 블렌더봇 2.0은 대화에 맞는 응답을 생성하며 장기기억 저장소에 무엇을 추가할지 결정한다. 또, 이 챗봇은 대화 맥락에 기초해 새 정보를 저장할 메모리를 계산하는 등 추가 신경 모듈을 갖고 있다.

블렌더봇 2.0은 실시간 인터넷 검색에 기반해 세상의 정보와 모든 주제에 대한 정교한 대화를 동시에 구사할 수 있는 혁신적인 대화형 인공지능으로 평가된다.

페이스북 AI 측은 "우리는 인간이 보는 것처럼 의사소통과 이해를 위해 상대의 질문에 대답뿐만 아니라 스스로 말할 수 있는 날을 기대한다. 우리는 블렌더봇 2.0 다음 단계로 AI 가상의 조수나 디지털 친구로 나아갈 수 있다고 생각한다."라고 밝혔다. 

 

AI타임스 정윤아 기자 donglee0408@aitimes.com

[관련 기사] "가상 인간 로지의 비밀을 공개합니다" ...싸이더스 스튜디오 엑스 김진수 이사 인터뷰

[관련 기사] 페이스북AI, 지형 변화에도 적응하는 AI 기술 개발...중국 스타트업 로봇에 적용

키워드 관련기사
  • SKT '누구 케어콜', 300만 콜 돌파…AI로 코로나 방역 앞장서
  • 구글 코리아, 온라인으로 '머신러닝 개발자 부트캠프' 시행
  • 산업계 인공 지능 활용, 잠재력 만큼 편견의 장벽도 높다