빅테크 기업 사이에서 부는 초거대 AI 바람
국내 빅테크 기업, 자체 초거대 AI 구축 속도
인간 뇌 모방한 AI, 스스로 학습해 사고 가능
초거대 AI 연구 성과 및 상용화 가능성 속출
양극화 문제와 전력 소모 문제는 해결 과제

빅테크 기업 사이에서 초거대 AI를 구축하는 기업이 많아지고 있다. (사진=셔터스톡)

'거거익선'이라는 말은 인공지능(AI) 산업에도 적용된다. 최근 AI 업계에는 하이퍼스케일(Hyperscale) 바람이 불고 있다. 초거대, 초대규모, 초대형이라 불리는 새로운 AI가 등장하면서다. 

초거대 AI는 인간의 뇌 구조를 모방한 AI다. 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 스스로 데이터를 학습하고 사고하며 판단할 수 있다. 현재 가장 사람의 뇌와 유사한 역할을 할 수 있는 AI가 바로 초거대 AI인 셈이다. 대중에게 친숙한 AI인 알파고와 비교하면 초거대 AI는 수천 배 똑똑하다고 평가된다.

처음 초거대 AI가 등장한 건 2020년이다. 오픈AI는 총 1750억 개의 파라미터(매개변수)를 가진 초거대 AI 'GPT-3'를 선보였다. 기존 GPT-1보다 1000배 많고, GPT-2보다 117배에 가까운 파라미터를 탑재했다. 파라미터는 인간의 뇌에서 정보를 학습하고 기억하는 '시냅스'와 유사한 역할을 하는 인공 신경망이다. 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있는 것으로 알려졌다.

GPT-3 이후 엔비디아, 마이크로소프트(MS), 테슬라 등 많은 빅테크 기업은 초거대 AI 개발에 팔을 걷어붙였다. 한국에서의 열기는 더 뜨거웠다. LG, 네이버, 카카오, SKT, KT 등 국내 빅테크 기업은 경쟁적으로 초거대 AI 개발에 나섰다. LG의 엑사원, 네이버의 하이퍼클로바, 카카오의 코지피티·민달리 등이 현재 개발된 국내 초거대 AI다. KT도 올해 상반기 초거대 AI 등장을 예고했다.

국내에서 가장 많은 파라미터를 보유한 AI는 LG AI연구원의 엑사원이다. LG는 처음 엑사원을 공개하며 약 3000억 개의 파라미터를 갖췄다고 밝혔다. 국내에 많이 알려진 네이버의 하이퍼클로바는 2040억 개의 파라미터를 보유하고 있다. 오픈 AI의 GPT-3의 1750억 개보다 많다.

카카오 코지피티의 파라미터는 300억 개다. 다른 기업의 파라미터보다는 적은 숫자다. 이에 대해 김일두 카카오브레인 대표는 "파라미터가 많다고 무조건 좋은 것은 아니다"라고 밝힌 바 있다. 그는 "현재 언어모델 규모의 실용 구간은 60억~800억 개 파라미터로 보고 있는데 이 구간을 넘어서면 데이터를 다루기 어렵고 비용과 시간이 많이 든다"면서 "카카오브레인은 현재 실용적인 구간이 집중하는 것"이라고 말했다.

[관련기사] [분석] 베일 벗은 카카오 초거대 AI ‘KoGPT’, 기존 모델과 비교해보니

초거대 AI, 모두 똑같진 않다

국내에서 선보여진 초거대 AI는 크게 언어모델과 멀티모달(Multimodal)로 나뉜다. 언어모델은 텍스트에 집중된 AI다. 언어 데이터를 학습해 소설, 에세이, 칼럼 등 텍스트로 된 콘텐츠를 창작할 수 있다. 오픈AI의 GPT-3, 네이버 하이퍼클로바, 카카오 코지피티 등이 여기에 속한다. 이중 하이퍼클로바의 경우 GPT-3보다 한국어 데이터를 6500배 이상 많이 학습한 한국어에 특화된 AI로 평가된다.

멀티모달은 영상·이미지·텍스트를 모두 이해하고 사고하는 AI다. 텍스트를 이해해 이미지를 만들 수 있다. LG 엑사원과 카카오의 민달리가 멀티모달 AI다. 단 카카오의 민달리는 텍스트를 이미지로 만드는 것만 가능하지만, 엑사원은 텍스트를 이미지로 만들고, 이미지를 텍스트로 만드는 것이 가능하다. 

[관련기사]LG 초거대 AI '엑사원' 등장...언어와 이미지, 한국어와 영어 같이 다뤄

언어모델과 멀티모달은 쉽게 말해 언어 외 다른 영역을 할 수 있느냐를 기준으로 나뉜다. 기존 언어 모델의 경우 텍스트를 입력하면 이를 이해해 관련된 이미지를 검색해줬다. 멀티모달은 여기서 더 나아가 텍스트에 입력한 정보를 바탕으로 새로운 이미지를 생성한다. AI가 작업한 새로운 이미지가 등장한다고 보면 된다. 예를 들어 엑사원은 텍스트로 '현대의 세련된 거실 인테리어'를 입력하면 기존에 없던 새로운 이미지를 제작해 사용자에게 제공할 수 있다.

엑사원이 '현대의 세련된 거실 인테리어'라는 키워드로 생성해낸 이미지 모습. 모두 실제 이미지가 아닌 엑사원이 만들어낸 이미지다. (사진=LG AI연구원 제공)
엑사원이 '현대의 세련된 거실 인테리어'라는 키워드로 생성해낸 이미지 모습. 모두 실제 이미지가 아닌 엑사원이 만들어낸 이미지다. (사진=LG AI연구원 제공)

물론 초거대 AI를 단순히 언어모델과 멀티모달 두 가지 방향으로 정의하긴 어렵다. 언어모델이 멀티모달로 발전할 수도 있고, 지금 멀티모달이 더 발전된 모습으로 변모할 수도 있다. 네이버에서 하이퍼클로바를 비롯한 AI 원천 기술 개발을 주력하고 있는 클로바 CIC(Company-In-Company)는 지난해 5월 열린 '네이버 AI 나우(NAVER AI NOW)' 행사에서 "앞으로 하이퍼클로바를 한국어 외의 언어로 모델을 확장하고 영상·음성·이미지 등을 이해하는 멀티모달(Multimodal) AI로 발전시켜 나갈 계획"이라고 밝힌 바 있다.

 왜 빅테크 기업만 나설까

초거대 AI는 사실 자본이 있는 빅테크 기업이 아니라면 도전하기 쉽지 않은 영역으로 꼽힌다. 입장료만 1000억원이라는 소리가 있을 정도로 구축 비용이 비싸고 운영단가가 높기 때문이다. 네이버의 경우 하이퍼클로바 개발을 위해 700PF 성능의 슈퍼컴퓨터를 구축한 것으로 알려졌다. 140개의 컴퓨팅 노드를 갖고 있고 장착된 그래픽처리장치(GPU) 수만 1120개에 이른다. 이 정도 인프라를 중소기업이나 연구기관이 갖추긴 쉽지 않다.

국내의 한 AI 스타트업 대표는 "초거대 AI는 사실 빅테크 기업이더라도 경영자의 강력한 의지가 있어야 구축할 수 있는 분야로 꼽힌다"며 "투자한 비용 대비 효과가 아직 명확히 나오지 않았기 때문"이라고 말했다.

값비싼 투자비용이 들지만, 빅테크 기업이 초거대 AI 구축에 나서고 있는 것은 미래 경쟁력 제고를 위한 기반 다지기로 평가된다.

한 AI 스타트업에서 근무하는 관계자는 "초거대 AI를 보유한 기업이 미래 시장에서 경쟁 우위를 점할 수 있다는 얘기가 있다"며 "각 기업들은 지금보다 미래 가치를 위해 초거대 AI에 투자하고 있고, 앞으로 이 시장은 더 성장할 것으로 전망된다"고 말했다.

초거대 AI, 무엇을 할 수 있나

국내 빅테크 기업은 투자 대비 효과에 대한 우려 속에서도 초거대 AI 성과를 계속 내고 있다. 네이버는 하이퍼클로바를 자체 서비스에 도입해 성능을 계속 높여가고 있다. 네이버 검색 서비스는 하이퍼클로바 적용으로 오탈자 자동수정 서비스가 대폭 향상됐다. 네이버 쇼핑은 구매자 댓글을 분석해 사용자에게 정보를 손쉽게 알려주는 기능을 추가했고, 음성기록 서비스 '클로바 노트'는 하이퍼클로바 도입 전과 후의 성능이 확연히 달라졌다.

[관련기사][AI 실생활 체험기] 인터뷰 녹취 작업 1분이면 끝!..네이버 클로바 노트 "유용한데?"

네이버는 하이퍼클로바를 자체 서비스에 도입해 성능을 향상하고 있다. (사진=네이버)

LG AI연구원은 초거대 AI를 상용화할 수 있는 유리한 위치에 선 기업으로 평가된다. LG그룹에 초거대 AI를 적용할 수 있는 계열사가 많고 ▲구글 ▲우리은행 ▲셔터스톡 ▲엘스비어 ▲EBS ▲고려대의료원 ▲한양대병원 ▲브이에이코퍼레이션 등 다양한 분야의 기업과 초거대 AI 상용화를 위한 파트너십을 구축했기 때문이다.

LG AI연구원이 22일 13개 기업과 '엑스퍼트 AI 얼라이언스(Expert AI Alliance)'를 발족했다. (사진=LG AI연구원 행사 캡쳐)
LG AI연구원이 22일 13개 기업과 '엑스퍼트 AI 얼라이언스(Expert AI Alliance)'를 발족했다. (사진=LG AI연구원 행사 캡쳐)

실제로 LG화학은 2월 22일 열린 '엑스퍼트 AI 얼라이언스 워크숍'에서 엑사원을 활용해 수많은 논문과 특허에서 필요한 정보를 빠르게 찾을 수 있는 연구를 하고 있다고 밝혔다. 표, 텍스트, 화학 이미지 등이 많은 논문을 엑사원을 활용해 필요한 정보만 추출하는 기술개발을 추진하고 있다고 설명했다. 이 기술이 완성되면 앞으로 배터리 경쟁력이 될 분리막 소재 연구 등에 속도가 붙을 것으로 전망된다.

LG전자는 엑사원을 제품 피드백 분석과 스마트홈 기반 '나만의 셰프'를 만드는데 사용하겠다고 밝혔고, 우리은행은 고객에게 높은 만족도를 선사할 수 있는 'AI 뱅커'를 만들겠다고 전했다.

[관련기사]LG가 출시한 초거대 AI '엑사원', "넌 무엇을 할 수 있니?"

국내 기업들은 초거대 AI를 활용한 연구 성과도 꾸준히 올리고 있다. 네이버 클로바는 최근 열린 CVPR(국제 컴퓨터 비전 및 패턴인식 학술대회) 2022에서 국내 기업 단일조직으로는 처음으로 14개의 논문을 게재했다. 이중 '서울대-네이버 초대규모 AI 센터'에서 발표한 논문이 2개였다.

LG AI연구원 역시 CVPR에 총 5개의 논문을 게재했는데 이중 1개가 엑사원을 활용한 연구였다. 주요 연구 주제는 이미지와 텍스트 간의 상관관계를 효율적으로 처리할 수 있는 새로운 아키텍처 'L-Verse'에 관한 것이었다. 이 아키텍처는 텍스트-이미지 및 이미지-텍스트를 위한 기능 증강 가변 자동 인코더(AugVAE)와 양방향 자동 회귀 변환기(BiART)로 구성됐다.

초거대 AI가 가진 어두운 이면

초거대 AI가 미래 경쟁력을 높일 수 있는 요소로 꼽히지만 우려되는 부분도 존재한다. 가장 큰 문제는 AI 양극화 문제다. 초거대 AI를 중소기업이나 연구소에서 구축하기 어려운 만큼, AI 업계에서는 자본력에 따른 기술 격차가 발생할 수 있다고 염려한다.

국내의 한 AI 스타트업 대표는 "초거대 AI의 등장은 자본에 따라 기술개발 결과와 속도가 달라질 수 있다는 것을 의미한다"면서 "현재 많은 AI 기업은 실질적인 매출도 내지 못하고 있는 상황인데 여기서 기술 격차까지 발생하면 생존의 위기까지 발생할 것"이라고 염려했다.

LG AI연구원은 이 양극화 문제를 없앨 수 있는 방향으로 사업을 전개할 예정이라고 밝혔다. 엑사원을 기반으로 파트너십 구축을 확대하고 누구나 서비스를 사용할 수 있도록 AI 개발을 진행할 계획이라고 설명했다.

김승환 LG AI연구원 비전랩장 상무는 <AI타임스>와의 인터뷰에서 "초거대 AI를 개발하기 위해서는 엄청난 인프라가 필요한 것은 사실인데 우리는 누구나 서비스를 원하면 사용할 수 있도록 API를 정의해서 AI를 개발하고 있다"고 말했다. 그는 "초거대 AI를 활용한 연구를 넓히기 위해 우수 인재를 대상으로 한 인턴십 프로젝트를 진행하고 있고 대학 연구소와 협력하는 등 다양한 노력도 병행하고 있다"고 밝혔다.

초거대 AI를 운용하는데 발생하는 전력 소모도 문제로 꼽힌다. 보통 초거대 AI를 운용하는데에는 일반 서버 3000대가 사용하는 전력이 필요한 것으로 알려져 있다.

AI 스타트업 관계자는 "최근 대기업들이 ESG 경영을 내세우며 전력 소모를 줄이기 위해 앞장서고 있는데 초거대 AI 운용과 관련해 전력 소모 문제를 어떻게 다룰지에 관한 방안이 있는지 의문"이라며 "AI가 '전기 먹는 하마'라고 불리지 않도록 모든 AI 기업이 전력 소모 문제에도 관심을 기울여야 한다"고 지적했다.

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사][인터뷰] 김승환 LG AI연구원 비전랩장 상무 "초거대 멀티모달 엑사원이 그리는 미래는"

[관련기사]최수연 네이버 신임대표가 강조한 '글로벌'...AI는 이미 일류다

키워드 관련기사
  • LG "AI 제대로 한다"...서정연 서강대 교수·이문태 美 일리노이대 교수 영입
  • LG가 출시한 초거대 AI '엑사원', "넌 무엇을 할 수 있니?"
  • 네이버, 초거대 AI 적용 독거노인 안부 전화 서비스 대구시로 확대