AI업계 여성 비율이 적은 이유, 학습 데이터가 남성 위주 탓 있어
AI의 왜곡된 데이터 학습이 AI 연구에 여성 필수적인 이유로 작용
성별 격차 해소 방법은 성별에 따라 세분화된 데이터 수집 필요해

(출처=셔터스톡)
(출처=셔터스톡)

지난 17일 여성가족부는 지난해에 실시한 특정 성별 영향평가 결과, 10개 주요정책에 대해 관계부처에 정책 개선을 권고했다고 밝혔다.

특정 성별 영향평가는 여가부가 양성평등 실현을 위해 개선이 필요한 중앙행정기관과 지방자치단체 등의 정책을 평가해 개선이 필요한 사항에 대해 해당 기관에 권고하는 제도다.

그런데, 학교 폭력, 자살 예방 등 기존의 정책 개선이 주를 이룬 개선 권고 중에 눈에 띄는 항목 중의 하나가 인공지능 전문 인력에 대한 것이다.

여가부에 따르면, 인공지능(AI)의 확산은 사회 문제 해결에 기여하고 있으나, 그 과정에서 성차별과 혐오 표현 등 부작용이 발생한다. 뿐만 아니라, 참여 인력의 성별 다양성 등이 부족해 대한 개선이 필요한 것으로 나타났다.

아울러, 인공지능 기업의 소프트웨어 전문 인력 여성 비율은 19.1%이며, 이중 대표자 여성 비율은 3.1%에 불과하다.

이에 인공지능 학습 데이터 기획·구축 과정에서 성별 등 다양성을 반영하고, 산업계와 학계 등이 구체적인 윤리 기준을 마련해 인공지능 산업 인력에 대한 성별 현황 관리 및 참여 확대가 필요하다는 것이 여가부의 권고 사항이다.

인공지능 성차별 현상은 외국도 예외가 아니다. 한 연구에 따르면, 인공지능 분야의 연구 개발에 참여하는 여성 비율이 매우 낮은 것으로 나타났는데 이중 AI 논문 수를 성별로 나누면, 여성은 18% 정도이며, AI 연구 교수직 중에서 여성은 20%일 뿐이다.

이런 현실은 여성들이 AI 분야에서마저 성차별을 경험하는 원인이 된다는 지적이 일고 있다.

AI, 성별 격차 확대 가능성 있어

비즈니스 소셜 네트워크 서비스 링크드 인(LinkedIn)은 세계 경제 포럼과 협력해 인공지능 분야의 성별 격차 실태를 분석했다.

지난 2018년 12월 11일 링크드 인의 공공정책과 경제 부문을 맡고 있는 슈 듀크(Sue Duke) 수석 팀장은 세계경제포럼 웹사이트에 올린 글에서 이 보고서에 대해 다음과 같이 설명했다.

해마다 세계 경제 포럼의 세계 성별 격차 보고서는 직업 세계의 성 평등 상태를 조사한다. 올해 이 보고서는 전 세계 성별 격차가 약간 좁혀졌지만, 노동력에 참여하는 여성은 더 적다는 것을 발견했다.

AI 기술에 대한 수요가 점점 더 많은 산업으로 확대됨에 따라 기술 부문에 종종 영향을 미치는 성별 및 형평성 격차를 영구화하고, 더 확대할 수 있는 위험이 있다고 그녀는 강조했다.

링크드 인의 분석에 따르면, 전 세계 AI 전문가 중 22%만이 여성으로 여성 AI 전문가와 남성 전문가 사이에 상당한 차이가 있는 것으로 나타났다.

더불어 이 격차가 좁혀지고 있다는 징후를 보여주지 않는다고 주장했다.

지난 4년 동안 남성과 여성은 비슷한 비율로 그들의 프로필에 인공지능 기술을 추가해 왔다. 이는 여성들이 더 뒤처지지는 않지만 따라잡지도 못하고 있다는 것을 의미한다.

만약 현재의 추세가 지속된다면, 두 성별 모두 인공지능 기술을 계속 습득하고 있음에도 불구하고, 남성 인공지능 전문가들은 계속해서 여성들보다 수가 더 많아질 것이라고 그녀는 평가했다.

슈 수석 팀장은 “우리의 연구는 여성 AI 전문가들이 비영리, 의료 및 교육 분야 등과 같이 이미 상대적으로 여성 비율이 높은 기존의 여성 업종에서 일할 가능성이 더 크다는 걸 의미한다”고 밝혔다.

또 “여성들은 인공지능 기술에 관한 한, 성장하고 있지만 얻지 못하고 있다”고 덧붙였다.

즉, 남성과 여성이 비슷한 비율로 인공지능 기술을 습득하고 있지만, 그 분야의 성 불균형은 지속될 가능성이 있다는 주장이다.

“성비 불균형의 고리를 끊기 위해선 그들의 모든 직업 단계에서 여성들이 새로운 기술 개발과 사용에 적극적으로 참여하는 것이 매우 중요하다”고 역설했다.

여성이란 단어만 보여도 감점

인공지능이 하는 의사결정이 남성 우위를 그대로 보여주는 사례도 있다. 거대 기업 아마존이 바로 그런 경우다.

지난 2018년 10월 11일 실리콘 리퍼블릭(Silicon republic)은 아마존이 성 차별적이고 여성 지원자들을 차별한다는 이유로, AI 채용 수단을 폐기해야 했다고 로이터 통신을 인용해 보도했다.

로이터 통신 보도에 따르면 완벽한 인공지능 채용 도구를 만들려는 아마존의 희망은 알고리즘에 크고 눈에 띄는 오류가 하나 있다는 것을 깨닫고 무너졌다.

지난 2014년에 아마존의 AI 프로그래머들은 입사 지원서를 꼼꼼히 살펴보는 채용 알고리즘을 만들었다. 이 도구는 머신 러닝을 사용해 각 지원자를 1에서 5개의 별 등으로 평가하는 시스템이었다.

그러나 2015년까지 이 알고리즘이 성별에 따라 차별된다는 것이 명백해졌는데 이 컴퓨터 모델은 지난 10년 동안 아마존에 제출된 이력서의 패턴을 분석해 후보자를 평가하도록 학습받았다.

역사적으로 기술 산업이 남성 위주였음을 감안할 때 컴퓨터가 관찰한 대부분의 데이터는 남성들에게서 온 것이 분명했다.

그 후, 이 채용 시스템은 남성 후보자들이 선호된다는 것을 스스로 깨달았는데 ‘여성 농구팀’이나 ‘여성 체스 클럽’ 등과 같은 활동 이력이 쓰여 있어도 여성 지원자에게 불이익을 주었다. 실제로 로이터 통신과 인터뷰한 프로그래머들은 AI가 두 개의 여대 졸업생들을 강등시켰다고 말했다.

경영진들은 이 채용 프로젝트에 희망이 없음을 깨달은 후 지난 2015년에 프로그래밍팀을 해체했다고 로이터 통신이 보도했다.

아마존 관계자는 “우리의 채용 담당자들이 지원자들을 평가하는 데 이 도구를 사용한 적이 없다”라고 말했지만, 회사의 채용 담당자들은 채용 시에 이 도구에 의해 생성된 추천서를 검토했다고 말했다. 회사는 그 문제에 대해 더 이상의 언급을 피했다.

AI 업계, 성비 불균형 심각해

인공지능 업계의 여성이 부족하다는 지적은 여러 연구 결과가 뒷받침하고 있다.

지난 2019년 4월 17일 영국의 더 가디언은 AI 산업의 다양성 부족이 편견을 지속시킨다는 연구 결과를 보도했다.

뉴욕대 연구센터가 발표한 새로운 연구 결과에 따르면 AI 교수의 80% 이상이 남성이며, 페이스북 AI 연구원의 15%, 구글 AI 연구원의 10%만이 여성이다. 더불어, 미 국립과학원에 따르면 여성은 2015년에 컴퓨터 및 정보과학 분야의 24%만 차지했다.

그런데 AI 업계의 여성 부족은 오히려 여성 비율을 향후 더 낮추도록 작용하기 때문에 이를 위해 여성 인력이 더 필수적이란 분석이 있다.

지난 20일 라이프스타일 기술 사이트인 ‘위민 러브 테크’(Women Love Tech)는 “인공지능 연구에 더 많은 여성이 필요한 이유”란 제하의 특집을 다뤘다.

이 기사에 따르면 오늘날 기술 산업에서 여성들은 여전히 크게 대접받지 못하고 있으며, 지난 몇 년 동안 STEM(과학, 기술, 엔지니어링 및 수학) 분야에서 경력을 쌓아야 한다는 압박에도 불구하고, 여전히 극히 적은 수의 여성 비율을 차지하고 있다.

아울러, 전 세계에서 STEM에 초점을 맞춘 연구를 하는 사람 중 여성은 30% 미만이다. 불행하게도 스마트 기술과 인공지능 분야에서 일하는 여성들로 초점을 좁히면 그 숫자는 훨씬 더 작아진다.

위민 러브 테크는 이 현상의 문제점으로 인공지능의 학습 데이터를 꼬집었다. 즉, 본질적으로 기계는 편향된 것이 아니지만 인간은 편향돼있다. 인간이 기계에 학습하는 방법을 가르치면 인간의 편견은 자연스럽게 코드의 일부가 된다는 주장이다.

만약에 인공지능 기술을 사용하는 대부분 사람이 남자라면 AI의 모든 것은 남자들의 시각으로 기울어 여성은 더 부족하게 될 것이며, 이것은 미래가 아니라 현실이라고 지적했다. 또 이런 왜곡된 결과는 AI 연구에 여성이 필수적인 이유가 된다고 주장했다.

남성 위주의 데이터는 위험해

지난해 9월 25일 ITU News는 ‘보이지 않는 여성: 남성을 위해 디자인된 세상에서 데이터 편견을 드러내기’라는 책의 저자인 캐롤라인 크리아도 페레즈(Caroline Criado Perez)에 대해 소개했다.

이 책에서 페레즈는 “남성용 데이터를 사용해 건설되고, 설계된 현실 세계는 인구 절반의 요구를 무시한다”라며, “이는 모든 인류가 직면하고 있는 도전을 해결하기 위해 인공지능을 이용할 때조차도 사실”이라고 말했다.

2020 AI 혁신의 날 기조연설에서 크리아도 페레즈는 경제 데이터부터 도시 계획 데이터, 의료 데이터 등에 이르기까지 성별 데이터 격차는 모든 정보를 전 세계적으로 남성에게서 수집한 현상이라고 말했다.

또 “데이터를 수집하고, 성별에 따라 구분하지 않으면, 서로 다른 그룹에 대해 무엇이 효과가 있고, 무엇이 효과가 없는지 알 수 없다”며, “AI가 모든 결과를 개선하려면 성별 분리 데이터를 수집해 격차를 해결하는 것이 필수적이다”고 그녀는 밝혔다.

크리아도 페레즈에 따르면 여성의 문제를 정의하고 해결하기 위해 남성 신체와 라이프스타일의 데이터에 의존하는 것은 불편할 뿐만 아니라 안전하지 않을 수 있다.

또 남성 위주의 데이터 세트에 의해 훈련된 알고리즘은 모든 사람에게 정확한 위험과 결과를 예측하지 못한다. 일례로, 심장 마비를 예측하기 위해 고안된 성(性) 중립적인 알고리즘을 제안했지만, 데이터에서 결함이 발견됐다.

AI의 성 편견과 데이터 격차의 또 다른 단점은 그것들을 증폭시킨다는 것이라고 페레즈는 지적했다.

그는 요리 사진들이 들어 있는 데이터 세트에 의해 훈련된 알고리즘은 부엌의 사진을 68%의 여성과 연결시켰다는 사례를 들며, “의도적으로 편향된 이미지 인식 소프트웨어가 결국 더 강한 성차별적 연관성을 만든다”고 주장했다.

“성별 데이터 격차를 어떻게 메울까요?”란 질문에 그는 “편향된 데이터가 인공지능에 사용될 때, 세계에 만연한 불평등을 증가시킬 것”이라고 지적하며, “격차를 해소하는 한 가지 방법은 성별에 따라 세분화된 더 많은 데이터를 수집하는 것”이라고 밝혔다.

AI타임스 조행만 객원기자 chohang5@kakao.com 

[관련 기사]마이크로소프트, 아태지역서 IT 분야 여성인재 발굴 프로그램 선보여

[관련 기사]“AI 시대에는 여성과학기술인 일자리 확대될 것"

키워드 관련기사
  • 국립소방연구원 "화재 탐지와 인명구조에 AI 적용 증가...적용반경 확장은 과제"
  • '무인이동체 산업엑스포' 가보니...첨단기술 사용한 국방부 무기 체계 돋보여
  • [김승일 칼럼] AI 리터러시 (3) : 인공지능 시대에서 살아남기