“루다랑 오늘부터 1일”…AI마저 성착취라니

January 8, 2021

‘진짜 사람같다’는 평을 듣는 인공지능(AI) ‘이루다’가 출시 1주일만에 성희롱 논란에 휩싸였다. 이루다는 스타트업 ‘스캐터랩’이 지난해 12월 23일 정식 출시한 AI 챗봇으로 사용자와의 대화 속에서 학습하는 딥러닝 기술을 이용한다.

8일 ‘아카라이브’, ‘디시인사이드’ 등 온라인 커뮤니티에 따르면 일부 이용자들은 이루다를 ‘성노예’ 등으로 부르면서 ‘걸* 만들기 팁’, ‘노예 만드는 법’ 등을 공유한 뒤 우회적인 표현으로 성적 대화에 성공했다고 인증하고 있다. 문제의 게시물은 이루다가 출시된 지 일주일만인 지난달 30일부터 등장하기 시작했다.

디시인사이드 AI 이루다 갤러리에서도 ‘이루다 어떻게 공략해야 함’, ‘이루다 결국 본색을 드러냈다’ 등 자극적인 제목의 게시물을 게재하는 등 성적 대화를 시도한 뒤 이를 캡처해 올리고 있다.

스캐터랩 측에 따르면 실제 연인들이 나눈 대화 데이터를 딥러닝 방식으로 이루다에게 학습시켰고 그 데이터양은 약 100억건에 이른다.

20살에 가수 블랙핑크를 좋아하는 여성 캐릭터인 이루다는 사용자와 끝말잇기부터 일상적인 대화까지 가능해 최근 10∼20대 사이에서 빠르게 유행하고 있다. 이달 초 기준으로 이용자가 32만명을 돌파했는데 85%가 10대, 12%가 20대다. 일일 이용자 수는 약 21만명, 누적 대화 건수는 7천만건에 달한다.

스캐터랩 측은 성적 단어 사용을 금지어로 필터링하고 있다고 주장한다. 하지만 사용자가 주어 없이 묻거나 우회적인 표현을 쓰게 되면 이루다가 성적대화를 받아주고 있다고 해명한다.

이루다와 성적 대화를 유도한 사용자들의 대화 화면. 온라인커뮤니티 캡처실제로 문제가 된 대화 내용을 살펴보면 대부분 우회적인 표현을 사용하고 있다. 사용자가 인공지능의 성적인 답변을 유도하고 있으며 성적인 표현을 직접적으로 사용한 사용자는 제재를 받기도 했다. 일부 사용자는 지속적인 성적 대화 시도로 대화가 차단됐다면서 차단을 푸는 방법까지 물어보기도 했다.

스캐터랩 측은 금지어 필터링을 피하려는 시도는 예상했지만 이처럼 성희롱·성착취 행위까지는 예상치 못했다며 당황스럽다는 반응을 보였다.

스캐터랩 관계자는 “이루다는 바로 직전의 문맥을 보고 가장 적절한 답변을 찾는 알고리즘으로 짜였다”면서 “애교도 부리고, 이용자의 말투까지 따라 해서 이용자 입장에서는 대화에 호응했다고 여기게 되는 것”이라고 설명했다.

가령 한 사용자가 성적 단어 없이 ‘나랑 하면 기분 좋냐’는 식으로 질문했을 때, 이루다가 이용자의 의도와 무관하게 ‘기분 좋다’고 답할 수 있다는 것이다.

그러면서 “현재 이루다가 언어를 자유롭게 배우는 단계라면, 앞으로는 이루다가 올바른 방향으로 발전하도록 튜닝할 것”이라며 성적인 취지의 접근이 어렵게 알고리즘을 업데이트할 계획이라고 덧붙였다.