신문은 선생님

[IT·AI·로봇] 문맥까지 읽어내며, 대화하는 로봇… 사람인줄 깜빡 속죠

입력 : 2018.08.14 03:05

챗봇(Chatbot)

얼마 전 우리나라에서 인공지능(AI)을 이용한 소설 공모전이 열렸어요. 기존 소설에 나오는 문장 수백만 개를 입력해 인공지능이 학습하도록 한 후 사람이 도입부나 인물 정보를 입력하면 그에 맞게 창작하는 원리예요. 인공지능으로 글을 쓸 수 있는 시대가 오는 거죠.

인공지능 기술로 사람과 전화 통화하는 기술도 있습니다. 최근 구글은 인공지능 비서 '구글 어시스턴트'를 선보였어요. "미용실에서 머리를 하려고 하니 예약을 잡아 달라"고 하자 구글 어시스턴트는 능청맞게 미용실 직원과 통화해 약속을 잡았어요. 전화를 받은 미용실 직원은 컴퓨터가 전화했음을 알지 못했어요. 인공지능이 사람과 비슷한 목소리로 대화를 나누는 모습에 탄성이 터졌어요.

◇문법 정확하지 않아도 대화 가능

구글뿐 아니라 이미 여러 회사가 사람과 컴퓨터 사이 자연스러운 대화를 나누는 기술들을 서비스에 활용하고 있습니다. 이를 이용한 서비스도 많이 나오는데 그중 하나가 메신저로 대화하는 로봇, '챗봇(Chatbot)'이지요. 챗봇은 기본적으로 컴퓨터가 사람 말을 알아들을 수 있어야 해요.

이를 '자연어 처리'라고 하죠. 자연어는 기계나 학문을 위한 말이 아니라 사람이 말하는 자연스러운 언어를 말합니다. '그게 뭐 특별한가?'라고 생각할 수 있지만 자연어는 우리 뇌의 우수성을 알 수 있는 증거이기도 합니다. 우리는 흔히 정확한 문법을 쓰지 않더라도 말 속에 섞인 의도를 알아챌 수 있지요. 엄마가 "숙제는?"이라고 말하면 우리는 숙제를 다 했느냐는 뜻인지 알 수 있지만 컴퓨터는 이게 무슨 말인가 할 거예요.

그래서 문장을 효과적으로 쪼개고 말 속에서 가장 중요한 단어와 의도를 읽어내는 것이 중요합니다. 배달 챗봇에 "짜장면 두 개!"라고 치면 '짜장면'을 '두 개 주문한다'는 생각을 딱 알아채야 하죠. 챗봇이 자연스럽게 이야기를 알아듣기 전에는 어떻게 했을까요? 이제까지는 명령어 기반의 대화를 시도했는데 "짜장면을 두 개 주문하겠습니다"처럼 미리 정해진 어법에 따라서 정확히 이야기해야 했습니다. 마치 프로그램을 코딩하는 것처럼 말이지요.

◇머신러닝 기술 더해지며 더 똑똑해져

챗봇이 최근 들어 더 똑똑해진 이유는 '머신러닝' 기술이 더해졌기 때문입니다. 챗봇은 미리 여러 가지 상황에 대비해서 '이런 말은 이런 의미를 갖고 있다'고 학습해 대화의 문맥을 읽어냅니다. 그리고 그 질문에 대한 답을 찾아 그럴싸하게 보여주지요.

기사 관련 일러스트
그림=정서용

머신러닝은 데이터를 반복적으로 빠르게 분류하고 처리해 학습 효과를 높여주는 인공지능 기술입니다. 알파고가 처음에 기보 3000만 건을 보면서 바둑을 배운 것처럼 챗봇은 수없이 많은 사람의 대화들을 학습해 사람처럼 말할 수 있게 돼요. 우리가 외국어를 배울 때 단어와 문법을 배우는 대신 문장을 많이 외우는 것이 더 효과적이라는 이야기를 하는데, 머신러닝이 말을 배우는 과정도 이와 비슷해요. 세상의 온갖 말들을 다 기억해 두었다가 새로운 말이 입력되면 기존에 알고 있던 내용 중 가장 비슷한 것을 찾아내 문맥을 읽어내죠.

컴퓨터가 사람을 흉내 내서 채팅하는 기술은 꽤 오랫동안 연구되었던 분야입니다. 우리나라에서 가장 잘 알려진 챗봇은 '심심이'예요. PC통신 시절부터 이어져 온 이 챗봇은 기계적으로 문장을 단어별로 쪼개 의미를 이해하려고 시도했어요. 그래서 간단한 인사나 짧은 문장에는 장난스러운 답을 잘해냈습니다. 하지만 문장이 복잡해지고 낯선 단어를 만나면 "무슨 말인지 모르겠어요" 같은 답이 나오곤 했지요.

마이크로소프트는 2016년 '테이'라는 이름의 챗봇을 발표했습니다. 테이는 트위터에서 이야기를 나누도록 설계됐는데요, 말을 마이크로소프트가 가르치는 것이 아니라 트위터에 올라오는 이야기와 사람들과 나눈 대화를 통해 스스로 학습하도록 설계했습니다. 그런데 사람들이 테이에게 나쁜 말을 가르치기 시작했습니다. 인종차별·성차별적 언어를 비롯해 욕설을 내뱉기 시작했고, 심지어 히틀러와 홀로코스트까지 찬양하게 됐습니다. 테이가 '막말'을 배우는 데 걸린 시간은 불과 10시간 남짓이었고, 결국 마이크로소프트는 공개 16시간 만에 테이를 삭제할 수밖에 없었어요. 이 사건을 계기로 챗봇이 사람들과 대화를 나누고 말을 배우기 전 개발자가 먼저 성격에 맞추어 따로 학습시켜야 한다는 깨달음을 얻게 됐지요.

◇365일, 24시간 상담 가능한 '챗봇'

컴퓨터가 문장의 의미를 더 정확하게 이해하기 시작하면서 많은 변화가 일어났습니다. 음성 비서는 내 마음을 잘 읽어서 명령을 처리해주고, 다른 언어로 문장을 번역한 결과물은 더 자연스러워졌지요. 기업들은 반복적이고 비슷한 질문에 대한 답을 챗봇으로 할 수 있게 됐습니다. 음식을 주문하거나 호텔을 예약하기도 하고 서비스에 대한 불만을 대신 접수하기도 합니다.

기업들은 이 챗봇을 고객 상담에 이용하려고 해요. 고객센터에 전화를 걸어서 상담원을 한참 동안 기다려본 적이 있지요? 하지만 상담의 대부분은 아주 간단히 해결할 수 있는 것들이에요. 그래서 이를 챗봇으로 빠르게 상담해주고 사람이 직접 처리해야 할 것만 전문가를 연결해주는 식이지요. 또 모바일 거래가 늘어나는 트렌드에 맞춰 365일, 24시간 언제든 상담받을 수 있을 거예요. 마이크로소프트의 '루이스'나 구글의 '다이얼로그 플로'는 이런 챗봇 서비스를 기업이 직접 만들어서 쓸 수 있도록 만든 챗봇 도구예요.

챗봇을 통해 컴퓨터가 사람처럼 이야기하기 때문에 이 기술 자체를 '인공지능'이라고 생각하기 쉬운데 현실은 조금 다릅니다. 컴퓨터는 아직 사람처럼 지능을 갖고 대화할 수는 없어요. 인공지능 기술을 이용해서 컴퓨터가 말을 배우게 한다고 생각하면 돼요. 인공지능 기술에 놀랄 일이 많지만 사실 컴퓨터가 아직 우리만큼 똑똑한 지능을 갖지는 못하니까 너무 겁먹지는 않아도 돼요.


최호섭·IT칼럼니스트 기획·구성=유소연 기자