bg_news_01.jpg

We are Data Driven

DOUB News

다양한 분야에서 데이터의 가치를 끊임없이 발견하고 미래의 가치를 발굴하는

​데이터 전문기업 두유비의 소식입니다.

AI 기반 챗봇 구현을 위한 기술 동향

테크인사이드 - 인공신경망 기반 챗봇의 미래 전망 / 손현곤 | 두유비 대표이사


대화형 인공지능(이하 챗봇) 기술은 사용자에게 친숙한 대화 형식으로 정보를 제공한다는 편의성으로 공공과 학계, 기업 등 많은 분야에서 활발하게 활용되고 있다. 웹브라우저에 검색어를 입력하고 결과 값을 문서 형태로 획득하는 과거방식과 달리, 챗봇은 인간과 컴퓨터 간의 인터페이스를 한층 발전시켜 자연어 문장으로 대화할 수 있는 사용자 친화적인 차세대 인터페이스로 부상하고 있다. 특히 음성인식과 음성 합성 기술을 융합하면 음성으로 질문과 답변 획득이 가능한 대화 로봇 구현이 가능하다. 이를 바탕으로 이미지 처리 기술을 융합해 가상의 인공지능 휴먼(아바타)을 통한 첨단 대화 서비스가 최근 속속 출시되고 있다.



규칙 기반 챗봇 vs 인공신경망 기반 챗봇

챗봇을 구현하는 방법은 규칙 기반(Rule-base) 방식과 인공신경망(Artificial Neural Network) 방식으로 나눠진다. 먼저 규칙 기반의 챗봇은 질문에 포함된 의도를 파악해 해당 의도에 대한 답변을 유사도 분석과 검색 기술을 통해 찾아내는 방식이다.

그리고 인공신경망 기반의 챗봇은 대량의 실제 대화 데이터를 학습하여 질문에 답하는 방식이다. 챗봇의 도입 목적이 특정한 업무 처리를 위한 것이고 질문과 답변 세트를 마련할 수 있는 경우에는 규칙 기반의 챗봇을 구현하는 것이 효과적이고, 특정 업무보다는 폭넓은 대화가 필요하고 질의응답 세트를 정의하기 어려운 경우에는 인공신경망 기반의 챗봇을 구현한다.


인공신경망 기반의 챗봇은 해당 도메인에 대한 대량의 데이터를확보하여 훈련하는 과정(Pre-training)이 필요하다. 규칙 기반 챗봇은 사용자가 질문한 문장의 형태소 분석과 키워드 검색을 통해 질문자의 의도(Intent)를 찾아내고, 해당 의도에 대해 미리 정의해 둔 답변 문장을 출력한다. 예를 들어“통장 잔액 알려줘”라는 질문이 들어오면 ‘통장 잔액’이라는 키워드를 통해 사용자가 잔액을 확인하려는 의도가 있다고 판단하고, 시스템에서 로그인 한 사용자의 통장 잔액을 조회한 후 “홍길동 님의 통장 잔액은 XXX입니다”라는 답변을 출력한다.


규칙 기반 챗봇은 주로 정형화된 업무에서 자주 하는 질문이나 업무 처리 프로세스에 대한 대응을 위해 사용된다. 또 예약 프로세스 처리를 위해 마음에 드는 방을 선택하고, 투숙자 이름과 날짜, 인원을 입력해서 결제에 이르는 일련의 업무 처리 절차도 챗봇으로 처리할 수 있다. 최근에는 과거의 단순 키워드 검색 기술 외에도 코사인 유사도 같은 유사 질의 판단을 위한 인공지능 알고리즘이 포함되는 하이브리드 형태로 구현하기도 한다. 이 방식은 신뢰도가 높고 의사 결정의 과정이 설명 가능하다는 장점이 있으나, 규칙을 작성한 사람의 능력에 의해 챗봇의 지능이 좌우된다는 단점이 있다.


규칙 기반의 챗봇이 적합한 분야는 순차적이며 절차적인Q&A 처리 분야, 신뢰성이 중요한 업무 프로세스 처리 분야가 있다. 가장 큰 장벽은 규칙을 작성하는 사람이 해당 분야의 전문 지식을 가져야 한다는 것이다. 인공신경망 기반 챗봇은 수많은 뉴런의 연결 구조와 강도로 표현되는 인간의 두뇌를 모방(인공신경망)한 딥러닝 알고리즘을 이용한다. 대규모의 자료를 통해 ‘컴퓨터가 스스로’ 공통적인 특징을 추출한다고 해서 자율 학습 방식이라고도 불린다. 이 방식은 사람이 개입하는 규칙의 작성은 최소로 제

한하고, 목적에 맞는 대량의 대화 데이터의 학습을 통해 질문을 인식하고 답변을 추출한다. 일일이 규칙을 작성하지 않고 스스로 학습이 가능하여 넓은 지식 범위를 수용할 수 있다는 장점이 있으나, 확률, 통계, 벡터 등의 수학 등 매우 방대한 데이터가 필요하고 대규모 GPU 서버 클러스터와 같은 강력한 컴퓨팅 파워가 요구된다는 단점이 있다.


인공신경망 기반 챗봇은 사진과 음성인식, 폭넓은 상담과 같이 규칙으로 표현하기 어려운 분야에 적합하다. 규칙 기반 챗봇과 비교했을 때, 가장 큰 장벽은 인공지능 알고리즘에 대한 기술적 이해가 필요하고 양질의 대규모 데이터를 확보해야 한다는 점이다.



챗봇은 지식의 범위에 따라 닫힌 주제(Closed-domain)와 열린 주제(Open-domain)의 챗봇으로 나눌 수 있다. 닫힌 주제의 챗봇은 단어나 의도에 반응하는 방식이며, 특정한 과업을 달성하는 것이 목표다. 반면 열린 주제의 챗봇은 아무 주제나 대화할 수 있으며 특별한 목적이 없을 때 주로 사용하는 방식이다. 물론 규칙 기반은 닫힌 주제에, 인공신경망 기반은 열린 주제에 쓴다는 법칙이 있는 것은 아니다. 닫힌 주제의 챗봇이라도 일상적인 대화에 대한 답을 위해 인공신경망 기반 챗봇 기술을 포함하기도 하고, 열린 주제의 챗봇이라도 예약 같은 업무 처리를 위해 규칙 기반의 챗봇 기술을 포함하기도 한다.


인공신경망 챗봇의 최신 사례

열린 주제를 위한 인공신경망 챗봇 기술은 인공지능 기술 중 자연어 처리 분야에 관한 최신 기술이 총망라되는 서비스다. 컴퓨터와 인간의 인터페이스는 자연스러운 대화를 통한 교감을 목표로 진화하고 있으며, 사람과 구별되지 않는 대화형 인공지능 기술의 실현은 선도 IT 업체들이 앞다투어 도전하는 분야다. 또한 더욱 현실감 넘치는 메타버스(Metaverse) 플랫폼의 실현을 위해서도 필수적인 기술이다.


인공신경망 챗봇 중에서 최근에 주목받고 있는 오픈AI의 GPT-3(Generative Pre-trained Transformer 3), 구글의 미나(Meena), 페이스북의 블렌더봇(BlenderBot)과 같은 자연어 생성 모델은 인간의 언어 구사 패턴을 놀라울 정도로 흉내내고 있다. 대표적 사례로 2021년 7월, 조슈아 바흐보우라는 캐나다 남성은 자신의 죽은 약혼자와 주고받은 문자 메시지와 이메일을 이용해 GPT-3 기반의 챗봇을 만들었다. 이 챗봇은 약혼자의 말투를 그대로 흉내내고 대화가 쌓일수록 더욱 그녀와 비슷해져 갔으며, 개발자인 조슈아는 챗봇의 농담에 웃거나 보고 싶다는 말에 울기도 했다고 보도됐다. 그와 동시에 일각에서는 이 모델을 남용하여 타인에게 해를 가하는 도덕적 문제가 발생할 수 있다는 우려도 제기됐다. 2020년 말 국내에서 공개된 규칙 기반의 챗봇 이루다는 큰 인기를 끌었으나 성 소수자에 대한 혐오적인 표현, 외설스러운 목적의 사용, 개인정보 침해 사례 등으로 결국엔 서비스가 중단되었다.


GPT-3

언어 모델은 단어의 연속인 문장을 생성할 때 지금까지 나온 단어들을 토대로 다음 단어를 통계적으로 예측하는 기법이다. 그중 GPT-3는 데이터 전체의 분포를 모델링하여 많이 나온 순서대로 예측하는 언어 모델(Generative)의 일종으로, 약 5000억 개의 단어가 포함된 45TB의 방대한 텍스트를 미

리 학습해(Pretrained) 다른 언어 모델보다 월등한 성능을 보이는 트랜스포머(Transformer) 방식을 기반으로 한다. 트랜스포머는 데이터의 각 문장과 단어와의 관계를 병렬 구조로 학습시키는 언어 이해에 특화된 딥러닝 모델이다. 2021년 5월 네이버에서는 한국어판 GPT-3 모델인 ‘하이퍼클로바’를 공

개한 바 있다.


한국어판 GPT-3, 네이버 하이퍼클로바 (출처: NAVER AI NOW 발표회)



구글 미나(Meena)

GPT-3가 대규모 데이터를 학습시킨 거대 모델에 중점을 뒀다면, 챗봇 본연의 기능에 최적화된 모델은 2020년 초에 발표된 구글의 미나다. 미나는 소셜 미디어 데이터의 문맥과 질문 및 답변을 쌍으로 400억 개의 단어가 포함된 341GB의 텍스트를 학습했다. 대화의 유창성 측면에서 인간이 86% 점수를 받은 테스트에서 미나는 79%를 기록해 인간과 근접한 대화 능력을 보여주었다. 미나는 문맥을 고려해 상당히 자연스러운 대답을 하며, 콘텐츠에 맞게 구체적인 내용을 알려준다. 즉, GPT처럼 일상 대화 모델과 학습 데이터의 규모를 끌어올려 더 다양한 답변을 생성하고 대화를 길게 끌어감으로써 과거 챗봇들의 한계점들을 극복하기 시작했다. 그러나 이 시스템과 데모는 전술한 사회적 문제를 초래하지 않도록 검토하기 위해 구글 내 실험실에만 있으며 대중에게 공개되지 않았다.


구글 미나와 영화에 대한 대화(출처: 구글 공개 자료 번역)

사람: 오스카 후보로 오른 영화가 어떨까, 하나 추천해 줄래?

미나: 최근 오스카 수상작들은 잘 모르는데. 하지만 그랜드 부다페스트 호텔이란 영화를 보고 싶었어.

사람: 아, 그 영화에 대해서 더 말해 줘봐.

미나: 문라이즈 킹덤과 같은 감독과 작가야. 웨스앤더슨은 재미있고 컬러풀한 영화로 매우 유명해. 매우 좋은 작품이라고 들었어.


페이스북 블렌더봇 2.0(BlenderBot 2.0)

전술한 자연어 생성 모델들은 대화할 때 사실에 기반하며 인간에 가까운 대화 능력을 보여주고 있지만, 대화를 통해 얻은 새로운 정보를 저장하지 못하고 새로운 지식을 위해서는 모델을 지속해서 업데이트해야 한다는 단점이 있다. 그런데 페이스북에서 발표한 블렌더봇은 과거의 열린 주제 챗봇들의 한계를 극복하였고, GPT-3보다 뛰어나다는 평가를 받고있다. 블렌더봇은 멀티 턴에 의한 대화가 가능하며 장기간 페르소나가 유지되고 실시간 정보를 검색해 지속해서 업데이트한다. GPT-3는 과거 정보를 답하고 되묻는 반면, 블렌더봇은 최신 정보를 기반으로 답해준다. 블렌더봇의 실시간 검색 기능은 대화하는 사람에게 최신 정보를 제공하고 자연스러운 대화를 이어갈 수 있도록 해주며, 사람과 비슷한 개인화 정보를 기억하고 있으면서 학습에 의한 지식이 아닌 실시간 검색을 통해 정보를 제공한다. 이에 대량의 데이터를 지속적으로 학습해야 하는 수고를 줄여줘 현시점에서 가장 진보된 대화 모델로 평가받고 있다.


실시간 검색을 통해 답하는 페이스북 블렌더봇 2.0 (출처: 페이스북)



인공신경망 기술로 진화하는 챗봇

아직은 챗봇을 구현할 때 닫힌 주제인지 열린 주제인지, 그리고 업무 지향인지 일상 대화 지향인지에 따라 규칙 기반의 챗봇을 만들지 인공신경망 기반의 챗봇을 만들지 결정한다. 즉, 현재 대부분의 업무 처리형, 전문 지식 질의 응답형 챗봇은 규칙 기반으로 제작되고 있다. 물론 모든 기업이 GPT-3와 같은 거대 언어 모델을 자사의 챗봇에 적용할 필요는 없다. 그러나 점점 모델의 크기가 방대해지고 그 분야도 다양해지고 있으며, 기존 챗봇들이 가지고 있는 한계점을 인공신경망 기술을 통해 극복하는 것이 현실화되고 있다. 그래서 업무에 특화된 분야에도 인공신경망 기반의 챗봇을 적용할수 있는 가능성이 커지고 있으며, 이에 따라 현재의 챗봇에 대한 고질적인 저평가, 예컨대 ‘두리뭉실하게 넘어간다, 유연성이 떨어진다, 최신 정보를 모른다’ 등의 따가운 시선들이 극복될 날도 그리 멀지 않았다고 생각한다.





조회 14회