아직까지도 기계 번역이라 하면 “어색한 번역”, “발 번역” 등의 수식어가 따라붙습니다. 문법을 규칙화해 번역하는 규칙 기반 기계 번역(RBMT, Rule-Based Machine Translation)과 빅데이터를 이용해 통계적으로 규칙을 생성해 번역하는 통계 기계 번역(SMT, Statistical Machine Translation)도 이런 인식에서 벗어날 수 있을 만한 양질의 번역을 제공하지 못했습니다.
하지만 최근 인공지능과 신경 네트워크를 기반으로 하여 다양한 기계 번역이 발전하였습니다. 즉, 번역 업계에서 신경망 기계 번역(NMT, Neural Machine Translation)이 두드러진 위치를 점하게 된 것입니다.

* 본 콘텐츠는 시사IN (http://www.sisain.co.kr)과 Wikipedia의 Neural machine translation 항목(https://en.wikipedia.org/wiki/Neural_machine_translation)을 참고하여 작성했습니다.

 

 

신경망 기계 번역, 왜 필요할까?

신경망 기계 번역은 인공 신경망을 구축해 사람의 뇌가 학습하는 과정을 본떠 기계 번역에 적용한 것입니다.

앞서 언급한 통계 기계 번역은 단어나 구문이 가진 여러 가지 의미를 저장해 놓는 시스템입니다. 사용자가 문장을 입력하면 이를 단어나 구문 단위로 쪼갠 뒤 통계적으로 가장 원래 의미에 가깝다고 판단되는 번역물을 내놓습니다. 하지만 여기서 문제점이 발생할 수 있습니다. 예를 들면, 한국어로 ‘배’가 바다에 떠다니는 배(Ship)를 뜻하는지, 과일 배(Pear)를 뜻하는지조차 구분하지 못하는 번역물이 나오는 것이죠. 게다가 한국어와 영어는 주어와 서술어 등의 어순이 다르기 때문에 한영 번역 등을 맡길 때에는 특히 전체 문장의 맥락에 맞게 번역하는 능력(Context awareness)이 부족했다는 의견이 많았습니다.

그래서 구글, 네이버, 시스트란은 이러한 점을 보완하는 신경망 기계 번역에 주목하게 되었습니다. 통계 기계 번역과 신경망 기계 번역의 가장 큰 차이는 텍스트를 번역할 때 단어나 구문 단위로 쪼개지 않고 문장 단위로 번역한다는 점입니다. 신경망 기계 번역은 딥러닝 기술이 적용된 엔진을 통해 전체 문맥을 파악하고 문장 내에 단어, 순서, 의미, 문맥에서의 의미 차이 등을 반영합니다.

즉, 신경망 기계 번역의 가장 큰 특징은 기계 번역이지만 마치 사람이 번역한 듯 자연스럽게 번역할 수 있다는 것입니다.

 


신경망 기계 번역의 작동 원리

신경망 기계 번역은 “어텐션 메커니즘(attention mechanism)”이라는 기법을 이용합니다. 어텐션은 순환 신경망에 기반한 기존 언어 모델에서 발생하는 문제를 보정하기 위해 등장한 기법으로, 하나의 특정 벡터(자료조직)에 집중해 성능을 최대한 높이는 방법입니다. 즉 예측해야 할 단어와 연관성 있는 입력 단어 부분을 더 집중해 보는 것입니다.

  • 순환 신경망(Recurrent Neural Network, RNN): 음성, 문자 등 순차적으로 등장하는 번역 데이터 처리에 적합한 신경망 모델. 고정된 크기의 벡터 하나에 모든 정보를 압축하려 하다 보니 번역 시 필요한 정보가 손실되어 문장이 길어지면 번역 품질이 떨어진다는 단점이 있다.

신경망 기계 번역의 작동 원리는 이렇습니다. 예를 들어, 한국어에서 영어로 번역하는 알고리즘을 훈련시키고자 한다면 먼저 한국어와 영어로 된 한 쌍의 트레이닝 데이터를 준비합니다. “존은 11년 동안 아이들을 가르쳤다.”라는 문장이 있으면, 영어로는 “John has been teaching children for 11 years.”와 같은 트레이닝 데이터 문장들을 충분히 확보한 후 딥러닝 알고리즘에 문장 전체를 집어넣습니다. 그러면 번역 알고리즘은 한국어 문장을 통째로 코드화하고(인코딩) 그 후 이 코드를 풀어(디코딩) 영어 문장을 생성해냅니다. 이렇게 생성된 영어 문장을 올바른 해석 문장과 비교해보면서 오답의 ‘거리’를 측정하는 것입니다. 그렇게 인코딩과 디코딩을 반복하며 오답을 수정하고 정답과의 거리를 좁혀 나갑니다. 수많은 데이터로 이 과정을 충분히 반복하다 보면 문법을 따로 알려주지 않아도 알고리즘이 스스로 두 언어 사이의 규칙을 파악하고 학습하게 됩니다. 알파고가 학습을 통해 바둑의 수를 두는 것과 비슷한 원리인 것이죠.

 

신경망 기계 번역의 효과

기계 번역의 1세대 기업 시스트란은 유료 신경망 기계 번역 서비스를 도입하면서 법률, 금융 등 분야별로 특화된 ‘사용자 사전’을 활용해 전문성을 높였습니다. 해당 분야에서 고유하게 쓰이는 용어 등을 추가해 전문성이 필요한 문장도 더 정확하게 번역해 줄 수 있게끔 한 것입니다. 이처럼 신경망 기계 번역을 사용하면 언어별로 다른 고유의 특성을 반영해 더 매끄러운 번역이 가능합니다.

구글, 네이버도 NMT를 사용하고 있습니다. 버락 투로프스키(Barak Turovsky) 구글 번역 프로덕트 매니지먼트 총괄은 “NMT 기술 덕분에 구글 번역은 위키피디아 및 뉴스 매체의 샘플 문장을 기준으로 주요 언어 조합을 평가 대상으로 번역했을 때 번역 오류가 55%~85% 정도 감소해 지난 10년간 쌓아온 발전 이상의 결과를 단번에 이룰 수 있었다”고 말했습니다.

신경망 기계 번역의 발전에도 불구하고 기계 번역이 풀어야 할 숙제는 아직 많습니다. 설령 문맥을 고려한 자연스러운 번역이 가능하더라도 인간만이 해석할 수 있는 언어 간 문화 차이, 뉘앙스, 분위기를 파악하고 이를 반영하여 번역할 수 있는 기계 번역은 존재하지 않기 때문입니다. 결국 기계 번역이 결과물이 잘 된 번역인지 최종적으로 판단하는 것은 아직 우리 인간의 몫입니다. 서비스 사용자 입장에서도 속도와 비용을 제외하면 사람 번역이 훨씬 낫다는 의견이 많습니다. 하지만 날이 갈수록 기계 번역이 더욱더 지능적이고 능숙하게, 자연스럽게 발전하고 있다는 점만은 확실합니다.