기계 번역(Machine Translation)이란?

기계 번역(MT, Machine Translation)이란 소프트웨어를 통해 한 언어에서 다른 언어로 텍스트나 음성을 번역하는 것을 말합니다. 즉, 번역사가 직접 번역하지 않더라도 컴퓨터 알고리즘을 기반으로 번역 결과를 제공할 수 있는 것입니다. 흔히 “번역기”라 부르는 Google 번역, Papago 번역 등이 기계 번역입니다. 기계 번역은 번역 엔진을 사용하기 때문에 매우 빠른 시간 안에 번역을 끝낼 수 있지만, 품질은 사람이 한 것보다 떨어질 때가 많습니다.

 

예를 들어,

“If there’s only one difficulty selection, that’s not a choice as much as it is a barrier that purposely locks other kinds of gamers out of the gaming experience.”

(출처 https://kotaku.com/that-dark-souls-iii-twitch-streamers-bananas-single-but-1847947150)

라는 문장이 있다고 했을 때, Google 번역 엔진이 제공하는 결과물은 다음과 같습니다.

“난이도 선택이 하나뿐이라면 다른 종류의 게이머를 게임 경험에서 의도적으로 잠그는 장벽만큼 선택이 아닙니다.”

 

“게임 경험에서 의도적으로 잠그는 장벽”, 무슨 뜻인지 직관적으로 이해가 되시나요? 이는 번역 엔진이 “locks”를 “잠그다”라는 일반적인 뜻으로 해석했기 때문에 나온 결과인데, 실제로 여기서는 “잠그다”보다는 “(어떤 위치에 단단히) 고정하다”라는 뜻에 더 가깝습니다. “난이도 선택이 하나뿐이라면 여러 유형의 게이머가 게임을 경험할 수 없도록 의도적으로 배제하는 장벽으로 작용한다”는 말이지요.

 

이렇듯 더 정확하고 전문적인 번역을 위해서는 전체 문장의 맥락을 고려하여 알맞은 단어들로 번역을 해야 하며, 아직 기계 번역으로 맥락까지 고려해 정확한 번역 결과를 제공하기는 다소 어렵습니다. 따라서 기계 번역은 적은 예산으로 실시간 번역을 필요로 하고 비교적 콘텐츠 중요도가 낮은 트윗, 블로그 게시물, 블로그 댓글, 포럼 또는 게시판에 많이 활용되고 있습니다.

 

기계 번역의 종류는 무엇이 있을까요?

통계 기계 번역 (SMT, Statistical Machine Translation)

컴퓨터가 말뭉치(corpus)를 학습하여 통계학적으로 번역하는 방법입니다. 번역 엔진에 각 단어가 가진 여러 의미를 저장해 놓으면 사용자가 입력한 문장을 단어 단위로 구분한 후 각 단어마다 확률적으로 가장 유사한 의미를 찾아 번역합니다.

규칙 기반 기계 번역 (RBMT, Rule Based Machine Translation)

언어의 구조와 문법을 바탕으로 규칙을 만들어 번역하는 방법입니다. 번역 엔진에 문장을 입력하면 이를 단어와 구 단위로 구분 후 설정된 놓은 규칙에 따라 단어를 조합해 번역합니다. 따라서 문법에 맞지 않는 문장(규칙에서 벗어나는 문장)은 제대로 번역되지 않습니다.

인공신경망 기반 기계 번역 (NMT, Neural Machine Tranlastion)

2016년경부터 주목받는 번역 방식이자 현재 Google 번역, Papago 번역에서 사용하고 있는 번역 체계입니다. 인공신경망은 단어, 어순, 문법 등 여러 요인을 기반으로 반복 학습하여 사람의 뇌가 반복하면서 학습하고 지식을 축적하듯 데이터를 축적하여 스스로 발전하고 진화합니다. 기존의 SMT, RBMT 등과 다른 점은 단어나 구문 단위로 쪼개는 것이 아닌 문장 단위로 번역을 하기 때문에 전체 문맥을 어느 정도 파악할 수 있으며 더 매끄럽고 자연스러운 번역이 가능하다는 점입니다.

 

기계 번역의 전망

최근 인공지능의 발전에 따라 기계 번역의 질도 향상되었습니다. 앞서 언급했듯 Google 번역, Papago 번역은 NMT 자동 번역체계를 구축하고 있습니다. 구글에서는 자사 NMT를 적용하여 위키피디아와 뉴스의 샘플 문장을 번역해 본 결과 기존 기계 번역 체계의 번역물 오류를 55%~85%가량 줄였다고 설명합니다. 전문분야의 지식을 다룬 것이 아니라면 문맥을 고려한 자연스러운 번역이 어느 정도 가능해졌다는 뜻입니다. 기계 번역의 장점은 무엇보다 비용이 저렴하고 시간도 절약할 수 있다는 점입니다. 또, 기계 번역의 발전으로 국가 간 언어의 장벽이 무너지면 더 나아가 세계에 만연한 부정부패, 충돌과 분쟁을 와해하는 데에도 크게 기여할 수 있을 것으로 보입니다.

이외에도 새로운 기계 번역 기술은 계속 늘어나는 추세입니다. 원문에서 나온 번역문을 다시 원문의 언어로 번역해 원문과 유사한지를 확인함으로써 정확도를 개선하는 기술인 역 번역(Back Translation), 역 번역 과정에서 문장에 단어 등을 추가해 원문의 언어로 번역한 후 유사성을 분석해 정확도를 개선하는 기술인 디노이징(Denoising) 등 나날이 새로운 번역 체계가 도입되어 기계 번역 품질이 점차 향상되고 있습니다.

기계번역, 과연 어디까지 발전할까요?