기계 번역(Machine Translation)이란?

기계 번역 (MT-Machine Translation)이란 소프트웨어를 통해 한 언어에서 다른 언어로 텍스트나 음성을 번역하는 것을 말합니다. 즉, 사람의 개입 없이 컴퓨터 알고리즘에 기반을 둔 번역을 제공합니다. 기계 번역은 번역 엔진을 사용하여 단어들을 간단하게 번역할 수는 있지만, 최고 품질의 번역을 제공하지는 않습니다. 더 정확하고 전문적인 번역을 위해서는 전체 문장의 맥락을 고려하여 알맞은 단어들로 번역을 해야 하기 때문입니다. 따라서 기계 번역은 적은 예산으로 실시간 번역을 필요로 하고 비교적 콘텐츠 중요도가 낮은 트윗, 블로그 게시물, 블로그 댓글, 포럼 또는 게시판에 많이 활용되고 있습니다.

기계 번역의 종류는 무엇이 있을까요?

통계 기계 번역 (SMT-Statistical Machine Translation)

컴퓨터가 말뭉치(corpus)를 학습하여 통계학적으로 번역하는 방법입니다. 번역 엔진에 각 단어가 가진 여러 의미를 저장해 놓으면 사용자가 입력한 문장을 단어 단위로 구분 후 확률적으로 가장 유사한 의미를 찾아 번역됩니다.

규칙 기반 기계 번역 (RBMT-Rule Based Machine Translation)

언어의 구조와 문법을 바탕으로 규칙을 만들어 번역하는 방법입니다. 번역 엔진에 문장을 입력하면 이를 단어와 구 단위로 구분 후 설정된 놓은 규칙에 따라 단어를 조합해 번역합니다. 문법에 맞지 않은 문장은 제대로 번역되지 않는 특징이 있습니다.

인공신경망 기반 기계 번역 (NMT-Neural Machine Tranlastion)

최근 들어 주목 받는 번역 방식이자 구글, 네이버 파파고에서 도입해 사용하고 있는 번역 체계입니다. NMT는 사람의 뇌가 반복하면서 학습하고 지식을 축적하는 과정을 적용한 것입니다. 기존의 SMT, RBMT 등과 다른 점은 단어나 구문 단위로 쪼개는 것이 아닌 문장 단위로 번역을 한다는 점 입니다. 따라서 전체 문맥을 어느 정도 파악할 수 있는 기능이 탑재된 일종의 인공 지능 번역 체계라 할 수 있겠습니다.

기계 번역의 단점과 전망

최근 인공지능의 발전에 따라 기계 번역의 질도 향상되었습니다. 앞서 언급했듯이 구글, 네이버 파파고는 NMT 자동 번역체계를 구축하고 있습니다. 구글에서는 자사 NMT를 적용하여 위키피디아와 뉴스의 샘플 문장을 번역해 본 결과 기존 기계 번역 체계의 번역물 오류를 55%~85%가량 줄였다고 설명하고 있습니다. 달리 말해 특수한 전문분야의 지식을 제외하고는 문맥을 고려하는 자연스러운 번역물이 어느 정도 가능해졌다는 것을 의미하기도 합니다. 기계 번역은 점점 사람의 손을 거치는 사람 번역의 영역이 줄어들고 있으며 무엇보다 번역 비용이 저렴하고 시간도 절약할 수 있다는 장점이 있습니다. 게다가 나날이 새로운 번역 체계의 방식이 도입되고 있습니다.

2016년부터 기계 번역의 화두였던 신경망 기계 번역(NMT-Neural Machine Translation)의 원리에 대해 간단히 설명해보겠습니다. 우선, 이 인공 신경망이 원 문장을 벡터라는 값으로 전환하게 됩니다. 하나의 벡터 안에는 단어, 어순, 문법 등 여러 요인이 포함되어 있습니다. 그리고 이 인공 신경망은 이러한 요인을 기반으로 반복 학습을 통해 데이터를 축적하며 스스로 오역의 범위를 줄이고 발전하고 진화하는 것이죠. 그러니까 요약하자면 결국 더 매끄럽고 자연스러운 번역이 가능하다는 것입니다.

이러한 기계 번역의 발전은 국가 간 언어의 장벽을 무너뜨리고 나아가 세계에 만연한 부정부패, 충돌과 분쟁을 와해하는데 크게 기여할 수 있을 것입니다.

이외에도 새로운 기계 번역의 기술은 계속해서 늘어나고 있습니다. 원문에서 나온 번역문을 다시 원문의 언어로 번역해 기존 원문과 유사한지를 확인함으로써 정확도를 개선하는 기술인 역 번역(Back Translation), 역 번역 과정에서 문장에 단어 등을 추가해 원문의 언어로 번역한 후 유사성을 분석해 정확도를 개선하는 디노이징(Denoising) 등 오랜 기간 동안 상당한 수준에 이르게 됐는데요,

어쩌면 인간 번역을 대체할 수 있다는 전망도 나오고 있습니다.

언어 정보 제공 웹 사이트 에스놀로그(Ethnologue)에 따르면 세계에는 7,097가지의 언어가 존재한다고 합니다. 기계 번역의 발전은 과연 이러한 언어의 장벽을 완벽히 무너뜨릴 수 있을까요?

일각에서는 기계 번역의 발전에도 불구하고 사람 번역가를 대체할 수 없을 것이라고 합니다. ‘기계’와 ‘언어’는 성질 자체가 다르기 때문이죠. 즉, 언어에는 뉘앙스, 톤, 분위기, 표정 그리고 감정과 같은 현장성이 들어가 있기 때문입니다. 이 모든 것을 고려해 번역하거나 통역한다는 것 자체가 불가능하다는 것입니다.

기계번역, 과연 어디까지 발전할까요?

스마트 라이온 번역 회사