갤 24 실시간 통역
번역 기술이 언어장벽 허물었다
‘인공 신경망 번역’ NMT의 세계
대표적 공상과학(SF) 소설 ‘은하수를 여행하는 히치하이커를 위한 안내서’에 등장하는 바벨피시는 온갖 언어를 번역해 준다. 거머리처럼 생긴 물고기를 귀에 넣으면 물고기가 뇌파 에너지를 영양분 삼아 주변 언어를 즉시 이해할 수 있게 해 준다는 원리다. 이 ‘바벨피시’가 인공지능(AI)을 통해 현실화되고 있다.
해외 유명 식당을 방문해 메뉴판에 스마트폰 카메라만 들이대면 외국어였던 음식 이름이 한국어로 순식간에 바뀐다. 스마트폰 번역 앱을 이용하면 외국 택시 기사에게 목적지를 정확하게 알려줄 수 있다. 문화의 벽만큼 높았던 언어의 장벽이 AI 기술에 허물어지고 있는 것이다.
빠르게 발전하는 번역 기술의 중심에는 인공 신경망 번역(Neural Machine Translation, 이하 NMT) 기술이 있다. NMT는 AI를 활용해 문장을 통째로 번역하는 방식으로, 문장을 단어나 구(句)로 쪼개 통계적으로 가장 유사한 의미를 찾아 번역하는 종전 통계 기반 번역(SMT)의 한계를 극복했다는 평가를 받는다. NMT 기술의 발전으로 소통 폭이 넓어지면서 2022년 9억 8220만 달러(약 1조 3000억 원)였던 기계 번역 세계시장 규모는 2032년 75억 7000만 달러(약 9조 9000억 원)로 연평균 22.8% 성장할 것으로 전망된다.
글로벌번역시장규모는 2022년 9억 8220만 달러에서 2032년 75억7000만 달러로 연 22.8% 성장이 예상된다.
NMT의 진화
NMT는 구글이 2017년 발표한 자연어 처리를 위한 딥러닝 기술 ‘트랜스포머 모델’을 기반으로 한다. 트랜스포머 모델은 크게 ‘인코더’와 ‘디코더’로 나뉜다. 번역할 문장을 입력하면 인코더에서는 입력된 문장의 각 단어를 고유한 벡터로 변환하고 그 사이의 문맥 정보를 추출한다. 이어 디코더에서는 벡터로 생성된 단어들을 하나씩 번역한다. 이 과정이 반복되면서 문장 안의 단어들이 서로 얼마나 상관관계를 갖고 있는지 판단해 가중치를 준다. 특정 단어의 수많은 사전적 의미 중 어떤 의미로 번역할 지를 결정하기 위해 문장 안의 다른 단어들과 견주어가면서 가장 알맞은 의미를 찾는 과정인 셈이다.
AI를 만난 번역 기술은 텍스트 번역에 머물지 않고 영역을 확대하고 있다. 메타는 지난해 약 100가지 언어를 인식하고 번역할 수 있는 AI 모델 ‘심리스M4T’를 공개했다. 문자와 음성을 자유자재로 오가며 상황에 따라 효율적으로 번역 기능을 활용할 수 있다. 구글은 400여 언어의 음성 번역을 지원하는 ‘유니버설 스피치 모델(USM)’을 개발했다. 영어와 중국어뿐 아니라 아제르바이잔어와 필리핀 중부의 세부아노어 등 데이터가 부족한 지역 언어도 번역할 수 있다. 김상훈 한국전자통신연구원(ETRI) 복합지능연구실 책임연구원은 “AI 번역 모델이 사람처럼 보고 듣고 읽는 ‘멀티 모델리티’로 진화하고 있는 것”이라고 했다.
소통의 폭 넓히는 번역 기술
번역 기술은 인종과 문화 등을 넘어 소통 범위를 넓히고 있다. 메타버스에서 게임과 채팅을 하며 친구를 사귈 수 있는 ‘로블록스’는 사용자들이 언어에 상관없이 자유로운 소통을 즐기도록 16국 언어를 실시간으로 번역하는 자동 채팅 번역 기능을 추가했다. 로블록스는 번역 기능을 통해 사용자들의 체류 시간과 채팅 참여도가 높아질 것으로 기대하고 있다. 대니얼 스터먼 로블록스 최고기술책임자(CTO)는 “덕분에 현실에서 불가능한 일이 가능해졌으며, 사용자끼리 언어 장벽을 극복할 수 있게 됐다”고 했다.
AI를 이용한 자동 번역 기능은 삼성전자 스마트폰 갤럭시 S24에서도 볼 수 있다. 상대방과 통화할 때 언어가 다르면 스마트폰이 채팅창을 통해 실시간으로 상대의 말을 텍스트로 풀어 번역한다. SK텔레콤은 통화 중 실시간 통역을 도와주는 ‘에이닷’ 서비스를 내놨고, AI 기계 번역 기술을 개발하는 미 실리콘밸리 한인 스타트업 엑스엘에이트(XL8)는 온라인 화상 회의에 활용할 수 있는 다국어 실시간 통역 기술을 선보였다.
인공 신경망 번역(NMT)
Neural Machine Translation. 기계 학습을 통해 인공지능(AI)이 전체 문맥을 파악한 뒤 각 단어의 순서와 의미 차이 등을 기반으로 번역하는 기술이다. 기존 통계기반 번역(SMT)이 하지 못했던 먹는 ‘밤’과 시간적 의미의 ‘밤’을 구별하는 등 단어의 의미를 더 정교하게 번역할 수 있다.
댓글