어깨제목:10년 뒤 세상은 통역기 전성기 큰 제목:“통역사 존재 자체가 미미해질 것”
박영숙 유엔미래포럼 대표
올해가 자동통역기의 원년이라면 10년 뒤쯤 미래엔 통역기술이 어느 수준까지 발전할까. 대부분의 전문가들은 2020년대가 되면 자동통역기술이 전성기를 이룰 것이라는데 의견을 같이 한다. 미국의 IT분야 전문 리서치 회사인 가트너(www.gartner.com)는 5년 전인 2006년 이미 “자동통역은 현재 발아기 단계이지만, 5~10년 후 주류기술이 될 것”이라고 예측했다. 미국 조지워싱턴대 빌 할랄 교수는 2017년에는 실시간 처리 능력을 가진 자동 통역기가 모습을 보일 것이라고 예측한다. 그는 특정기술의 현실화를 예측하고 미래 시장 규모를 추정하는 테크캐스트(TechCast/www.techcast.org)로 유명한 미래학자다. 일본의 UFJ총합연구소는 지난 2006년 보고서에서 2020년 전세계 자동통역 시장규모를 약 10조원으로 예측했다. 우리나라 교육과학기술부도 2007년 과학예측조사 등을 바탕으로 가상 시나리오를 제시하면서 “2030년 쯤이면 만국어 번역기는 언어의 장벽을 허문지 오래일 것”이라고 내다봤다. 자동통역 기술은 가장 먼저 전세계 여행자들을 위한 다국적 안내 역할을 할 것으로 보인다. 구글을 제외한 대다수의 자동통역기들이 이 방향으로 연구의 초점을 맞추고 있다. 통역의 대상을 특정 목적으로 좁힐 수록 기술의 완성도가 올라갈 수 있기 때문이다. 하지만 이후엔 국제회의와 일반대화 등에 이르기까지 자동통역의 범위와 수준이 진화해 나갈 것이다. 자동통역 기술의 궁극적인 목적은 세계 모든 사람이 언어의 장벽을 느끼지 못하고 자유자재로 대화하는데 있다. 이쯤 되면 통역기를 통해 대화를 나누는 사람들은 성별이나ㆍ감정ㆍ억양에 사투리의 장벽까지도 허물어버릴 것이다. 자동통역 기술이 일반화되면 외국어를 배울 필요는 없을까. 번역가나 동시통역사는 어떻게 될까. 영국의 통역기기 연구 전문가인 존 허친스는 미래엔 한 사람이 3~4개의 언어를 구사하는 다언어 인간 시대가 될 것으로 추측한다. 한나라 언어만 해서는 다양한 기술이나 서비스에 적응하기 힘들어지기 떄문이다. 대신 모국어 외에 영어를 기본적으로 배우고 다른 언어들은 대부분 통역기를 활용하게 될 것이라고 본다. 그 때쯤이 되면 통역사의 역할도 크게 축소된다. 통ㆍ번역사는 현재 전세계적으로 30만명 정도 있는 것으로 추산된다. 내가 만난 외국의 많은 미래학자들은 2~3년 내로 통역사들의 일자리가 절반 이상으로 소멸하며 2020년에는 거의 존재가 미미해 질것이라고 예측했다.
=========== 지구촌에 통역사 번역사들이 30만명정도 있는 것으로 추산된다. 이들의 일자리가 2-3년내에 절반이상으로 소멸하며 2020년에는 거의 존재가 미미해 질것이라고 예측한다. 존 허친스(John Hutchins)통역기기 연구 최고전문가는 유럽 즉 네델란드 덴마크 등에서 한사람이 3-4개 언어를 하듯이 다언어인간으로 간다고 본다. 한나라 언어만 해서는 다양한 기술이나 서비스에 적응하기 힘들어진다. 영어를 학교에서 배우고, 모국어를 가정에서 사용하고, 또 몇개의 언어를 조금씩 하는데 이런 언어는 대부분 통역기기를 활용하게 될 것이라고 본다. 통역기의 역사는 50년이되었다. 영국에서 냉전시대에 만들어진 프로그램인데, 미국이 발전시킨것은 스파이전에서 러시아등 동구권언어를 통역하기위해서였다. 헝가리인 토마박사가 현재 시간당 30만개를 단어를 번역할 수 있는 기계를 개발했다고 장담하는데, 몰몬교에서 활용하다 중단했고 유럽의 EU에서 활용하고있는 토마 시스트랜이라는 기계도 있다.일본도 통역기개발에오래전부터 역점을 두고있다. 통역기를 만드는 회사는 수천개가 있고 어플회사들은 더 많다. Unisys, Xerox, Caterpillar, Siemens, John Deere 등은 큰 회사이고 소규모회사, 기관, 기구들에게 개발한 수만개의 프로그램이 나와있다. 이 분야는 미래산업으로, 부상하는 분야에 속하기 때문에 많은 기업진출이 예상된다. 어학연수로 20조이상을 쓰는 나라가 한국인데 한국외의 수많은 나라에다 각각 한대씩 가진다고 한다면 69억개의 자동통역기가 필요해진다. "조만간 출시될 구글 의 음성인식 자동통역기가 제3차 세계대전을 막을 수 있을 것입니다. 지금부터 인류사에 진정한 혁명이 일어날 것입니다." 41차 다보스포럼에 참석 중인 구글의 에릭 슈미트(Schmidt) 회장이 1월27일 스위스 다보스에서 기자간담회에서 밝혔다. 음성인식 자동통역기를 시연했는데,영어- 스페인 어용으로태블릿PC에 대고 영어로 말하면 스페인어로, 스페인어로 말하면 영어로 완벽히 통역되었다. 앞으로 15개 국어 음성인식 자동통역기를출시할 것"이라고 말했다. 현재 링고12라는 제품등 수백가지의 자동통역기가 몇만원에서 몇십만원까지 팔리고 있다. 하지만 자동통역기는 아직 걸름마 단계일 뿐이며 엄청난 발전을 하게될 것이라는것이 미래예측이다. Kasparov가 체스게임에서 인간을 능가하여 이기는 시대다. 현재는 단어에서 단어로 번역하는 것이 보통이지만, 나중에는 인간의 감정까지 해석을 하게된다고 본다. 컴퓨터는 고속으로 단어에서 단어로 바꿔주는 작업, 그리고 교정봐주는 작업을 하고 인간보다 더 많은 메모리를 가지고 모든 단어를 기억한다. 하지만 아직도 컴퓨터에 없는 것이 바로 상식(common sense)를 파악하지 못하거나 감정을 읽지 못한다는 것이다. 그래서 시 등의 번역이 용이하지가 않다. 공짜 통번역서비스 사이트나 프로그램이 많다. www.dicter.net 이나 통번역의 미래나 통계등을 싣고있는 www.proz.com 에서는 번역기술의 변천사등도 보여준다. 캐나다 정부 영국정부등에서 앞으로 영어교육시장을 분석하면서 통번역기의 미래를 예측한바 있다. 앞으로 영어는 2020년까지는 지속적으로 늘어나다가, 2020년 즉 10년 후에는 중국(19억), 인도(17억), 아프리카(16억) 등으로 인구가 역전이되면서 유럽의 중심국가 10여개국은 2억, 미국은 4억인구로 아시아언어가 최대언어가 되어 아싱글리시가 뜬다고 한다. 아시아인들이 영어교사로 전세계를 돌아다닌다는 것이다. 그런데 이들은 전부 통번역기를 무기로 가지고 다니거나 태블릿PC등에서 어학어플을 함께 이용하기때문에 영국인 미국인 캐나다인 호주인들이 영어교사로 이동하는것보다 아싱글리시 영어교사가 더 많아 진다는 것이다. 윌리 채플린은 인공지능(AI)의 대가인데 그는 이미 컴퓨터 언어를 가지고 많은 통역프로그램을 만들었다. 그는 앞으로 바벨탑의 소멸과 바벨탑으로 인해 생긴 다양한 언어들이 융합 통합하는 시대가 올지도 모른다고 하였다. Babelfish라는 프로그램에서 홈피 자체를 통채로 번역하는 시스템을 만들었는데 그가 보기에는 앞으로 페이스북이나 마이스페이스등에서 동시통역서비스를 하게되면 진정 각 국가의 언어가 소멸할 수도 있게되며, 너무나 많은 통역어플들이 나오게 될 것이라고 전망한다. 지구촌에서 통역기기 이야기를 가장 먼저 책으로 쓴 사람은 Ellis Horwood로 "기계통역시, 과거 현재 미래" 런 저서를 1985년에 출판했다.그 이후로 통번역에 대한 하드웨어 소프트웨어들이부상이슈가 되었다. 하지만 통번역기의 역사는 1946년으로 거슬러 올라간다. 통번역기는1943년에 IBM에서 컴퓨터를 만들어서 팔게되면서 컴퓨터프로그램으로 개발되기 시작하였고, 그 이후에는 weaver로서 1949년에 그후 Machine Translator로 1949-52년에, 조지타운대학과 IBM 이 통역기를 공동으로 만들어 세계최초의 통역기전시회를 가진 때가 1954-56년 당시였다.
그 이후 미국의 각 대학에서 통번역 연구에 뛰어들어, 워싱턴대학교에서 1949-62년간 연구했고, IBM연구소에서 1958-1966), 조지타운대학교에서 1952-1963), 미시간대학교 1955-62), MIT 1953-1965년 하버드대학교에서 1954-1964년 UCLA 1958-64). 이러한 교수들의 연구를 끝으로 통역기 산업은 이제 기업으로 넘어가서 다양한 통번역기들이 나오기 시작하였다. 미국이 통번역의 리더이며 구글이 리더격이라고 한다면 러시아는 1974년, 일본은 1975년 교토대학등에서 연구가 시작되었다. 한국에서는 통번역기 연구는 크게 없는 듯하다. 레이 커즈와일이나 통번역기등을 만드는 사람들은 통역기를 만들때 시장을 보고 만드는데, 인구분석이 가장 중요하닥고 본다. 현재 중국이 1위, 인도 2위, 그 다음이 영어권이고 아랍권, 스페인어권등이므로 통역기를 가장 많이 사줄 언어 순서대로 통역기를 만드는데, 한국은 인구소멸1호국이어서 한국어 통역기를 만들었을경우 시장이 크지않아는 것이다. 영어는 각 국에서 다 사용하기때문에 영어가 바탕언어가될 수 있다는 전망이다. TR05: Machine Translation - Mystery, Misery or Miracle  As one of the first users of commercial MT in the United States, and as a senior professional translator, I see MT as one of many "tools". As an independent expert without connections to the industry I can be objective. Since 1980 I have used one system for years and have worked on and tested others. Few translators have years of experience in both the conventional and the MT fields. MT -- as opposed to Computer Assisted Translation uses the computer (the machine) to perform a total translation online. CAT uses the computer as a tool to assist the human translator. We do not know how we think. Only part of the human translation is understood and "programmable". Concrete, defined grammars elude us and language is constantly changing, living and expanding. These are not the best bases for programmers and computational linguists. The brain is and will be the unsurpassed "computer" in humans. Fifty years ago, MT began in England and the Cold War promoted it. In the United States, the Defense Department needed translations of millions of words from Russian now. A Hungarian, Dr.Toma, was the right man at the right time: he bragged of a 300,000 word output per hour on a mainframe. There was no quality control - it was all confidential. Another company, Logos, translated Vietnamese. The keys were online bilingual glossaries, over one million terms in the case of Toma. Taxpayers paid for the enormous investment. Later, the Mormon Church tried MT and abandoned it. The European Community uses a minor part of translations by MT (Toma's Systran). Some private corporations have tried to profit from MT in the United States, in Europe (including Russia), and in Japan above all. I was told by the leading Japanese MT expert that there are so few human translators of Japanese that they must have MT. The Crux of the Matter (Machine Translation, that is) |
A machine cannot think (forget artificial intelligence for now). MT requires an online bilingual glossary, a transfer mechanism, and human post-editing as a minimum. If you happen to need 30-year-old terms from Russian to English (updated in part), you are lucky because a large glossary already exists (Systran). In other languages, vendors offer general glossaries of from 5,000 to 100,000 words, but it is unlikely that your particular technical vocabulary exists online in the language you need. So you run a count of words not found. A document with a corpus of 30,000 (the total amount of words) may include 14,000 words that are not found. Every word not found, including proper names, misspelled words, unknown acronyms, even verbs and pronouns, has to be researched (in dictionaries), input, coded and tested. The amount of time and money needed is prohibitive. Remember, the machine has rules, but does not know any words other than those in the original online glossary! The transfer mechanism -- grammar, word position etc. -- is not as critical and sometimes quite good. Even post-editing is tolerable. Probability, Statistics, Predictability - the Essential Elements |
Assuming we work in private industry, the investment in one document is unreasonable. Assuming there is a guarantee that in the next three years there will be 300 documents with a similar vocabulary, then the ratio of investment to output would be favorable. But, generally speaking, the private sector cannot predict such similar documents because the market and technology keep changing. The Public Sector: Limits, No Competitition or Profit Margins |
Take the field of weather forecasting. The TAUM (Automatic Translation System of the University of Montreal) is a classic example. Meteorology is stable, limited and predictable. The French forecast follows the English one throughout Canada in 20 minutes, and almost without human intervention. A private company has contracted with the government. Great!! The problem is hidden. The government asked the TAUM group to design a similar system for aviation hydraulics. After 3 years, the MT people gave up. Human translation was faster and cheaper!! Even this limited field was too complicated. Public sectors offer some great opportunities: The PanAmerican Health Organization has a first class MT system, called SpanAm (Spanish American). One language, Spanish, is spoken all over Latin America (except in Brasil). Health terms are relatively stable and documents repeat year after year. An outstanding example. But the technology is not available to outsiders. There have been disasters, like the "Eurotra" project for Europe!! Companies like Unisys, Xerox, Caterpillar, Siemens and John Deere have tried MT, but these are only a few compared to the thousands of global corporations. My recommendation is to stick with all kinds of CAT systems. There is little chance that private translation agencies could use MT. Think of consistent terms, fuzzy memory and the likes where the computer is your assistant, not your master. Research into Machine Translation (MT) dates back to 1933. Developments in the field have been multiple since then and the latest work proves that interaction with CAT tools opens new paths for the translation industry and the professional translator. These articles provide an introduction to MT -past and future, working systems, sites for research and companies using this technology- and some interesting thoughts on how it will affect translators' future. |  |
| | |  | | This report contains valuable analyses of criteria for MT evaluation, and was produced in 1979 for the European Community by synthesizing the contributions of a wide set of experts. The Evaluation Work Group of the ISLE project believes that this work is insufficiently known and used and now, thanks to Maghi King's initiative, the document has been digitized at ISSCO/TIM/ETI, University of Geneva,and published on the ISLE/EWG website. |  |
| | |  | | This is the PostScript, and HTML, version of D.J. Arnold, Lorna Balkan, Siety Meijer, R.Lee Humphreys and Louisa Sadler Machine Translation: an Introductory Guide, Blackwells-NCC, London, 1994, ISBN: 1855542-17x. The book is now a classic in the field of MT and covers aspects such as MT in practice, representation and processing, engines, dictionaries and evaluation. It is a must-read. |  |
| | |  | | This article deals with some of the problems involved in using the AltaVista/Systran MT service. The author points that real-time MT systems bring a new dimension to international information transfer, but NOT to translation. |  |
| | |  | | The author draws the difference between MT tools -that use the computer (the machine) to perform a total translation online- and CAT tools 뻯hat use the computer as a tool to assist the human translator-. He regards MT as one of many tools in CAT. |  |
| | |  | | This article explains how to maximize the results of your work by using Machine Translation. |  |
| | |  | | John Hutchins, one of the most relevant figures in MT research with such revealing publications as An Introduction to Machine Translation (published by Academic Press), offers in this article a comprehensive digest of MT and advises on "translation brokerage" services, on-line and real-time translation of electronic mail messages, and the potential market for network MT systems, including multilingual access to information sources. He also addresses the critical issue: Where do these developments leave the professional translator? |  |
| | |  | | The complement to the previous reference by John Hutchins. |  |
| | |  | | John Hutchins, one of the most authorized voices in the world of research and translation automation, reflects on the future of multilingualism and Europe. Provided by HLTCentral.org. |  |
| | |  | | "Wired", this must-read magazine on technology and social issues, devoted its May 2000 issue to MT. This is the first of a collection of articles reviewing MT's past, future, sites and latest developments. |  |
| | |  | | Why does the future of MT never seem to arrive? In an attempt to find an answer to this question, the author visited researchers at Lernout & Hauspie, IBM, Carnegie Mellon University and New Mexico State University and came back with a very interesting insight into the issue. |  |
| | |  | | A look at the most important research centers for machine translation. |  |
| | |  | | A directory of machine translation tools online. |  |
| | |  | | A usual concern among human translators is that machines will take over their business. On the one hand, prophets of doom announce a general crisis sending human translators onto the dole. On the other hand, any reasonable person who has tried MT software knows that human translation will be around for quite some time. |  |
| | |  | | Patrick Meadows, associate editor at UPSIDE magazine in Austin, Texas, comments on MT as a business communication tool, focusing on a particular system, Transparent Language's Enterprise Translation Server. |  |
| | |  | | Electronic repository (including articles, books and papers) on machine translation and computer-based translation tools. Compiled by John Hutchins. |  |
|
 |
|
|