香港中國語文學會 語文建設通訊第90期 2008 年 10 月


回应           关于机器翻译之我见

 

王永成*

 

 

  虽然我的外语水平极差,但最近见到在《语文建设通讯》(香港)89期上著名机器翻译理论家 冯志伟 教授的“一个关于机器翻译的史料错误”一文(以下简称冯文)之後,总有点“如鲠在喉”、有点“不吐不快”之感。

  虽然我从来就不敢苟同“人定胜天”的豪言,但我对一些没有足够证据就断言不仅今天,而且在明天也“一定不可能”的武断,更难苟同。

   冯志伟 教授在文中引用了“美国著名数理逻辑学家巴希勒1959年就指出全自动高质量的机器翻译是不可能的”断言,并说巴希勒说明:全自动高质量的机器翻译不仅在当时的技术水平下是不可能的,而且,在理论原则上也是不可能的”。

  当然, 冯志伟 教授是位严谨的学者。他一方面引用巴希勒的观点,但另一方面,好像他也没有公开表明自己已毫无保留地支持巴希勒的观点。他只是说“在机器翻译的早期,巴希勒就科学地预见到了机器翻译将会遇到的困难”,只是後面又加了一句“显示了他的远见卓识”; 教授的话显然可使人至少有下述二种意义不同的解释:一种是他也赞成“开发出全自动高质量的机器翻译系统是不可能的”的论断;另一种是“机器翻译将会遇到困难,开发出全自动高质量的机器翻译系统将更加困难,也许还是不可能的”;……。

  从力图准确地理解 冯志伟 教授的这段话即可看出:自然语言理解本身就是一个难题!根据我多年对机器翻译的观察,恕我狂言:依我看来,其实,机器翻译本身并没有什么不可克服的困难!真正的困难,难就难在人类对自然语言的理解和表述上。

  自然语言理解的困难不仅使机器翻译困难,而且使人工翻译也并非容易。虽然,不少人认为“从哲学上讲,自由只是对必然的认识与自觉地依从”。但对著名的自由诗“生命诚可贵,爱情价更高,若为自由故,二者皆可抛”而言,我并不知其原文与原意是什么?但就专家上述译文来说,在其“无自由,宁可死”的华表的背後,却掩盖不了其逻辑上的不通:抛弃了个人生命何来个人人生的自由?否则,只能解释成这是“为了他人的自由,我将不惜牺牲自己的一切”的政治宣传。我们又怎样将它译成英文呢?

  如果对“Out of sight, out of mind”和“The spirit is willing, but the flesh is weak”机器或人已知道了它真实的含义是“眼不见心不烦”和“心有而力不足”的话,我相信任何会表达语意的普通人或已能组合与表达语义的机器,只要多加推敲其表达方式,都是有可能给予正确的翻译的。如要译成中国的地方语言、译成中国儿童的语言或其它国的语言,在原则上,也不会是太难的!只不过可能不如上述表述那么精炼而已。

  依我看,翻译问题,实质上只不过是同一概念的不同表示问题。正如“自行车”,它可“翻译”成天津人的“单车”;南京人的“脚踏车”;美国人的“bike”;而“How do you do?”则可“翻译”成中国很多知识分子初見时的“久仰,久仰!”

  问题是如何“翻译”?因为,过去不少人总以斯大林的“词是语言的最基本单位”“人是借助于词进行思维的”,也就是总误认为“词是思想的基本单位”,因此,过去的翻译,常常建立在词对词与所谓的词法及语法分析的基础上的。因此,过去建立在这类理论原则基础上的翻译系统就进展很慢,并且常犯错误、甚至是笑话百出;这就应当追根求源,重建理论!

  其实,正如我从失败的实践中认识到,并在以後反复强调的:人们的思维基本单位是概念而不是词!正因为有人继续以词为思维的基本单位,那么,他就很难正确理解和翻译“How do you do?Out of sight, out of mindThe spirit is willing, but the flesh is weak”与“狼来了”这类的句子;但是,如果您以概念为単位,就不难将这类的句子甚至用你所熟悉的任何一种语言表述出来。

  问题仅仅是:如果能找到字符、词、辞、短语、句子、字串等与概念之间的种种最简映射关系,你就能更方便、更智能、更快捷与更高质量地完成翻译的任务。此事,对机器来说,也应当是如此!我想:即使对文中的句群John was looking for his toy box. Finally he found it. The box was in the pen.”利用了仿照人类实际上一直在使用的概念及概念场(或称概念相容规则)的仿人做法,并不是一定不能很好解决的。对这些问题,也许将来有机会,我们将对它们作一些专门的讨论。此地就暂不赘述。

  我们还是先回到巴希勒的“全自动高质量的机器翻译不仅在当时的技术水平下是不可能的,而且,在理论原则上也是不可能的”论断来作进一步地讨论吧。

  我要问:他用的是什么“理论原则”?就可以如此地武断!

  “太阳每天都绕着地球在转!”这是用的“眼見为实”的理论原则;但现在哪个初中以上的人会不知道:事实上,地球一方面自转,一方面又绕着太阳在转,而不是相反?

  “一分为二是放之四海而皆準的真理!”这是根据毛泽东的理论原则。但一杯水一分为二,就成了二个半杯水;一直分到水分子时,再分就分成了氢与氧,而不是水了。怎么能一直分下去?特别,这个“放之四海而皆準的真理”,它非常害怕人们“请把一分为二这个真理也一分为二看看!”的追问。

  “世界是有不以人的意志为转移的客观规律的!”这是用的所谓的“马克思主义”理论原则。但世界为什么会有规律?为什么是这个规律而不是另一种规律?你能给予合理的解释吗?

  根据流行时新理论原则,很多人都喜欢说“真理只有一个!科学揭示的才是真理”。甚至简化成“科学就是真理!”甚至有人拫据这个理论原则,攻击“中医不科学,是骗术”。

  但什么是科学?

  中学几何告诉人们“三角形三内角之和是180度”。这是不是科学?显然,大家都承认它是科学。

  因为“科学的真理只有一个”!那么,三角形三内角之和就是180度了!

  但後来出现了非欧几何,它们中的一种体系论证了“三角形三内角之和大于180度”;而另一种体系则证明了“三角形三内角之和小于180度”。它们是不是也都是科学?显然,迄今世界上还没有任何人能论证它们中的任何一个不是科学。那么,在我们生活的世界上,三角形三内角之和究竟应是多少度呢?

  有人说:这不同的结论是在不同的条件下做的。那么,在我们生活的现实世界中,究竟哪一种几何才是真正的科学真理呢?

  有人说,能揭示唯一真理的才是真正的科学。那么,欧氏几何与众多的非欧几何,谁是真正的科学?迄今又有谁弄清了?

  因此,科学不等于真理!科学只是一种学问,一种方法论!而巴希勒的“理论原则”也许也是一种科学,但在这种理论原则指导下不可能做成功的,他凭什么就能断言:即使换了另一种机器翻译的理论原则也不可能做成功?

  在“全自动高质量的机器翻译”即将取得重大进展的前夜,再来宣传巴希勒的这个囿見,似乎有点不合时宜了吧?

  不过,我开篇第一句就说了“我的外语水平极差”。因此,上述讨论机器翻译的意見与“胡言乱语”,很可能全是无稽之谈。还望我的好友 冯志伟 教授等不吝指教以及请诸位大师谅解!                                                           

 

讨论               2008 奥运 语言                   D H

 

1. 几个月前, 美国学者电邮来问:“ 8 与“发”其实并不同音, 为何中国人以为“ 8 字表示吉祥的“发” 我回答:汉语(包括方言)的“八”与“发”的确不同音, 勉强可说是近音。反而日语的“八”和“发”音更近 (hati, hatu)“八”表示“发 (), 以前各地并无共识, 大概源自香港这三十年来, 风北吹, 顺便吹去了许多迷信尘埃, 想不到连奥运也沾上了, 诚是憾事。回看历史, 其实许多带“八”的对中国不利, 甚至大大的不利。如“九?八”?八”一二?今年的“八八”格鲁吉亚南奥塞梯亚、甚至世局, 也是大大的不利!

2. 2008北京奥运圆满结束。国际奥委会对这次奥运会的评语是“truly exceptional Games; 中文翻译为“真正无与伦比的奥运会”。(香港《明报》综合外电及中新社) 中译是否恰当?读者以为如何?

3. 奥委会结束後第五天, 51位金牌运动员访。我们的曾特首背向运动员(第二天某报大字标题“以运动员为布景板”)用粤语致“欢迎词”, 惭愧惭愧。我们不必妄自菲薄, 谨代表香港向运动员和国人赔礼!                               

 



* 王永成先生,上海市 上海交通大学 电子信息与电子工程学院 计算机科学与工程系。