回应 关于机器翻译之我见
王永成
虽然我的外语水平极差,但最近见到在《语文建设通讯》(香港)第89期上著名机器翻译理论家
冯志伟
教授的“一个关于机器翻译的史料错误”一文(以下简称冯文)之後,总有点“如鲠在喉”、有点“不吐不快”之感。
虽然我从来就不敢苟同“人定胜天”的豪言,但我对一些没有足够证据就断言不仅今天,而且在明天也“一定不可能”的武断,更难苟同。
冯志伟
教授在冯文中引用了“美国著名数理逻辑学家巴希勒在1959年就指出全自动高质量的机器翻译是不可能的”断言,并说:“巴希勒说明:全自动高质量的机器翻译不仅在当时的技术水平下是不可能的,而且,在理论原则上也是不可能的”。
当然,
冯志伟
教授是位严谨的学者。他一方面引用巴希勒的观点,但另一方面,好像他也没有公开表明自己已毫无保留地支持巴希勒的观点。他只是说:“在机器翻译的早期,巴希勒就科学地预见到了机器翻译将会遇到的困难”,只是後面又加了一句“显示了他的远见卓识”;
冯
教授的话显然可使人至少有下述二种意义不同的解释:一种是他也赞成:“开发出全自动高质量的机器翻译系统是不可能的”的论断;另一种是:“机器翻译将会遇到困难,开发出全自动高质量的机器翻译系统将更加困难,也许还是不可能的”;……。
从力图准确地理解
冯志伟
教授的这段话即可看出:自然语言理解本身就是一个难题!根据我多年对机器翻译的观察,恕我狂言:依我看来,其实,机器翻译本身并没有什么不可克服的困难!真正的困难,难就难在人类对自然语言的理解和表述上。
自然语言理解的困难不仅使机器翻译困难,而且使人工翻译也并非容易。虽然,不少人认为:“从哲学上讲,自由只是对必然的认识与自觉地依从”。但对著名的自由诗:“生命诚可贵,爱情价更高,若为自由故,二者皆可抛”而言,我并不知其原文与原意是什么?但就专家上述译文来说,在其“无自由,宁可死”的华表的背後,却掩盖不了其逻辑上的不通:抛弃了个人生命何来个人人生的自由?否则,只能解释成这是:“为了他人的自由,我将不惜牺牲自己的一切”的政治宣传。我们又怎样将它译成英文呢?
如果对“Out of sight, out of mind”和“The spirit is willing, but the
flesh is weak”机器或人已知道了它真实的含义是“眼不见心不烦”和“心有馀而力不足”的话,我相信任何会表达语意的普通人或已能组合与表达语义的机器,只要多加推敲其表达方式,都是有可能给予正确的翻译的。如要译成中国的地方语言、译成中国儿童的语言或其它国的语言,在原则上,也不会是太难的!只不过可能不如上述表述那么精炼而已。
依我看,翻译问题,实质上只不过是同一概念的不同表示问题。正如“自行车”,它可“翻译”成天津人的“单车”;南京人的“脚踏车”;美国人的“bike”;而“How do you do?”则可“翻译”成中国很多知识分子初見时的“久仰,久仰!”
问题是如何“翻译”?因为,过去不少人总以斯大林的“词是语言的最基本单位”、“人是借助于词进行思维的”,也就是总误认为“词是思想的基本单位”,因此,过去的翻译,常常建立在词对词与所谓的词法及语法分析的基础上的。因此,过去建立在这类理论原则基础上的翻译系统就进展很慢,并且常犯错误、甚至是笑话百出;这就应当追根求源,重建理论!
其实,正如我从失败的实践中认识到,并在以後反复强调的:人们的思维基本单位是概念而不是词!正因为有人继续以词为思维的基本单位,那么,他就很难正确理解和翻译“How do you do?”“Out of sight, out of mind”、“The spirit is willing, but the flesh is
weak”与“狼来了”这类的句子;但是,如果您以概念为単位,就不难将这类的句子甚至用你所熟悉的任何一种语言表述出来。
问题仅仅是:如果能找到字符、词、辞、短语、句子、字串等与概念之间的种种最简映射关系,你就能更方便、更智能、更快捷与更高质量地完成翻译的任务。此事,对机器来说,也应当是如此!我想:即使对冯文中的句群:“John was looking for his toy box.
Finally he found it. The box was in the pen.”利用了仿照人类实际上一直在使用的概念及概念场(或称概念相容规则)的仿人做法,并不是一定不能很好解决的。对这些问题,也许将来有机会,我们将对它们作一些专门的讨论。此地就暂不赘述。
我们还是先回到巴希勒的“全自动高质量的机器翻译不仅在当时的技术水平下是不可能的,而且,在理论原则上也是不可能的”论断来作进一步地讨论吧。
我要问:他用的是什么“理论原则”?就可以如此地武断!
“太阳每天都绕着地球在转!”这是用的“眼見为实”的理论原则;但现在哪个初中以上的人会不知道:事实上,地球一方面自转,一方面又绕着太阳在转,而不是相反?
“一分为二是放之四海而皆準的真理!”这是根据毛泽东的理论原则。但一杯水一分为二,就成了二个半杯水;一直分到水分子时,再分就分成了氢与氧,而不是水了。怎么能一直分下去?特别,这个“放之四海而皆準的真理”,它非常害怕人们:“请把一分为二这个真理也一分为二看看!”的追问。
“世界是有不以人的意志为转移的客观规律的!”这是用的所谓的“马克思主义”理论原则。但世界为什么会有规律?为什么是这个规律而不是另一种规律?你能给予合理的解释吗?
根据流行时新理论原则,很多人都喜欢说:“真理只有一个!科学揭示的才是真理”。甚至简化成:“科学就是真理!”甚至有人拫据这个理论原则,攻击“中医不科学,是骗术”。
但什么是科学?
中学几何告诉人们:“三角形三内角之和是180度”。这是不是科学?显然,大家都承认它是科学。
因为“科学的真理只有一个”!那么,三角形三内角之和就是180度了!
但後来出现了非欧几何,它们中的一种体系论证了“三角形三内角之和大于180度”;而另一种体系则证明了“三角形三内角之和小于180度”。它们是不是也都是科学?显然,迄今世界上还没有任何人能论证它们中的任何一个不是科学。那么,在我们生活的世界上,三角形三内角之和究竟应是多少度呢?
有人说:这不同的结论是在不同的条件下做的。那么,在我们生活的现实世界中,究竟哪一种几何才是真正的科学真理呢?
有人说,能揭示唯一真理的才是真正的科学。那么,欧氏几何与众多的非欧几何,谁是真正的科学?迄今又有谁弄清了?
因此,科学不等于真理!科学只是一种学问,一种方法论!而巴希勒的“理论原则”也许也是一种科学,但在这种理论原则指导下不可能做成功的,他凭什么就能断言:即使换了另一种机器翻译的理论原则也不可能做成功?
在“全自动高质量的机器翻译”即将取得重大进展的前夜,再来宣传巴希勒的这个囿見,似乎有点不合时宜了吧?
不过,我开篇第一句就说了“我的外语水平极差”。因此,上述讨论机器翻译的意見与“胡言乱语”,很可能全是无稽之谈。还望我的好友
冯志伟
教授等不吝指教以及请诸位大师谅解!
讨论 2008 奥运 与 语言 D H
1. 几个月前, 美国学者电邮来问:“
8”
与“发”其实并不同音, 为何中国人以为“
8”
字表示吉祥的“发”? 我回答:汉语(包括方言)的“八”与“发”的确不同音, 勉强可说是近音。反而日语的“八”和“发”音更近 (hati,
hatu)。“八”表示“发 (达)”, 以前各地并无共识, 大概源自香港。这三十年来, 港风北吹, 顺便吹去了许多迷信尘埃, 想不到连奥运也沾上了, 诚是憾事。回看历史, 其实许多带“八”的对中国不利, 甚至大大的不利。如“九?一八”、“一?二八”、“一二?八” 。今年的“八八”对格鲁吉亚、南奥塞梯亚、甚至世局, 也是大大的不利!
2. 2008北京奥运圆满结束。国际奥委会对这次奥运会的评语是“truly exceptional Games”; 中文翻译为“真正无与伦比的奥运会”。(据香港《明报》综合外电及中新社。) 中译是否恰当?读者以为如何?
3. 奥委会结束後第五天, 51位金牌运动员访港。我们的曾特首背向运动员(第二天某报大字标题“以运动员为布景板”)用粤语致“欢迎词”, 惭愧惭愧。我们不必妄自菲薄, 谨代表香港向运动员和国人赔礼!