汉语拼音发展路径图

吴文超

 

面对国际单一罗马化书同文的前景, 中国语文需要改变范式

(paradigm 或通盘设想),通过落实一语双文倡议来发展字母范式

 

字母符号系统

两千多年前在地中海东岸诞生的拼音文字已经为大多数语文所采用。 拼音文字能够把形、音、意紧密结合起来,大大减轻学习负担。符号数目小和封闭性的音素字母便利语文的学习、书写和机械处理。 字母系统是古代欧洲从地中海东岸引进的最伟大发明。字母文字孕育出光辉灿烂的希腊和罗马文明。 优势语文促进政治、经济、文化的发展, 使国家富强起来。历史上字母文字随着武力扩张而传播开来。 虽然迟了两千多年, 但字母文字终于进入中国这个硕果仅存的非字母大国, 产生日益深远的影响。

 

语文挑战的回应 -- 范式的改变

世界众多语文都经历过字母化改革。尽管汉语简洁灵活,但非字母汉字阻碍语文发展。环顾世界,字母文字社会不需要非字母文字, 而非字母文字社会却需要字母的辅助。 例如字母辅助教学和语文信息处理。 中国目前在语文领域的头痛医头办法是不足够的, 就像清末洋务运动那样无济于事。 基于穷则变,变则通的道理, 回应字母文字挑战有必要采用改变范式的办法。中国需要摆脱着重民族形式的纯洁语文陷阱, 通过发展一语双文来建立强势的字母文字。 鉴于中国缺乏字母传统, 有需要长期实行一语双文制,以便乘先启后,延续和发扬光辉的传统文化。

 

十九世纪面对西方列强的侵略,中国的回应不足以抵御外敌。 经过无数次失败后, 出现冷兵器让位于热兵器的范式改变。民族形式武器逐渐消失,而传统的武术得以艺术形式保存下来。语文领域面对的挑战也需要类似的变革。非字母文字像冷兵器,而字母文字则像热兵器。中国成功改变语文范式后,洋文最终也会像洋枪、洋炮那样成为历史名词。

 

我们可以利用先进科技来支撑汉语文的使用,但汉字编码却进一步增加语文学习和使用的成本。中国盛唐时周围地区没有文字, 而今天却被拼音文字包围。原来采用中文的韩国和越南已经改用字母文字。日本的汉字使用也在收缩。英文成为科技领域的教学和科研语文,信息技术方面尤其如此。 在开放性社会里, 似乎没有什么办法能够阻止人们改用更有效的语文。汉语拼音已有半个世纪历史了。拼音发挥的作用虽然因缺乏文化传统而受到限制,但其成果是有目共睹的。 拼音的应用已经从注音识字扩大到包括辞典检索,中文输入处理,和人地名转写等方面。 归根到底, 改用字母文字范式才是语文挑战的有效回应。 为了促进语文范式的改变,本文探讨从汉语拼音到字母中文的发展路径图,提出一些具体建议来克服发展进程中出现的困难。作者归纳出的发展原则是: 汉语中心,结合英文,字母标调,一语双文。 这里结合英文的考虑主要在于减低语文壁垒,增加双语的学用效益。盼望大家能够取得共识,避免多走弯路,以便早日实现语文现代化。 

 

世界语文新趋势 -- 单一罗马化

字母化是世界语文的共同发展方向。但在表音和表意之间往往出现鱼与熊掌的取舍。英文虽然着重表音,但往往为了保存表意词根而放弃更为简洁的拼音。例如night,knight; know,no;和two,too等都保存了不发音部分。 保留外语词的独特拼式有保存词源信息的作用。在今天的“战国”时代,使用罗马字母的语文采用的单一罗马转写法其实应用了中国秦代的书同文语文规划原则--只求同形, 不求同音。 二十世纪70年代,联合国地理名词委员会通过决议,规定对非罗马文字国家的地名采用名从主人的单一罗马转写式。从那时起, 西欧各语文里,中国首都一律拼写为Beijing。单一罗马化的考虑是:信息技术需要单一字符标签(地名标签),读音不在考虑之列。况且就算音译地名,也不见得能读得准。这一点从中文音译外国地名中可以看出来。虽然‘加拿大’和‘土耳其’的读音跟英文Canada Turkey 出入颇大, 但却不妨碍它们在汉语中的使用。在诸如检索、自动化信息处理、光学字符识别等领域, 迫切需要的是书同文而非语同音。当前罗马文字书同文的应用已经扩大到包括人名、新词和标签等领域,以便克服语文壁垒产生的困难。考虑到单一罗马化的趋势,中国语文现代化的范式改变应该是字母化而非拼音化。

 

地名拼音

汉语拼音地名除了Shaanxi省采用字母标调之外一般不标调。由于汉字信息量高,不标调也可以加以判读。 拼音地名却不同,很难把声调读出来。幸而拼音地名经常跟汉字连用, 因此不存在读错的问题。外国人把北京读作Bei1jing1问题不大,反正预计他们是读不准的。 不过, 如果地名采用如Shaanxi字母标调拼音, 除读音更明确外还能把跟Shanxi省区别开来。     

 

姓名拼音

由于单音节拼音对应多个汉字, 拼音姓名无法还原为中文。为了避免混淆,香港身份证一贯附上姓名电报代码来作区分。笔者研制成功与汉字一一对应的单码具有定音、定调和定字的特点。例如 武wu32¸wu35 (表示wu,3, 和分别为第2和第5个字)。 我们也可以利用单码来给汉字姓名排序, 把写法相同的同音汉字排在一起, 也可以用单码向非汉字系统传送可读性高和能够还原为汉字的姓名信息。 

 

汉语拼音的网络应用

1958年第一届全国人民大会通过旨在辅助普通话教学的汉语拼音方案,采用符号标调。汉语拼音比注音符号优越, 不仅因为它使用符号少的罗马字母, 而且其音素制容许改变拼法来作区分,例如把‘文字’和‘蚊子’分别拼写为‘wenzi’和‘wenz’。 不过, 音的标调符号和字母Ü不方便键盘处理,连中文打字机也没有标调符号。如果汉语拼音能够彻底采用国际流行的字母, 效果肯定会好得多。

 

针对上述情况, 国家语言文字工作委员的“汉语拼音方案的通用键盘表示规范” 已于200161日生效。其中包括规定用 v来替代Ü, ea 来表示和用数字12345来分别替代四个声调及轻声。 这个规范作为注音和拼写普通话的键盘变通办法是有好处的。 五十年代汉语拼音设计者们考虑到字母国际接轨问题,但可能由于当时键盘尚未普及, 因此没有周详地考虑键盘的兼容问题。今天在长期键盘使用实践基础上适当地修改拼音符号系统是合理的。

 

鉴于替代用法会形成习惯,有可能进一步成为未来的标准,我们应该提出意见。笔者认为,v 在英文和方言中有不同于ü的发音。 我们总不想把DVD读成D吧。 以ny替代ü的做法又因 y可能与后面音节结合而不宜推行(例如:jinyu可以被读成jin-yu金鱼或ji-nyu妓女)。 那么用eu来对应ü会好得多,金鱼和妓女分别为拼写为jinyujineu。 至于12345 的使用, 实际上混淆字母和数字两套符号系统。 不但会因增加符号而减慢击键速度,而且不利于以后拟定跟同音异写汉字对应的同音异拼。 

 

从标原调改为标变调

汉语拼音的标原调规定似乎以原则上保持与汉字对应为理据。 但这样做却增加学习和记忆变调的负担。 改标变调更能发挥拼音准确表达语音和声调的优势 目前的标原调规定令语音合成技术无法单靠标调拼音来进行变调,因为在处理变调时,语音合成输出变调与否取决于汉字而非标原调的拼音。 这样做导致增加语音合成的复杂性和技术难度。如果规定标变调,还可以考虑增加前、后半3声标调符号, 以便更好地反映声调的实际变化。 考虑到字母范式并非纯拼音范式和字母化中文不需要标调符号,应该规定标调符号只适用于教学和词典注音。

 

输入法 -- 分词连写,字母标调

不标调单音节平均有25个同音, 双音节减为1.7, 三音节1.2个而四音节则基本上没有同音。这也许是中文成语多为4音节的缘故。 根据这项统计,分词连写大大减少同音。连写的拼音输入法除较有效之外,还可以巩固分词习惯。 语言学家是为了更好地纪录多音节汉语而主张分词连写的,而便利汉字输入只是附带好处而已。 如果要让拼音与信息量高汉字更加匹配,就需要增加音节数目。加入声调信息是增加音节数目的好办法,而字母标调有两个好处: 1.不增加符号,仅靠改变或增加字母来标调,便利快速盲打。 2. 容许同音异拼,进一步增加拼音信息量。 除非为区别多音节词所需,字母标调以多同音词的单音节词為對象。无同音混淆的双音节词不必沿用单音节的标调, 一种标调拼式也可以代表几个汉字。前者如:jjin ,jintian今天; 后者如:  zhiishi指使; zongzhii宗旨。 字母标调拼式明确,例如: 使用, 适用, 实用, 试用,食用可分别拼写为shiyong,shxyong, shycyong, shxyong, shicyong, 这类词的稳定拼写式能更好地表达词义和词性。 电拼输入法对2000个单音节词进行字母标调定形,加上400多个不标调预设词,取得覆盖99%现代汉语词的优秀成果。通过适度增加拼音复杂性来取得表达语素功能对一语双文的发展是很有利的。 由于电拼输入法可以发挥文字功能, 一语双文的初阶很可能是实现电拼和汉字双轨制的网络双文, 即把汉字文本反向转换为其镜面电拼文本。   就输入法而言, 不使用定形拼音也可以用挑选同音词方法输入中文。 因此,电拼的学用有很大灵活性, 字词使用频率的巨大差别让用户只需要掌握一两百个定形拼法就可以大幅度提升输入速度。汉字利用同音异写来区分词义,例如: , ; , ; , 市等, 形拼音也可用同音异拼与之相匹配,例如:大兄, 大凶拼写为da xiongb, da xxiong; 走进学校,走近学校拼写为 zou jin xuexiao, zou jinn xuexiao; 茶室, 茶市拼写为char shif, char shik; 而香蕉, 橡胶则拼写为xiangjiao,xiangjiaob。 同音异拼抽象地继承了汉字传统的分化同音词方法。由于文字是千百万人经常使用的工具,很难规范其使用和发展。语言学家研究中、英文语素的结果显示,这两个极不相同的成熟语文都有大约7,000多个语素。 因此,就语素的数目而言,字母中文2,400左右定形拼写式尚有很大的增长空间。 

 

拼音中文、正词法和同音异拼

令中文处理成本大增的编码应该被看作为应急的暂行办法, 很难想象长期使用下去。在优胜劣败的竞争下,文字的应用需要考虑成本效益原则。在一个开放性社会里,人们自然会选择使用不需要编码的语文。英文目前在这方面有巨大优势。因此,有效的回应强调创制高效字母文字, 兼有明确和易学易用的特性。虽然无数人经常使用的文字很难彻底改革,但电脑中文输入法提供千载难逢的机会。 因为符合语言学原则的输入法能够发挥文字功能。它一方面辅助汉字信息处理, 另一方面又与汉字构成一语中的双文之一。

汉语拼音正词法基本规则 (中华人民共和国国家标准 GB/T 16159-1996) 提出分词连写的标准。 目前欠缺的是在正词法基础上编制拼音词典。正词法句头大写的规定是有商榷余地的。鉴于拼音音节只有四百多个, 跟英文的七、八千音节相差甚大。 如果刚巧在句头的普通词被大写了, 例如背景(beijing) 、程度(chengdu) 、伤害(shanghai) , 便会跟Beijing, Chengdu Shanghai等地名混淆起来。 句头大写在英文偶然也出现歧义,例如china 瓷器因大写而变为 China中国。  由于汉语一向没有句头大写习惯,大写应只限于专名,而句头通名不必大写。  

 

下表举例说明汉字、电拼和单码的关系:

 

名称

操作程序

例句

电拼

键盘输入

shan qiong shui jinx yys wur lu, liou anh hhua mirng yiu i cun

汉字

转换输出

山穷水尽疑无路, 柳暗花明又一村

单码

自动转换

$C  shan11qiong21shui31jin426 yi22 wu213 lu41 vdw1 liu31an42hua11ming21 you41 yi11 cun11

对应中文

单码反向转换

山穷水尽疑无路,柳暗花明又一村

 

注意:字母标调的电拼不用数字,单码则用数字定调和定字。

 

 

 

 

语文国际接轨

因特网 (互联网)克服时空隔阂,加强全球化势头。 时空分隔导致语文独立发展的条件不复存在。今天语文发展的大趋势是国际接轨和减低语文壁垒。 人们直觉地感到全球村需要共同语。 就语文固有的功效来说,高度逻辑化和规律化的世界语(Esperanto) 比英文更明确和易学易用。 然而, 如果不通过设立世界语文组织来大力支援,世界语很难跟拥有政治、经济、文化优势的英语竞争。 有人甚至认为,英语已经取得世界共同语的地位。 无论如何, 汉语文有必要通过吸收英语词汇来加强其生命力,并且让诸如字母读音、标点符号和拼音字体等次级语文系统尽可能与英文兼容,以便减低语文壁垒, 为未来建立全球化书同文创造条件。   

 

语文国际接轨方面还可以考虑:

 

1.    采用英语字母读法。这也许会稍微增加教学困难,但字母读法单一化很有好处。 况且采用音节直呼教学法也许不大计较字母的读音。 事实上, b, p, m, f 按照注音字母读法读成 bopomofo也无不可。 不过,采用英语字母读法有减少语文壁垒和字母读音混淆的好处。

2.    直接引进外国人、地名和新词(落实罗马字书同文)。 表音不准确的文字基本上发挥类似汉字的标签作用。 但使用汉字的成本却高得多。我们只需要知道omelette是法式煎蛋,spaghetti是意大利面条, salad是生菜冷盘,coffee是饮料, 即可以享用它们。 传统上,中译外语词采取选用通名或音译办法, 例如gongdola译为(意大利威尼斯的)凤尾船;(载客上下山的)缆车。 我们可以不吃西餐,但西药却往往非用不可,Aspirin, Motrin, Tyrenol, Ibuprofen, Acetomophin都是止痛药,药性不尽相同, 后两种药分别是第二和第三专名的通名(generic name),售价比较便宜。 如果通通把它们翻译为止痛药,会损害词的明确性和实用性。 英语通常音译专名,例如chow mian(有广东菜特色的)fry noodles, gungfu 则是(源于中国的)martial art武术。 把外来词改用拼音转写, 例如把salad,coffee,Shangri-la拼成为shala, kafei, Xianggelila,会淡化外来词的特色。 单一罗马化着重保存国际书写式,salad, coffee Shangri-la。 至于读法,可以有英读和汉读两种,随着双语能力的提高,可能越来越多人采用英读。 英国人读法语词也有这种情况, 例如buffet(自助餐)在英国的火车服务员中就读作buf-fet而不是法语的bufei。 汉语在引进外来词时最浪费的是为它们造新汉字: 例如 咖啡, 鸸鹋鸟(澳洲的emu)。 今天看来, 也许把咖啡翻译成为‘卡非茶更好些。

3.    采用国际兼容的标点符号。本来标点符号是二十世纪初才引进的, 没有固有的民族形式, 但现在中文标点符号比外文复杂。 标点符号国际接轨是一个容易落实和有利无害的做法,对字母中文尤其如此。 

4.    对于非汉化系统,例如在国际班航的机票务系统,字母中文解决无法使用汉字的困难。在任何没有中文字库的电脑系统里,字母中文可以传达汉字信息。与汉字一一对应的单码更能准确地保存全部汉字信息。

5.    拼音字母的字形应该接纳国际上流行的字体, 包括诸如Arial, Courier, Times New Roman等字体。

 

结束语

1958年颁布的汉语拼音在各领域中的应用不断在扩大。 回顾过去, 我们应该庆幸拼音的诞生。 如果今天不能用来拼写中国人地名; 用来进行汉字文书处理;和便利拼音排序, 中国语文的处境更加不利。 为了摆脱汉语文的使用困难,新加坡和香港都沿用英语为工作语文。 目前人们普遍着重学习英文而轻视拼音,主要因为学英语可得到更多好处。长此下去,汉字和拼音的使用势将收缩。值得深思的是语文是否必须保持独特的民族形式? 是否必须维护语文的纯洁性? 如果能够在语音稳定时代创制出高效的字母中文,不但可以与英文并驾齐驱,而且其表音准确和语法简明的优点可使之后来居上,成为强势的世界语文。 信息时代给中国语文拼音现代化开启一个短暂的机会窗口,一旦人们都习惯使用英文后,这个窗口可能永远消失。到时也许会出现能否保存核心语文的问题。希望大家和有关当局能够掌握时机,努力为实现一语双文而奋斗,让中国不再重蹈清末洋务运动失败的覆辙,避免语文出现全盘西化的厄运。

 

汉字作为传统文化载体,其艺术性必然会继续获得肯定和发扬光大。情况恍如今天风靡世界的中国武术。汉字书法也肯定会在艺术舞台上历久不衰。不过,在信息技术、人际和人机交际等领域,汉字的应用正在收缩,目前众多中国学者在科研和学术领域中已经能够熟练地使用英文,而这种趋势正在加强。语文习惯也会像穿衣服那样,人们在习惯穿西装后,就很难再穿起传统的民族服装了。

 

 

* 本文提交中国语文现代化学会第六次学术会议暨中国语文现代化学会成立十周年纪念大会于2004102325日在山东省泰安市召开的题为“信息时代的中国语文现代化会议。

 

作者:吴文超   前联合国资深翻译员,美洲中国文字改革促进会执行干事,高威软件有限公司主席兼总裁

 

联系电邮: apollowu@gowell.com

电话: (852) 2730-7121电传: (852)2730-7127

网址: www.wengai.com; www.gowell.com, www.gochinese.net

 

文改论坛和有关专题: www.wengai.com

电拼和单码(Dianpin & ASCII Chinese)详细资料, www.gowell.com

普通话网上通GoChinese教学软件: www.gochinese.net