繁简异体字转换 模糊消解方法 补苴

 

胡双宝*

 

 

  《语文建设通讯》第87冯霞女士所论繁简字字形转换的模糊消解,实际上是要从不同角度“教”会电脑各种各样的本事,也就是要针对每一组字的不同情况规定若干条件。而情况常常是难以穷尽的,这时候想到这些情况,不知道什么时候又可能出现别的情况。“已有情况”也並不容易搜罗齐尽。以稿所举“云”字为例,古汉语动词“云”,前面可以出现名词、动词、副词、连词,前面还可以什么也没有(即前有标点),又各可以是单音节、复音节,条件複杂,不大可能尽举尽列,而作到与“雲”区分。列举“雲”出现的情况也许相对容易一些,“雲”字前面大致多为单音节形容词或者动词“有”。下面所列,体现多种情况:“層雲  低雲  浮雲  黑雲  積雲  捲雲  彤雲  星雲  疑雲  隂雲  中雲  蘑菇雲  捲層雲  高層雲  雨層雲  淡積雲  火烧雲  甯P雲  雷雨雲  直展雲  波狀雲”等等。但是,白居易《秦中吟·歌舞》“秦城岁云/雲暮,大雪满皇州”,不容易根据条件确定是“云”还是“雲”。

再如“里”字“乡里”就有邻里义和乡义1(“乡堻q知”是乡政府通知“回到乡堙谷雂皉釵^到乡政府/回到乡村边二义);而“市里”则是与“公里”相对的华里与城市边或市政府(堙^的同形“海里”则是长度单位(里)与海边同形“二里沟”“十里堡”符合{数词 +“里”+(描述对象)},这只能管住一部分,管不住“永安里、知春里”等“数词 + 里”,对“三元里”可能无效“堳ョ享O“里室”有别,後者义为邻里的住宅《左传·昭公三年“而为里宅,皆如其旧”)

jǐn 的“儘”,还常出现在名词性词组前边,如“儘他拿”“先儘老年人坐”“儘明天走的人挑”“儘最大的拿”等等,把名词性词组规定为条件,可能太宽泛。

前几年我写过一篇文章,谈繁简字、异体字电脑转换的语文条件,说及一些自认为难以简单区分的字。看似简单的“表—錶”“錶”只用於计时器“手錶、懐錶、鐘錶、跑錶、秒錶、夜光錶、電子錶、瑞士錶、鐘錶行”等,鲁迅曾经翻译过班台莱耶夫的《錶》,那时候不写“表”“錶”字不用於同属仪器类的“仪表(该词又有人的仪容义),所以“電表、水表、欧姆表、寒暑表、晴雨表、液压表”等不能写“錶”。偶见台湾有写“體温錶”者,恐怕是错用。如果给“錶”规定条件,不能以机器、机械、仪器为条件,而只能是计时器。可这个条件似乎太严苛。

“蠟”简化为“蜡”,但“蜡”本读 zhà,实际是借形。“蜡”在古文堣较常见。曾经看到把《礼记·郊特牲》“蜡之祭,仁之至”转成“蠟”。现在一些古籍改排成简化字本,遇到“蠟”,自然排成“蜡”。可也有人根据简化字本引用於繁体字文稿,遇到读 zhà 的“蜡”,便不分青红皂白地排成“蠟”。这是“模糊消解”难以估料对付的。当然用读音区别最简单,但是恐怕使用者意识不到这读音不同。

“臘”简化为“腊”“腊“又读 ,指乾肉,也有类似的问题。

“剋”表示克扣、克制等意思,读 ,简化为“克”。但“剋”又读 kēi,这时候不能用“克”。近见有的词典把“挨剋”的读音注成 áikè,显然是把“克—剋”当成一对一的繁简关系了“克—剋”这一组字仍是一简“克”对二繁 “克、剋”“剋”用於北方话,尤其是北京话,但现行规范字里没有它的地位。於是就有人写“克”或者“苛”,北方人大约可以体会猜测到是“剋”,其他地方的人看了则会不知所云。

我还举过“制—製”的例子。笼统说,前者是制度义,後者是制造义。编制表格用“製表”。帝王的命令也称“制”,臣子的奏章也称“表”,这种情况的“制”、“表”连称,写成“制表”,不能写“製”,虽然是词组,书面上则是连写。制定规划等要写“編製”,一个部门的机构设置和人员配备叫“编制”(这个处的编制是三科一室)。规定条件区分这两种情况的“制—製”,也许过於细,而且还会有想不到/没有想到的情况,无法规定到条件堙C

简化字里像“灕”只用於广西 灕江,其他场合都用“漓”,这样的情况是很少的。

下面说两个特殊的简化字。

“镕”,1993年已经有文件指明:除了熔化义“鎔”还有铸造、铸器模型等义,这些意思不能用“熔”,应当用“鎔”,类推简化为“镕”“镕”的身分是正式的简化字,但是除了人名,人们照样写“熔”。我看到过1993年以後两家出版社分别出版的简体字本《四库全书总目提要》,该写“镕(鎔)”地方,写的是“熔”。其实,编《四库全书总目提要》时还没有“熔”字呢。区分“熔”“镕”的条件,似乎很难规定。但文献时代可以帮助确定写“熔”还是“鎔”,如果是清代中期以前的书,不能写“熔”。

说到时代,有一部分简化字对应的繁体字是後起字,简化字更古老一些。比如“御”的防御、抵御义,早见於《诗经·邶风·谷风》“我有旨蓄,亦以御冬”。这个意思,後来产生了“禦”。今本《诗经》“御、禦”互见。我们不能断定《诗经》时代都用“御”,所以只能个别问题个别处理。类似的还 有“须、从”等字。

再就是“馀”字。这是《简化字总表》“余”字的注“在余和馀意义可能混淆时,仍用馀。如文言句‘馀年无多’。”按理说,这个“馀”字是繁体字“餘”的类推简化字,可是在《简化字总表》的第三表堿d不到,从拼音查、从简查繁、从繁查简三个检字表堻ㄛd不到。因为只是对“余—餘”的补充说明,它只能算半合法简化字。至於“可能混淆”,怎么让电脑理解、掌握並且区分呢?社会文字生活中的实际情况是,知道可能混淆的混淆不了,不知道可能混淆的常常会混淆。我不知道各种各牌电脑的智商是否一样。如果不一样,还得制定适应不同性能电脑的不同规则。清代 赵翼《陔餘丛考》“陔餘”的意思是奉养父母之余暇。如果写成当第一人称代词讲的“余”,意思大不一样。毛泽东《沁园春·咏雪》词有“望长城内外,惟餘莽莽,大河上下,顿失滔滔。”如果用“余”,就是只有我……。汉字简化以後,人民文学出版社印《毛主席诗词》时,主张用“餘”,特向毛泽东的秘书田家英汇报,後来田家英回覆说,毛泽东同意出版社的意见。1964年公布的《简化字总表》里加了那个注。後来印这首词时,都印为“餘”或“馀”。不过,规定区分“余—馀”比较简单:“余”只处於主语、宾语的位置。而“餘”则多在後。

稿说,《现代汉语通用字表》7000字中共有121组非一一对应的繁简字。似乎漏了两个字。

“證”简化为“证”,但“證”与“証”是两个字。简化了“證”,不等於简化了“証”,尤其不应当理解为简化了“証”“証”的意思是直言相劝,如《吕氏春秋·贵当》“其朝臣多贤,左右多忠,主有失,皆交争証谏。”高诱“証,亦谏也。”虽然“証”後来也用于证明义。

“只”对应量词“隻 (zhī)”和副词“衹(zhǐ,这里据1986年重新公布的《简化字总表》,以前的《总表》作“祗”)”。条件比较简单:量词“隻”,除了“隻身、隻眼、隻影、隻句、隻立、隻雞絮酒、独具隻眼、隻字不提、隻輪無返、隻言片語”等,只出现在数词和指示代词“这、那、哪”等之後;副词“衹”则出现在动词以及形容词之前。副词“衹”,在繁体字系统,至少从20世纪以来,多用“只”,近几十年,繁体字世界为与简化字区别,或者一些人刻意趋古,用“衹”反而多起来,这是不正常的。

 

包孕异体字必须考虑在内,尤其是一些常用字。後面第3节所列103组,並不全。下面说其中几个字。

“菉豆”的“菉”合併並简化为“绿”。但“菉”读 又指荩草又用於地名江苏 昆山 菉葭浜1964年改为陆家镇)、广东 吴川 梅菉广西 防城港 大菉福建 连江 苔菉,均为县以下地名。

“遊”合於“游”。“遊”的义项多,而“游”只限於在水中活动,又用於姓氏。福建省 仙游县陕西省 麟游县本作“遊”,因为仙是神化的人,龙是传说中的陆地兽。浙江省 龙游五代 吴越所设,存在於今。隋朝明朝四川 乐山龙遊县。几百年间,龍游龍遊同时存在(虽然不在同一个省),正是因为字形的区别。

“谿”合併入“溪”。浙江省本来有慈谿兰谿汤溪1959年併入金华),江西省本来有资溪贵溪金谿湖北省竹谿,一律改用“溪”。“谿”和“溪”的字形区别在於分别以“谷”和“水”为形旁。高诱注《吕氏春秋·察微》“若高山之与深谿”时说,“有水曰涧,无水曰谿”。此处“深沟”,意为无水之沟。後来虽然“谿”也指有水的沟,与“溪”混用,但当初命名用“谿”,是着眼於无水。现在至少不能把有水无水作为区分这两个字的条件教给电脑。

“冒烟与“冒煙”可通,但不能写“冒菸”“菸只用於烟草、菸葉,这个条件简单

1997年,参观重庆市 奉节县 白帝城,“托孤堂”三个大字赫然出现眼前,我愕然:明明是刘备诸葛亮託付後事,辅佐刘禅治理蜀汉,却变成临危的刘备手托刘禅交给诸葛亮刘备去世时,刘禅已经十七岁,是不需要托,也托不动的。“托—託”都是动词,“烘托—恳託”“衬托—拜託”“托盘—託身”“双手托人飞转—託人带信”等等,不大好规定条件。似乎“○托”是具体的物体“○託”是抽象的事物,但也不尽然。托儿,是把小孩委託别人照看,虽然多写“托”。而作为替身引诱人上当者的“托儿”,是假托义,应该是“託兒”。严格的“托儿”则指物体的托衬物。

《语言文字法》规定,姓氏中可以用异体字“仝”是姓氏,不能写“同”。

立足於现代应用《语言文字法》没有规定名字可以用异体字。这明显意味着不主张现代人起名字再用已经停止使用的异体字。我以为,古人名字用字应该予以尊重,尤其是名人。比如元代书法家赵孟頫,如果写成赵孟俯,读者会以为是另外一个人。就是一般人,他的後人记述祖宗世谱,肯定要用原来的字,而不会用合併以後的通行字。假如赵孟頫的後人追述祖先追到宋孝宗,一定不会用“慎”,而要用“昚”。同理,唐代诗人卢仝,也不适合写“同”。

明朝来华的葡萄牙人有个取中国名字傅汎际的,写成规范体“泛”,也许问题不大,但西汉农学家氾勝之,名字写“勝之”可以写成“胜之”,但姓不能写“”。

一对多或者多对一的繁体字和简化字互转,尤其是简转繁,以及包孕异体字的正确选择,实际做起来会遇到许多意想不到的问题,需十分仔细。上面所举,提供研制者参考。

 

包孕异体字103不全

暗晻闇 背揹 奔犇 并併並 布佈 采採寀 彩綵 尝嘗嚐 澄澂 棰箠 锤鎚 村邨 锉銼剉 呆獃 荡蕩盪 抵牴 雕彫 吊弔 豆荳 遁遯 厄阨 仿彷倣髣 泛汎氾 佛髴彿 俯頫 构構搆 挂掛罣 拐枴 果菓 皓皜暠 和龢 核覈 哄鬨 欢歡懽讙驩 毁燬譭 奸姦 僵殭 侥儌 杰傑 径逕 局侷跼 巨鉅 扣釦 裤褲袴絝 坤堃 昆崑 厘釐 栗慄 炼煉鍊 梁樑 淋痳 绿菉   仑侖崙 麻蔴痲 绵緜 乃迺 念唸 娘孃 匹疋 戚慼 凄悽 榷搉 绕繞遶 睿叡 升昇陞   尸屍 实實寔 搜蒐 苏甦 坛壇罎 同仝 偷媮 托託 玩翫 挽輓  喂餵 溪谿 席蓆 闲閑閒 衔啣 效傚 幸倖 凶兇 修脩 熏燻 烟煙菸 扬揚颺 夭殀 移迻 荫蔭廕 游遊 欲慾     愈癒瘉 岳嶽 赞讚 扎紥紮 札劄 沾霑 占佔 志誌 周週 注註 伫佇竚            

 

 

 

 



* 胡双宝先生, 北京大学出版社。

1. 本文行文中区分“並—倂,堙X里,於—于”等字。