香港中國語文學會 最新文章 2011 年 12 月

 

《动态视角:词汇活跃度纵横谈》(江苏大学学报·社科版,2010年第期, pp.)

动态视角:词汇活跃度纵横谈
A Comment on Researches of lexicon’s activity from the perspective of dynamic

史有为(日本 明海大学)
SHI You-Wei(Meikai Univ.Janpan)

内容提要:本文从新词爆炸谈起,评论当代词汇研究,认为动态研究是当前词汇研究的突破方向,词汇活跃度则是动态研究中的重要课题。本文分析活跃度的观察尺度、研究内容、影响因素、制约机制和研究方法。本文最后探讨作为活跃度研究基础的辞书和词库,并评析与此相关的国内辞书不足之处。
关键词:词汇  活跃度  动态研究  现代汉语

Summary:  Beginning from the boom of new words and expressions, this research makes a comment on the current researches on lexicon. We propose that researching on the dynamic of lexicon is very important, and the research of lexicon’s activity is an important task in lexicon’s dynamic researches. This paper analyzes the scale of activity, the content of lexicon researches, factors which influence researches, restraint system and research methods. Finally this paper probes into the dictionaries and corpus which now serve as the basis of lexicon activity researches. And then we point out the shortages in the dictionaries concerned.
Keywords:  lexicon    activity   dynamic    modern Chinese

1. 由新词爆炸谈起
进入信息时代,让我们感受特别强烈的就是新词爆炸,新的词语层见叠出,多不胜收。跟不上时代,跟不上词汇发展这种感触尤深尤烈。稍稍上网,稍稍阅读面向年轻人的媒体,一大群新词语就纷至沓来,应接不暇,有的词义模糊晦暗,有的甚至茫然难知。其中信息技术为我们带来的新词更感同身受,其数量可以百计,甚至上千。
即以“-客”为例,自从“纽约客”很早创译以来,以后又有专名“必胜客”一起迎合食客心理而在众多比萨店铺中稍领风骚。这个“-客”受追捧还得归因于当今IT界大名鼎鼎的黑客,不久之后就有鼎鼎大名的博客/部落格跟进;未几,播客再接着上场。而受此影响,威客、飞客、拼客、杀客、狼客、职客等等普名或专名,形形色色地也争相登台,或译或创地,各占一席之地。
若以“网-”作例,自网络/网路出世之后,网站、网页、网址、网志、网民、网虫、网友、网恋、网游、网点、网际、网卡、网屏、网评、网贴、网关、网签、网购、网坛、网店、网吧,等等,等等,也让人目不暇接。
这个时期的词汇就如女士的时装,琳琅满目,万紫千红,稀奇古怪。诸如IT界的视频、视像,点击率、芯片、软件、硬件、软盘、硬盘、光盘/光碟、闪盘/优盘、彩铃、短信、伊妹儿;新潮系的驴友/旅友、包二奶、超女、打女、财女、超男、潜规则、“粉丝”;企业界也不甘寂寞,某些电影制作公司改成了“影业”,一些制药厂/公司受境外影响改成了“药业”,鞋厂和袜厂则改称“鞋业”、“袜业”,时兴的防盗门厂也用上了“门业”的名号;等等,等等。
当前尤为年轻人所追逐而又遭公众抨击者当属“形象借用谐音词”。其中“音译”型的“粉丝”(fans)一马当先之后,又引出“凉粉”(靓+粉[丝])、“钢丝”(刚+[粉]丝)等混血词和固有型的“玉米”(宇+迷);在网贴之类的平面上也出现了形象化的“斑竹”(版主)、“沙发”(首发)等词,并引出了“类推”型的非谐音词“板凳”和“借喻”型的“楼主”等等,真是不一而足。从此汉语中出现了一股“谐音借用”的潮流。
且不论这些词语是好是坏,是昙花抑或万年青,新词爆炸总归是现实。而现实首先必须承认,必须记录。这是第一性的。然后才谈得上第二性的评判和规范。
由此,我又想到清末至20世纪上叶的汉语变化。这个时期的新词语和外来词语也如滚滚潮水,一波又一波地从西方和日本引进。改变了中国,也改变了汉语。汉语由此成为今天这般的形态,在相当程度上乃是拜此外来词潮水之赐。但是深究起来我们却对此所知甚少,甚至编纂近20年的《汉语大词典》(1994年出齐)对这段时期词语的反映都呈现相当程度的空白,只是到了2001年才由民间力量编著了《近现代汉语新词语词源词典》(香港中国语文学会统筹,黄河清等执编),弥补了部分空白。这不能是一个极大的遗憾和悲哀,很值得我们反思和总结。
以上这一切不禁使人引发出这样一些想法:我们有必要为这类动态现象作一纪录,也有必要从动态角度开辟词汇新的研究方向。于是,就有了下面这番不知能否实现的议论。

2. 词汇动态研究的必要性
2.1 词汇动态研究的需要与现状
对于词汇,通常都从静态或描写的角度去观察研究:或者大量列举,或者重点举例,或者随机统计,以此概观全面。即使是新词语研究,也不过收集某个时期的新词语,加以归类排比,议论一番,看看有无新的词汇因素,诸如新的构词类型,新的词缀,或是某些类型的词语数量之间的比例,等等。这些当然都需要。但面对信息社会,这些研究又显得苍白无力,显得那么滞后于现实需要。一般说,静态就是描写,与此相对的动态似乎就是“述史”。其实静态并不等于描写,动态也并不就等于述史。它们角度不同,各有侧重。语言学的主要目的就是说明什么是语言,在汉语词汇学来说就是弄清汉语词汇是什么样的,其构造的机理与发展变化的动因与机制是怎么样的。语言动态研究关注的是:语言或语言成分和各语言方面的变动、动因和机制,以及语言不同制约力量之间的较量,更进一步可以推论或预测其未来的趋向。就词汇而言,词汇主要描写侧重于词汇的静态,但也不排除描写一个横断时期内的词汇动态变化。由此可见,动态研究就是横跨述史和描写两类的新视角研究。这样的研究可以更深刻地了解词汇演变的动因和机制,而这在描写词汇学是无法承担的。社会的变动时而快时而慢,词汇也就有相应的变动。哪些新生,哪些复活,哪些退休,哪些衰落,各个时期之间如何变化或发展,等等,都应该有所记录,有所分析和研究。这是词汇的动态视角所应研究的。这样的研究大大超出了词汇史一般理解的范围。这样的研究是困难的,但却是必要的。动态和静态本是一物的两个侧面,相辅相成。没有各个阶段的静态纪录,当然也就无法看出动态的形势。没有动态观念的统领,静态的研究也许一次足矣,而无需各个时期的记录分析。静态研究可以弄清语词构造和语词的分布,但无法弄清词汇在一个长期中的语词发展动因与机制。因此动态的研究就显得十分必要。
从现代的《汉语的构词法》到当代多本描写词汇学专著的问世,静态的词汇分析也已经有了可观的成果。在汉语史方面,我们虽然有了几种断代词汇史的专书,但坦率地说,古代至现当代词汇史的研究依然薄弱,研究粗疏,精度不足,缺乏从动态视角的专题研究,尤其缺少新的动态类型研究,关键性的学术观念又没有太多创新。比如我们没有看到在一个短时期(比如3年甚至1、2年间)里作动态观察。又比如说动态量化研究,似乎更很少有论著尝试。很多论著都会谈到词汇的变动或词义的变化,大都采用传统多量例举或尽量列举的方式;也有的点不涉面,泛泛而论,仅以一二实例论述,不及其余,甚至许多实例都是转手借用,并非本人亲力亲为收集。其中难免有误读、误认、误用,以致误导。我们检索了词汇动态研究的论著,发现符合的文本非常少,不到10个文本。这说明当前动态研究还是个待开拓的领域。而在标明词汇动态研究的论著中,也是理解或使用各各不同。有的论著虽然也提到“动态”,也有醒目的“动态”标题,但往往新瓶装旧酒,不过是把传统的词义演变、词汇增长等等传统观点套上一定鲜亮的“动态”新帽子,没有真正的开拓;有的则另有他用,是将“动态”一词套在离合词上,观察离合幅度,或用来观察某类词语在言语中的使用频度,或是观察翻译中词义的动态理解[1],这些当然也可属于动态范围,但动态研究的主要领域的开拓和理论上的创新论述几乎没有。其原因首先是我们还缺乏如高名凯先生那样的理论思考习惯和开拓勇气。其次当然是精力所限。因为需要日日跟踪观察,需要大面积注意文字资料、阶层和媒体,谁都花不起那么多的精力。有一篇“八五”期间现代汉语词汇研究综述评曰:此一时期词汇研究“缺乏”“宏观理论的思考。”对“词汇发展的研究”“存在进一步拓宽思路更新方法的问题”,“关于语言与文化的关系的讨论,一些文章还停留在漫谈、例话的层次上,缺乏宏观理论的指导,而且内容多有重复。”(许嘉璐等1996) 笔者查阅,确如该文所言。近年来又加上急功近利、浮躁之风吹袭,知识结构的狭窄,确乎难有根本的改变。在这种情况下,汤志祥、苏新春与曹炜等人在21世纪初以计量为特点的并包含某种程度的动态观察的词汇学著述就更难能可贵。[2]  由此也可看到,这样的研究的确不是可以一蹴而就,需要逐渐推进,更需要作集体性的行动。

2.2 词汇动态研究之目的
词汇的动态研究,其目的当可有三:
其一,出于语言学的目的。语言科学要求我们揭秘语言,解明语言是什么。这就需要记录语言变动的一切方面,内中包括词汇的变动,从而弄清作为语言一部分的词汇到底是什么。
其二,出于语言应用的目的。动态研究不但可以弄清词汇如何发展,还可以弄清社会和语言的互动关系,弄清社会如何促进词汇产生并发展,而词汇反过来又如何促进社会的。我们一般都了解社会对语言的作用,但并不很清楚语言或词汇对本社会的反作用。而后者正是语言应用所关注的。
其三,出于某民族及其语言发展的需要。通过词汇的动态研究,可以了解该语言在各语言中所处的地位(词汇部分)以及如何改善这样的地位。在当前世界中,各个语言都在竞争中存在,有的因竞争失败而消亡,有的则得到改善,得以名列前茅。因此,语言及其政策本身也是一种政治,决不可忽视。看看法语努力保持自己的纯洁性,看看美国和法国为各自语言的推广所付出的努力就可一目了然。而在当代世界中,概念或新概念又是决定一切的关键之一。谁首先提出新概念并加以实行,就等于在某种程度上领导了这个领域。当代科学的一个特点常常是:在观察和实验的基础上引发了或联想出一个或一些新概念,这个或这些新概念可能就开启了一个新领域、新学科甚至新时代。新概念就意味着新术语新语词,反之新术语新语词也就意味着新概念。科幻作品给当代科技界的一个礼物,也常常是这样。所以,观察词汇的动态变异,也就是观察社会的创造性、创造力。其中的意义可想而知。可见关键性语词的创制也是一种观念或概念话语权的表现。
看一看语词的动态记录及其来源就可以明白。清末以来的中国,丧失的不仅是国土和国宝,还丧失了政治的话语权和观念的话语权。清末以来,我们借入了超大量的日语源汉字词[3]并促成汉语现代形态词汇的形成,同时也译入了大量的西语音译词,更促进了这一现代形态的完成。而所谓的日语汉字词,实际上大部分又是日语意译西洋语言。从根儿上说,我们实际上还是借入了成批成系统的西洋新概念。从这一百年多来中西日语词之间的交流历史可以看到中国话语权的丧失的确是必然的。我们在一千年前就有了四大发明,可是我们输出给世界的重要语词仅仅是“茶”和“丝”这样几个生活词。科技术语几乎没有汉语的地位,甚至连“围棋”也不是通过发明者汉语了解,而是通过日语让世界接受go(“碁”)的。我们整个现代语词是在随着西洋概念起伏。从好的一面说,我们需要这样,这是我们赶上世界的最短路线,而从另一方面看,则是中国文明的衰落。我们失去了许多方面的话语权。主导话语权的,主要是硬实力的经济、军事、科学技术以及软实力的政治观念、文化观念及其产品。其中新概念的凝聚和新术语新词语创设就是话语权的一个方面,虽然不是主要,有时却是关键。为了恢复或掌握话语权,就需要寻找语词创造为何滞后或超前的原因,需要探寻找改变语词主导权落后的途径,就需要打破追随西方潮流这种习惯态势。显然,在这个意义上,词汇的动态研究就尤其有此必要。

2.3词汇动态研究的几个方面
词汇动态研究是一个新的领域,我们还不能完全描写出它的范围和研究品种。但据我们推算,它至少应包括如下三个方面:
一是对以往与当下词汇活动的观察与比较,其中有的词汇新生与隐汰,词汇消长,词汇流动、词汇接触等方面,并做出某种测算。这是最经典意义上的动态研究。本文所论的“活跃度”是其中的一个方面,也是观念不同于传统的一个方面。
二是对未来可能的词汇活动的预测,需要在第一点的基础上作出预测和对应预案,其中之一就是所谓的规划。
三是对词汇活动干预的研究,这就是通常所称的规范研究。
本文讨论第一个方面中的一个部分。我们也期待其他同行对此作出更新的开拓。

3. 词汇活跃度及其研究
3.1 语言活跃性、活跃度及其观察尺度
语言在不同时期有不同的动态表现,或高或低,或大或小,或多或少,或相对激烈或相对沉静。这种情况可以用“活跃性”来概括。传统的语言学也常说:语法最稳定,很难在一年或数年、十数年内感觉出;语音变化则相对快些,但也并非几年之内就能感觉到;词汇则不同,其变化最快,也最活跃,几乎每个十天半个月就会感觉到变动或变异,不是在这个阶层这个领域,就是在那个阶层那个领域,不是新词新义产生,就是旧词旧义消失。对此,传统的方法只是举例概略描写,不采用量化方法。因此也无法明确认识语言的动态变化。显然,词汇研究目前最薄弱的就是精度和量化,很少人采用计量方法去研究。其原因是:一则不易,二则不会,于是第三也就不敢。然而计量方法是任何科学的必然走向,定量分析是定性分析的必然归宿,也是定性分析的更高更精确的阶段。如果采用计量方法,那么“活跃性”研究就必然走向“活跃度”研究,必然导致“活跃度”概念的出现。于是我们就可以这样描写传统的语言变化:语法的活跃度最低,是最稳定的语言结构要素;词汇的活跃度最大;语音则介于二者之间。由于语言各部分的活跃度的不同,因此,观察它们、研究它们、量度它们的尺度大小也就相应不同。语法的活跃度最小可能要以百年作为观察尺度,而词汇的活跃也许只需要以十年、五年甚或一、二年作为观察尺度,语音则介于二者之间,也许以五十年一个观察单位为宜。观察尺度虽非客体自身的变动周期,但设置合适还是能较好地反映语言的客观。

  3.2 词汇活跃度研究的几个方面
词汇的动态研究有多个方面,比如词汇(包括词缀)在一个时期里增、汰的变动,旧词词义的变动,构词类型的变动,词语使用频度的变化,词语变化与社会因素的关系,等等。这些大都在一般的论著中都谈到,但缺少的也是精度和量化,成为另一种泛泛而论。到了电脑和语料库已经成为普遍手段的今天,我们再也不能停留在这样的水平上,而应该从活跃度视角去开辟新的研究。词汇如同社会中的人,社会由人构成,社会的活跃与作为群体的人有极大关系。由人的群体性活跃程度可以推知社会的活跃度,而社会的活跃度也可体现为人的群体性活跃度。词汇亦然。词汇活跃度是客观存在的,但对于它的研究则会带上主观的偏差,我们应力求降低其偏差。
设定词汇活跃度的观察尺度为“1年”和“5年”两个级别,而以1年作为基础单位[4]。那么细致地说,词汇活跃度需要或可以做如下基础性的工作和统计:
a.逐年汇集新词语、建立以1年为时间限度的新词语语料库并分别统计其词例和词种[5]的年出现数;
b.记录新词语来源,是自创还是引进概念,并分别统计每年的词种数量;
c.记录并统计新词语分布门类;
d.根据新词语语料库分别统计新词语出现频度以及结合门类的使用度[6]
e.如果可能,统计创词者的人数;
基础性工作之后,就应进入具体的词汇活跃度的研究,大致有以下七个方面:
1)某时期词汇与前一时期相比,在词语增加与淘汰方面的比率。增加部分包括新增且稳定存留下来的,新增但很快淘汰的。淘汰的部分包括旧词淘汰和新词淘汰两种。另外就是非词成词、弃词复活两种,也可列入。
2)某时期词汇与前一时期相比,地域间词语交换数量和频度的变化。例如,外族语和外国语词进入汉语,方言地域之间的词语交换,方言词语进入普通话,这些方面也是观察活跃度的一个很重要方面。
3)某时期词汇与前一时期相比,在旧词词义变动方面的比率。这就是旧瓶装新酒的类型,也有人把这一种视为新词增加的一种类型。
4)某时期词汇与前一时期相比,在构词成分若干高位和低位使用率方面的变化。可以成为构词成分的活跃度排序。
5)某时期词汇与前一时期相比,在构词类型方面变动的比率。可以成为构词法活跃度。
6)该时期词汇活跃情况与社会情况的相关关系或相关度。词汇活跃度与社会活跃度是一对相关项,可以互相印证。从而促进对社会发展的研究。
7)该时期词汇活跃度变化的动因与机制。这是我们研究词汇活跃度的一个目的。从这里可以看到我们在语言应用方面的一些任务。
这七个方面,都与活跃度有关,而且深度顺次递增。第3、5两项则是最难的。但最基本的是第1、2两项,第1项是第6、7两项的基础。活跃度有不同类型的测算,一般可以以第1、2两项作为基本活跃度。进一步的是第1、2、3三项相加以后的活跃度,这是更精准的活跃度。显然,这些工作那一项都不是容易的。但是信息技术时代却为我们提供了合适的工具。我们可以进行文本扫描并数字化后储存,可以在此基础上搜索统计,可以在网上进行甚大规模的搜索和统计。以往的难题,在今日已经不是不能解决了。
以上研究都基于大规模统计,有很大难度。因此我们也不排除活跃度的个案研究,即研究个别词或一组词的兴衰起伏和兴替交代,例如“非典”类语词的起落,某个或某类语缀的兴替,外族语词的引进,港台语词与普通话的互动,等等,以此作为大规模研究的试点或作为一种分项研究。这样我们在目前基础尚未整备完善的情况下无须等待,可以先期展开研究。

3.3 词汇活跃度的影响因素和制约机制
不仅如此,我们还必须找出词汇活跃背后的制约因素或其深层机制,以便自觉地应对或控制。制约机制包括两个部分,一是影响因素,二是由影响因素参与其中的一套制约制度。
据我们初步分析,影响词汇活跃度的因素可大略归为社会、人和语言等三个方面。细别之有下列九个因素:
1)社会生活的活跃程度。
2)跨地域交际活跃程度。
3)文化活跃程度。
4)新事物出现率。
5)信息传播渠道类型和数量的因素。例如现在出现的传媒丛林化现象。
6)人的群体心理因素。
7)人对生活或事物的需求态度。
8)人对语言文字的使用程度和运用态度。
9)制约语素能产度的语素类型和能产的构词类型。即单音或多音语素的活性、语素的类型;
语言因素尤其是构词类型,与社会和人的因素相比,其对词汇活跃度的影响还是较弱。因此这一因素与前两种因素相比也许只能算半个因素。
至于那一套制约制度,我们现在还不能说清楚,这正是我们所期待的研究结果。

3.4 关于词汇活跃度研究方法
词汇活跃度研究的基本方法是:
1)大规模调查统计方法。为了完成3.2节中第1-4项任务,词汇就需要大规模的语料,越多越好,语料越多,活跃度越精确。为此需要建立适合其研究的不同级别的多信息词库。
2)计量方法。为了计算出词汇活跃度,还需要建立合适的数学模式。
3)随机抽样方法。根据需要,做大范围内的随机统计,以便减轻工作量,并提供试样数值,以便在一定程度上满足需要。
4)对比法。对比这些时期的词语,得出词语的兴衰生死的概况。
5)剥离法或提取法。对比这些时期的词语,剥离或提取出后一时期出现的新词语,提供给另一些活跃度研究。
6)分割法。例如:可分割为随机性抽样研究和全词汇研究;可分割为多年间研究和一年间研究;可分割为全门类研究和分门类研究(如:新词语类;普通词语类;专名类;外来词类;科技类;经济类;军事类;休闲娱乐类。这些门类可以根据需要设置和细化,例如可以设立外来概念词类,包括音译词、意译词、日语汉字词以及汉外混种词);还可分割为频度研究和使用度研究。
7)综合法或合成法。将各门类词语的变动数值综合化。

4. 词汇活跃度研究的基础
4.1 词汇活跃度研究需要新型的辞书和专门词库
1)词汇活跃度研究需要大量的统计资料作为基础。这些资料在过去以及现在基本上保存在词典和一些专著中。词典起到静态搜罗和汇集的作用,并给动态研究提供了一定的基础。到目前为止,词语的静态汇集的确已经取得了长足的进步,从《尔雅》到《方言》,到《康熙字典》,再到当代的《辞源》、《辞海》、《现代汉语词典》和《汉语大词典》以及《现代汉语规范词典》,还有近年来以《新词语大词典》为代表的多种新词语工具书,这样的汇集已经有了不错的纪录。但从许多方面看,我们的基础工作仍显单薄。具体而言,我们对古代或者现代的词汇总量仍然未能完全调查清楚,对词汇家底还掌握得不够,许多词语并非按照动态研究的需要或语言学的需要去搜集并确认,对动态研究并不十分趁手。
2)需要专门为动态研究服务的辞书和多信息词库。词汇动态研究不能完全依靠词典,词典有许多局限。一般情况下,词典很难每年改版或每年出新版,也很难容纳详细的书证和出现年月以及其他必要信息。因此需要为此专门制作辞书,并利用电脑技术制作多信息词库。
3)组建辞书和词库的编写/建设团队。《汉语大词典》编写之后,国家组建的编写团队基本消失,导致大量辞书编写的短线行为和个人行为,辞书整体上以量见长,而品质并无突破,许多大项目无能为力。而动态研究目的的辞书或词库又不是任何一个个人能承担的。有鉴于此,建议由国家或大出版集团组建的团队承建该专门性辞书或词库。
4)转变编写观念。无论编写或建设哪一种词语汇集项目,我们都必须转变观念,突破以往的禁忌,都必须有所创新。(详见下面4.2节)
5)需要建立专人负责的词语观测站,以纪录词语变动。
除此以外,我们还需要为此项研究设计一些专门的软件。
我们期待未来将有可供更精准研究的新型辞书出现,也期待全地域(或多地域)、多信息的词库能尽快出现。

  4.2 现有辞书的缺憾
1)我们很高兴地看到近年来在新词语的基础工作有了很好的进展。其中周洪波主编《新华新词语词典》(2003,商务)选收了4千余词(2200词出条),给一般文化水平的读者提供了查阅的方便;而亢世勇、刘海润主编《新词语大词典》(2003,上海辞书)收录1978-2000年(并酌收2002年)中产生的2万条新词语,据编者说明,这些词语系从4万条中选出,给大规模研究提供了较好的平台。其他还有一些辞书则提供了另一些值得参考的方面,例如宋之然主编的《新词新语年编(2001-2002)》(2004,四川出版集团/四川人民出版社)告诉我们这2年里新词语+新义旧词共产生600余条。当然这些数字仍存有疑点:
其一,旧词而新义算不算新词。假定如此,那旧词的意义到底新到什么程度才算新词;
其二,为何各种辞书都有删除之举,其中有无受非语言因素(例如涉及政治、伦理、低俗文化、黑社会等因素)影响。以上这些辞书并未披露,而我们从一些媒体上对某些新词的议论或挞伐中感觉到会有这些因素。如果这样,这样的平台就不够完整和完善,就会扭曲研究的结果。
吕叔湘先生曾说词典收词“与其失之于严,无宁失之于宽。”[7]如果承认语言和语言学是无阶级性的,那么任何语言和词语都应该作为一种人类财产被记录下来,并可接受研究。语言学应该没有禁区。我们应该逐年完整纪录,进行逐年对比,绘出在时间轴上的变化曲线。而且还应该将敏感门类敏感词语(例如意识形态和性)列入认识范围。这样做的理由也就是为了认识这个敏感社会门类和词语之间的关系,认识社会对它们的忍受度或接受度。
2)另外,一般我们都会计算年平均值,根据目前可统计的辞书计算,不同辞书每年平均新词数从116条到1819条不等[8]。其实词汇是一种变动较大的项目,统计的年份越多,则该平均数越有可能把剧烈的词汇变动抹平,并导致其统计价值失去意义。因为,动态视角研究的正是这种变动。越是按年份收录的材料越有价值,越能反映语言和社会的关系。而被淘汰词其实也有较高的认识价值和学术价值。被淘汰词和留存词之间的比例,可以用来认识词语的另一种变动。
3)最早的词典是由中国首创的。但是,从创造角度看,中国辞书在范式方面的原创性到《康熙字典》就已经画上了句号。这以后,我们的词典基本上是跟着外国人走的,从洋人外国传教士给我们带来一些英华/华英词典开始,一直到牛津、韦氏英语详解词典,而且越跟距离越大。直到出版《汉语大词典》,方才填补了长期以来的空白,我们开始结束距离越拉越大的难堪。然而这部词典仍然没有让我们摆脱落后。这部辞书刚开始编写,实际上某些方面就已经落伍,落伍于当时世界上的著名大型详解词典。《汉语大词典》(1975年立项,1979年开始编纂,全12卷,1986-1994年出齐,收词37.5万)与同类型的《日本国语大辞典》(第一版,全20卷,收词25万,1972-1976年出齐)相比当然超出很多。如果与第三版的《韦氏英语大词典》相比,在观念上差了一代;与第二版的《日本国语大辞典》(全13卷,收词50万,2000-2001年出齐)[9]比较,那也相差很远。如果以《汉语大词典》作代表,与世界水平的大词典相比,并根据当代的语言观念衡量,可以发现我国辞书中有许多不足。这些不足有相当部分不能责怪编者,主要还是受历史和社会的局限所致,是时代的烙印。依笔者所见,这些落后或有问题处大致有以下九端:
①首先是指导思想落后,编纂观念仍然滞后于现实之后于学科和科学观念的发展,依然受到社会政治或意识形态的影响,很多词语因此而未收。例如:“铁姑娘”、“胡风分子”、“右派分子”、“党天下”、“政治设计院”、“三反分子”、“批林批孔”。这些都是历史,社会的历史,语言的历史,而重大历史是无法回避或跨过去的。[10]
②以“典范”、规范或稳定性作为理由,可能排除了过多词语。例如许多简称就是因稳定性的理由而失收的。而这样的观念早已受到质疑,当代词典以《韦氏英语大词典》(第三版)为代表,已经从以规范为指导原则走向以描写为指导原则。另外,一些不稳定的临时词也需要具体分析,创制人不同或出现场合不同应有不同对待。其实临时词是动态研究中的一个重要关注项目。如果这个临时词是音译词,那也是一个重要的历史纪录。像严译作品里就有这样的临时词,而一般的大词典都会重视的。
③可能以语词词典为由,排除了太多的专科性词条。例如据我们不完全抽查,在D-H之间就缺收“代议制、单眼、电热器、电压、定点、动画、读唇术、对译、多面体、短音、多血质、二律背反、放射性、防腐剂、废液、分子量、辐射热、腹式呼吸、公倍数、高速度、骨质、雇员、管制塔、广角、硅藻土、硅酸、过饱和、海王星、号音、黑字、化学纤维、混纺、活性、幻听、环礁”,而这些词语有不少在当代社会已经逐渐日常化和普及化了。其实,现代社会已经有越来越多的专科术语进入普通人用语中,这正是现代社会的特点。例如当前信息行业的一些词“软件、路由器、调制解调器、服务器、终端”等就是如此。
④可能是因为对简称和义项的一些偏见,缺收了许多简称,尤其缺收整体切分型的简称(或曰称代)。后者例如:“清华”可称代“清华大学”;“长城”可称代长城牌计算机;“牡丹”可称代牡丹牌电视机、牡丹信用卡、牡丹香烟。这些均应分别设立义项。这样做才能真实反映语言和语言生活。
⑤相当部分的词条缺乏书证,其词条数目不少;有些应该查到的书证却未查到,反而是日本的词典帮助我们查到了汉语的较早书证。例如“胎毒”、“庭园”等无书证;“现金”在《汉语大词典》中仅能提出邹韬奋的书证,而《日本国语大辞典》指出在《新唐书》中已见该词;“铜矿”在《汉语大词典》未能查出书证,而《日本国语大辞典》指出在《宋史·食货志》已见该词。
⑥大部分有书证不著录该书证成书时间或发表时间,使人很难确定其大致出现时间。其实编者在编纂时收集书籍资料时应该清楚写作或发表时间的,统一标注更是举手之劳。例如只著录《新唐书》、《医宗金鉴》、陈三立《夜泊吴江城》(“渔港”条)、夏仁虎《回京琐记》(“资本家”条),而不注明其成书或成文的大致时期。读者要查写作年代,可能就要费九牛二虎之力,尤其是并不太为人所知的作者(如以上陈三立和夏仁虎)。不知词典编纂者为何“目中无人”,不作举手之劳。[11]
⑦缺少对词语研究成果的简要说明,包括辞书对该词释义的本质变动。这些说明类似《日本国语大辞典》第二版中的“语志”项目。
⑧一些极具语言价值的书文可能因政治和意识形态的关系而被弃置不用。例如一些曾被打成“胡风分子”的著名作家的文字作品丝毫未见,却多见柯云路的作品。这当然可能囿于时代和政治进程,情有可原,但也足见词典编纂者心中的禁区以及理念缺陷。
⑨对口头文本严重注意不足。以往仅仅以纸质文本载体上的语篇作为词目的勾乙收集来源,而没有采用口头纪录的方法来收集词目。事实证明,书面记载的词语和口语使用的词语有较大差别,其中口头使用的词语有相当一部分很难出现于书面。
我们承认辞书编纂可以受类型、目的、对象、资金、时间、人力等的制约因而对词语有所选择。但也不能以此为观念性的落后作辩解。我们不应该忘记词典所应负的使命。词典的作用之一就是一视同仁地记录描写词语并备查、解惑;作用之二是规范并解惑,即为“典”。这两种作用可以分别编纂两类不同的词典。为词语活跃度或动态研究的词典属于前一类,应该以详尽纪录汉语所有词语为使命,应该超越政治与意识形态。我们期待不久会有这样一部适合词汇活跃度研究的辞书出现,会有勇者来改写当代的辞书历史。[12]
2008年8月处暑定稿
附注:
[1] 例如:探讨离合词离合幅度的《词汇单位的动态性--汉语词汇单位的离合现象分析》(颜红菊,《湘潭师范学院学报(社会科学版)》2004年05期);探讨单音词在动态系统中仍占突出地位的《现代汉语词汇特点初探》(刘中富,《东岳论丛2002年06期);探讨词汇文化内涵民族性及动态性的《词汇文化语义:民族性和动态性》(张业菊,《外语与外语教学2001年04期);探讨词语使用中意义受语境影响的《英语词汇意义在语篇中的动态分析--浅谈句中俚语的动态理解及翻译》(潘登汪光祖,《咸宁学院学报2003年05期);将传统词义缩小扩大转移的演变等归入动态名义的《现代汉语词汇学》(葛本仪,2001,上冻人民出版社);提倡从哲学本体论的角度与高度研究汉语词汇,以求在立体的动态的研究中实现理解词语、认识世界、观照人的自我这一新的研究目标的《试论从本体论角度研究汉语词汇》(周光庆,《华中师范大学学报(人文社会科学版)2002年第2期);等等。
[2] 据我们所见,王力《汉语史稿》(下册,1980,中华书局)或《汉语词汇史》(《王力文集》11卷,1990,山东教育出版社)、韩陈其《汉语词汇论稿》(2002,江苏古籍出版社)、李文泽《宋代语言研究》(线装书局)、伍民《五四以来汉语词汇的一些变化》(《中国语文》1996,4期),等等,在论及词汇变化时都是尽量列举实例,并辅以传统型论述。这些当然需要,今后也还需要,但仅此则远远不够。周光庆《汉语词汇研究新思考》(汉语学报2000年上卷)提出“对历史与现实的汉语词汇事实作立体的动态的研究”,已有新意,但依然侧重个体词语。其他论著虽有“词汇动态形式探索”之名,但仍未见实质性的进化。比较有创新的是邢欣主编的《都市语言研究新视角》(2003,北京广播学院出版社),提及街头(店名、品牌名)、股市、流行、媒体等,把社会因素具体化,颇有新意。另外,也让人耳目一新的是少数论著采用计量或量化方法,虽然不标出动态字样,但其中仍包含了一定程度的动态研究,例如汤志祥的《当代汉语词语的共时状况及其嬗变》(2001,复旦大学出版社)、苏新春等的《汉语词汇计量研究》(2002,厦门大学出版社)、曹炜的《现代汉语词汇研究》(2003,北京大学出版社),的确难能可贵。
[3] 以进入汉语的日语源外来词为例,据马西尼《现代汉语词汇的形成——十九世纪汉语外来词研究》统计,胡行之《外来语词典》(1936,天马书局,上海)收59个,实藤惠修《中国人留学日本史》(增补版,1970,东京)收844个。据史有为统计,高名凯等《汉语外来词词典》收882个(其中858个汉字词),而据史有为(2000,商务)中的估计,源自日语的词漏收甚多,大概还要增加约一倍,可能超过1600词。而据最新的研究进展,未来商务《汉语外来词大词典》可能收录近3000日语源外来词。
[4] 当然也可以用1个月作为基础单位。这对一年中的词语周期变化可能更有好处。而以1年作单位对词语受更大范围社会因素的影响有更好观察价值。
[5] 言语文本中每一具体位置上的词语即为词例。若干同一词例作为一个词种计算。例如:“我爱我家”,其中“我”出现2次,计算为两个词例,1个词种;“爱”“家”均作1个词例、1个词种。同一词种的词例数就是词的(出现/使用)频度。参见注[5]。
[6] 频度指同一词种的出现/使用次数。使用度,简单地说就是同一词种的频度乘以该词种所分布的门类数得到的数值。
[7] 引自见《新词语词典》(北京市语言学会编,1993,人民邮电出版社)内奚博先所撰前言。《现代汉语词典》(1989年版)共收5万6千条词。《现代汉语词典》(第5版,2005)删2000余条,新增6000余条,共收65000余条。而之前的《现代汉语词表》马广申等,(中国标准出版社1984)取自20多部国内外辞书,共9万余条,包括专科名词术语。另据奚之前言,在1989年4月29日《北京晚报》上共有500多词为上述《词表》所无。可见该《词表》所汇编的词典失收之多。
[8] 商务《新华新词语词典》(周洪波主编,2003)12年间共约4000条,每年平均约333条。亢世勇、刘海润主编《新词语大词典》(2003,上海辞书出版社),系国家社科规划项目《现代汉语新词语信息(电子)词典》的开发与应用(01CYY002)的首批成果。该书收录2万词,平均每年910词。若以初收4万词计,每年1819词。在该词典序言中还提到有人说一年1000余条,也有人说一年400条。此外,李达仁等主编《汉语新词语词典》(1993,商务印书馆,北京)收录1949-1989年,共40年间的新词4652条,平均每年约116条。林志伟、何爱英主编《现代汉语新词语词典》(2005,商务印书馆国际有限公司,北京),收录起点不明,多为70年代以来尤其是近1,20年的,共1万余条,无法计算每年的数量。又据于根元主编《汉语新词语年编》,每年新词语仅500个上下。显然这些辞书所收皆不相同,说明汉语新词语的收录工作还有很大缺陷。
[9] 《日本国语大辞典》(第二版)收录50万词,用例100万,文献3万,方言14万,新增“语志”,收录研究成果和经过,并附方言索引,出典一览。该辞书做到了忠实于语言,眼中有读者。
[10] 记得《新华新词语词典》出版时曾就其中“包二奶”条目引起一番争论,反对者甚多。如果这是一般社会人士之见,情有可原。若语言学界中也有此认识,则只能哀叹其学术保守。传统以“典”为主导。因而在此观念下有可能掩埋了许多词语,并可能导致研究的扭曲。而新的辞书观念则认为二者可以兼顾,也可以各以为本,分别类型。其实,没有记录,就没有规范;规范就成了无源之水、无本之木。规范可以体现在词条的释义上,而不必红牌退场,代大众和语言做判官。就此而言,商务新词语词典编者有些胆识。
[11] 我们理解,由于古籍年代久远,有版本等问题,不易确定,但大致的成书年代还是可以标注的。而现代作家的作品不注明年月,这就更难以前述理由开脱了。
[12]听说有关方面将启动重编《汉语大词典》工程,不知是否确凿,如消息属实,当为极大好事。我们期待新版能够超越以往,领先当代辞书世界。

参考文献
邢福义、汪国胜、吴振国、萧国政:1996,《“八五”期间现代汉语研究》(收入许嘉璐等主编《中国语言学现状与展望》,1996,外研社)
许嘉璐、王福祥、刘润清主编:1996,《中国语言学现状与展望》,外研社。北京
shiyw2008@meikai.ac.jp