按詞拼音排序的現代漢語詞典

吴文超

  

  
  
《現代漢語詞典》是一本權威性的漢語詞典,其數以億計的發行量反映出詞典受重視和普及的程度。然而它仍然采用傳統字典的按字排序方法。用戶必須根據多音節詞的第一個字進行拼音檢索。如果不知道相應的字,就很難找到該詞。這種仍然一貫地以漢字爲依歸的排序方法忽略了多音節詞語音檢索的需要。儘管漢語拼音已經有45年歷史,但直到今天仍然基本上停留在給漢字注音的階段。在傳聲技術和語音識辨技術日益發達的今天,很有必要利用詞化拼寫法來提高漢語信息處理的功效。下面三個實例反映問題的側面:
 
  例一:當一個漢語學生聽說某人‘yibiao’不好時,很難找到有關的漢字,進而找到詞義。尋找詞義過程浪費的時間無助于漢語學習。
  例二:從朋友寄來的電子信函中看到:Microsoft depends on kun-bang 的字樣. 筆者無法從《新華字典》中找到有關詞條。後來在上海漢語大詞典出版社出版由Hawaii大學John DeFrancis教授主編的《ABC漢英大詞典》裏找到該詞條:kunbang 捆綁 v.truss up; bind.
  例三:筆者在找‘輕聲’的英文對應詞時在《ABC漢英大詞典》的‘qingsheng’詞條下找到‘neutral tone’的解釋,同時也知道該詞還有‘talk in a low voice’(輕輕地講話)的意思。

 
日本的經驗

  
筆者手上有日本1923年出版的《和英詞典》, 該詞典采日語羅馬拼音按詞排序方法,‘hana’對應的漢字就包括‘花’ 和‘鼻子’ 。由于該辭典也許不是最早的版本,因此可以說差不多一百年來,該類詞典便利日本和西方文化交流,不但方便外國人學習日語和引進日文羅馬字,也方便普及日文羅馬字輸入法。歐美流行的拼音日文,諸如 Kanji (漢字),bonsai(盆栽),karate(空手道),sushi(壽司),tatami(榻榻米) 等可以被看作爲是這種交流的成果之一. 另一方面, 由于詞化日語羅馬字的流行,日本能够早在上世紀七十年代便放弃漢字編碼努力,從而避免出現《萬碼奔騰》的編碼混亂和促進日文電腦的普及。
 

按詞拼音排序的好處

  按詞拼音排序好處很多,最重要的是它揭示漢語被漢字隱蔽的多音節特徵,幷且在一定程度上抑制人們隨意創新詞的做法。 就後者而言,‘快樂’是人人都懂的詞,如果隨意創制出‘慢樂’一詞, 它是否有慢慢地快樂的意思呢? 然而,‘快樂’却已經失去了‘快快地快樂’的原意。 同樣,‘高興’有明確釋義,但‘低興’是不是‘不高興’的意思還是比高興低一點的高興呢? 總之,隨意造詞往往影響語言的明確性。
  漢字不以詞爲基礎導致檢索困難。找關于‘中國’ 的資料時却得到有關‘發展中國家’ 的條目。 檢索‘月臺’時却得到‘十月臺商東莞會議’ 的條目。 在信息爆炸時代,漢字不分詞减損檢索效率,複雜化檢索工作。值得一提的是,英文‘research’ [研究和調查]一詞沒有貼切的中譯。 我們因此也不應該奇怪用中文進行‘reseach’ 比用英文困難得多。不要忽略詞與詞之間的分詞小空格,它像標點符號那樣,有時是必不可缺的,例如:‘環 院長 跑’ 和 ‘環 院 長跑’; ‘乒乓球拍 賣 完了'和‘乒乓球 拍賣 完了’。 拼音分詞連寫减少同音詞混淆的困擾,大大提高拼音輸入轉換漢字的準確度。由于缺乏按詞拼音排序的詞典供參考,人們進行拼音輸入時往往要靠語感進行分詞連寫,因此容易出錯。懂英文的人常常參照英文詞來分詞,例如,‘beautiful music’對應‘meili(de)yinyue’ (美麗 的 音樂)。 但這種做法有時是行不通的,例如:‘blue shy and white cloud’對應的漢語詞可能不是‘lan tian he bai yun’(藍 天 和 白 雲)而是‘lantian he baiyun’(藍天 和 白雲)。‘lantian he baiyun’ 按詞計算是三個詞而非五個詞。語言的分詞有約定俗成的特點,現代漢語詞傾向于雙音節化。筆者認爲,如果‘可是’,‘不是’ 是詞,那麽‘也是’ 和‘都是’也應該是詞,儘管英文的‘also is’ 和‘ all are’ 却是兩個詞。 對于少數有爭議的詞,最好由專家們編纂的權威性詞典來予以確認。

 
在人、地名拼法規範的基礎上

  《漢語拼音正詞法》已經成功規範了人、地名拼寫法。現在應該進一步編纂按拼音詞排序的漢語詞典。信息量較拼音高的漢字能够幫助人們分辨同音詞,確定諸如‘時勢’、‘時世’;‘世世’、‘試試’等同音同調詞的含義,人們因此比較能容忍漢字不分詞可能造成的困擾。 但人機對話和機器翻譯必須分詞。幾十年來,自動分詞研究至今尚未能真正解决問題。關鍵似乎在善于處理信息的計算機缺乏人類大腦的知識和推敲能力。 爲了縮减中西文在語詞處理、資料檢索、人機互動等領域的差距,編制按拼音詞排序的現代漢語詞典是一個非常重要和極具效益的事業。
 
語文技術的洋爲中用

  經過百多年的衝突和較量,中國軍事技術的民族形式已經不復存在。以洋字帶頭的武器詞,如洋槍、洋炮、洋坦克已經被步槍、大炮和坦克等通名所取代。 如此重大的成就在一定程度上依靠技術上的洋爲中用。 照理,語文技術也應該這樣做。中國歷史上最强盛的唐代,周圍諸國都沒有文字。日本、朝鮮和越南都借用漢字。今天的情况正好相反,不僅歐美超級大國使用拼音文字,連日本、朝鮮和越南都在不同程度上放弃了漢字。中國成爲世界上僅存的非字母文字國家。就像無法徹底修理使用中的交通工具那樣,我們不可能像軍事技術那樣揚弃民族形式的漢字。但是,我們完全可以采用一些有效辦法來提高語文的學習和應用效率, 幷且進一步爲未來語文發展的取捨增添新的靈活性。
  差不多一個世紀前日文羅馬字詞典的出現幷沒有導致日文全面字母化。今天編纂按詞拼音排序漢語詞典幷不是什麽突破性創舉,而是填補一個重要的空白。 筆者無意貶抑Hawaii大學的《ABC拼音漢英大詞典》取得的開創性成果,但總覺得如果能够在《現代漢語詞典》基礎上編纂類似的詞典,將肯定會後來居上,對中國詞典編纂事業作出嶄新的貢獻。
 

前聯合國資深翻譯員
吳文超   2004年5月31日 于香港