漢語拼音分詞連寫的重要性

吴文超

  

連寫反映漢語的現實

漢語是成熟的多音節語言。 這個語言現實卻被不連寫的方塊漢字掩蓋了。由於可以發出的聲音有限漢語習慣把兩個音節連接成詞。語言學家指出連聲調在內的單音詞早就無法滿足漢語表達意思的需要古代漢語已經有大量多音節詞。詞的界定通常取決于語法、語音流和約定俗成等因素。要證明漢語爲多音節語言的辦法很簡單把雙音節漢語拆分爲兩個單音節如因此而失去原來的意義那麽該雙音漢語肯定是個雙音節詞。例如由於“田七拆分後所得單字“田和“七盡失原意所以“田七是雙音節詞。就約定俗成而言“高興是漢語詞但“低興卻不是儘管大家都可以猜出後者的意思。同樣,“快樂是漢語詞而慢樂卻不是。 經驗告訴我們一些多音節詞的意思不容易望文生義地猜中例如: 天花、東西、月經和仙人掌。

漢語語法必須以詞爲單位

"學生們高興地唱歌跳舞"一句進行語法分析時有必要把漢字集合成爲多音節詞。 需要給"學生們" "高興地" "唱歌" "跳舞" 等詞進行諸如名詞副詞和動詞等語法分類。 分詞連寫的漢語拼音反映出漢語的現實及其語法特徵: xueshengmen gaoxingde changge tiaowu,而加上調號的拼音能夠更準確地記錄漢語。

連寫拼音便利普通話教學

一直以來中國採用分詞連寫的漢語拼音來幫助教普通話。連寫拼音能夠更準確地記錄漢語。 變調和輕聲是雙音節漢語的特點而非漢字的特點。 "東西"這兩個漢字是沒有輕聲的例如

"東西矛盾" 只有連寫的"東西"雙音節詞才有輕聲: dongxi 變調也是如此不變調的老() -- 老齡虎和變調的"老虎"意思不一樣。 總之漢語語音流的連或分往往表達不同的意思。因此不分詞的漢字會産生歧義情況有點像沒有標點符號的中文。 例如: "環院長跑" 可以被理解爲 " 長跑" " 院長 " 就普通話教學而言拼音分詞連寫具有關鍵的重要性。

語言心理學的啓示

語言心理學家發現漢語使用者往往不對單音漢語進行解碼。 他們要在聽到第二音節後才判斷詞義。 例如: 聽到"hu"後要待聽到諸如die,shuo,tu,jiao,bo,luobo 等第二音節時才把詞義確定爲: 蝴蝶、胡說、糊塗、胡椒、湖泊、胡蘿蔔。 由於拼音只有幾百個音節分寫的拼音比漢字模糊得多。 既然大腦要等到第二音節才進行解碼用連寫拼音一次過拼寫漢語詞可以得到快而准的效果。

非詞化漢字檢索困難

電腦缺乏對漢字進行準確自動分詞的功能。 對大量不分詞的漢字資料進行信息檢索的難度很大而且經常找到不需要的詞或詞組。例如找尋關於"中國" 的資料時卻找到大量 "發展中國家" 條目。 找尋"月台" 一詞時卻找到"十月台商…" 的信息。 由於漢字從來就不便利資料檢索和處理(如排序等),以至研究者不得不用西文。 這也是大量留學生出國留學的原因之一。 從英文"research"一詞沒有貼切原意譯詞的事實可以體驗出每一代中國人由於找不到前人的文獻而被迫反覆從事低水平的研究和創作以致難以鑽研理論開發高新科技和孕育出燦爛的文化和藝術。 從這點看來有效的分詞辦法也應該對漢字適用(如朝鮮的諺文) 作家們爲主動分詞作出的勞動不但令中文更明確和便於閱讀而且還便利其檢索。

 

中文句子短與不分詞的關係

從事英中翻譯的人都知道英文的長句往往需要切分爲兩句或更多的中文短句。 歐化中文長句因需要人們在反覆閱讀和語詞重組後才勉强讀懂因而減低閱讀效率。 這是漢字不連寫的缺陷之一。 人類大腦不適宜同時處理超過七個信息單元不管這些單元是多音節還是單音節。 中國古代只有七言詩而沒有八言詩古人似乎已掌握這個規律。 七個英語多音節詞組成的句子比十幾個漢字組成的對應句子容易讀得多。 這種情況當然對中文不利 在表達精確思想的時候尤其如此。 中文分詞連寫足以消除中英語文在這方面的差距。 下面取自1999 <聯合國秘書長關於聯合國工作的報告> 28段的例子很能說明這一點。

 

原文:  Greater efforts are also being put into contingency planning and other preparedness measures for disaster-prone countries,while major improvements in risk-assessment and loss-estimation methodologies have been identified through the International Decade for Natural Disaster Reduction.

 

中譯 目前更致力於替容易發生災害的國家擬訂應急計劃和其他備災措施同時通過國際減少自然災害十年確定在風險評估和損失估計方法上的重大改進。

 

中譯分詞連寫: 目前 致力於 容易 發生 災害 國家 擬訂 應急 計劃 其他 備災措施同時 通過 國際 減少 自然 災害 十年確定 風險 評估 損失 估計 方法上 的重大 改進。

 

分詞拼音:  muqian geng zhiliyu ti rongyi fasheng zaihai de guojia niding yingjijihua he qita bei zai cuoshi,tongshi tongguo Guoji Jianshao Ziran Zaihai Shinian queding zai fengxian pinggu he sunshi guji fangfa shang de zhongda gaijin.

 

連寫的文化基因

筆者剛從日本旅遊回來。印象深刻的是日本語已經成功移植羅馬字分詞連寫的文化基因。 地名和事物名稱都以連寫羅馬字拼寫。 "東京"拼寫成"Tokyo"而非"To Kyo"; "橫濱""Yokohama"而非"Yoko Hama" 同樣"櫻花"寫成"sakura"; "非常感謝"寫成"domo arigato gozaimasu" 看來我們不但在進行漢語拼音輔助普通話教學時有必要建立分詞連寫習慣而且連中文本身也應該實現分詞連寫,並使之成爲牢固的文化基因。

 

 

作者: 吳文超  香港高威軟件有公司主席兼總裁

Tel: 2730-7121  Fax: 2730-7127  Email: apollowu@gowell.com

2004325