論現代漢語的類詞綴
王洪君/富麗
【內容提要】本文旨在從句法音系接面的角度、根據大規模語料庫的統計材料論證類詞綴是現代漢語的一個獨立的、重要的單位類別。作者發現,與詞根相比,類詞綴與詞綴、助字一樣具有單向高搭配性、結構類型個別化和類化作用的特點,意義也較詞根明顯泛化。與詞綴、助字相比,類詞綴主要與雙音詞和多音節類詞相配,而詞綴只能與單音字和部分雙音詞相配,助字則是自由地與包括自由短語在內的所有單位層級相配。另外,類詞綴新生類推潛能極強,可根據接收向周遍性組配規則大量新創語義透明的類詞字組,與詞綴明顯不同。
【摘 要 題】漢語言文字學
【關 鍵 詞】類詞綴/單向高搭配性/單位層級/新生類推潛能/接收向/生成向周遍性組配
【正 文】 1引言 詞根和詞綴是詞法中的一對兒重要術語。一般的定義是(如高校選用的各種《語言學概論》、《現代漢語》教科書),詞中表達概念義(或稱“實在意義”、“詞匯義”、“基本義”)的部分是詞根,意義虛化、在詞中起改變概念義的附加作用和/或語法作用的部分是詞綴。并且,詞根語素可以是自由的、不定位的,而詞綴只能是黏著的、定位的。 不少論著還談到,除詞綴外漢語還有大量的“類詞綴”(或稱“準詞綴”,下面除轉引外一律稱“類詞綴”)。常提到的類詞綴有“-化、-家、-型、-式、超-、準-、類-、反-”等。(詳參呂叔湘1979、陳光磊1994、馬慶株1995等)類詞綴比詞綴還多,被認為是漢語的一個特點。 什么是“類詞綴”呢,一般的說法是,它的意義不像真詞綴那么虛化也不像詞根那么實,虛實介乎詞綴和詞根之間。但意義的虛實不好把握,因此馬慶株(1995)提出如下標準:1)真詞綴的意義是虛化了的(詞典單列詞條),準詞綴的意義是實在的或抽象的(詞典不單列詞條且不是第一第二義項);2)真詞綴是成虛詞語素或絕對不成詞語素,準詞綴是相對不成詞語素(在基本義項上可成詞);3)真后綴基本都輕音化了,準后綴通常不輕聲。這三條標準中,前兩條的可操作性依賴于詞典是否單列詞條,而是否單列詞條還需要另有語言內的標準,也還有個操作標準問題。 也有學者不主張設立“類詞綴”這一類,比如朱德熙(1982)明確指出“-性、-式、自-”等是詞根語素,理由是它們是不定位的。但如果像馬慶株(1995)那樣區分詞的基本義項和非基本義項,將“-性、-式、自-”的類詞綴義看作非基本義項,則在該義項上它們是定位的。 我們認為,“-性、-式、-化、自-”等是當代漢語中自由地創造新詞語的活躍成分,的確有不同于一般詞根、也不同于詞綴的獨特功能。特別是對于漢語信息處理和漢語作為第二語言的教學來說,它們更有必要作為獨特的類單獨處理。目前對于類詞綴的認識尚無法滿足語言應用中已經提出的新問題。 本文試圖在充分利用統計等研究手段、充分考慮單位的韻律特性的基礎上,首先通過與詞根的對比說明類詞綴與詞綴、助詞的共性,再進一步分析類詞綴不同于詞綴、助字的獨特性質,以期為“類詞綴”的設立提供更為充分的理由。最后,再簡要說明類詞綴在信息處理和第二語言教學中如何處理的設想。 2詞綴、類詞綴、助字的共同點——與詞根之比較 2. 1詞綴、類詞綴、助字共同點總表 詞綴、類詞綴、助字三者的共同之處,也即它們與詞根的基本區別是“虛”。具體特點可總結如下: 詞綴 類詞綴 助字詞根 ⅰ. 單向高搭配性 + + + - ⅱ. 結構類型個別化+ + + (-) ⅲ. 類化作用 + + + (-) ⅳ. 定位 + + + - ⅴ. 意義泛化 +(+) + -
表1 以上5條標準中,ⅰ、ⅱ是我們新提出的,下面將作為重點來闡述。ⅲ、ⅳ、ⅴ是不少語法書中已提到過的,討論就相對簡單一些,重在補充新的可操作性標準。 2. 2單向高搭配性 單向高搭配性是指,在保持結構整體性質不變的前提下,結構的一個位置上的成分可替換的同類成分不多,而另一個位置上可以有很多可替換的成分。 詞綴、類詞綴和助字都具有單向多搭配性的特點,下面分別以“-子”、“-式”、“-的”作為典型給出具體實例: -子:矮子、庵子、案子、鞍子、襖子、鏊子……(8億語料中檢索出“-子”綴兩字組共702例,上面僅列出首字拼音a起頭的6例。) 子[,虛義]-:0例 子[,實義]-:子鱉、子城、子畜、子彈、子代、子堤……(《信息處理用現代漢語分詞詞表》一共收有實義“子-”的兩字詞39例) -式:西式、美式、藏式、明式、版式、盒式……(8億語料中檢索到3466例“-式”字組。) 式[,實義]-:式樣、式子(《信息處理用現代漢語分詞詞表》收有2例。) -的:我的、他的、大的、黑的、跑的、中國的、社會主義的、花園式的……(確切數量難以統計) 的[,虛義]-:0例 上面的統計材料表明,作為詞綴、類詞綴、虛詞的典型代表的“子”、“式”、“的”都體現出單向高搭配性的特點:位于后字位置時可搭配率極高,而位于前字位置的可搭配率則分別為低、極低、零。 詞根沒有單向多搭配性的特點,也即詞根在兩字的前字或后字位置上的可搭配性基本平衡。王洪君(2005)整理了《信息處理用現代漢語分詞詞表》中動物義場常用單字的所有兩字組合,下面是“馬”、“騾”、“驢”在兩字組中的搭配情況: 馬-:馬鞍、馬背、馬草、馬場、馬肚、馬隊、馬房、馬糞、馬夫……(共100例) -馬:川馬、兒馬、軍馬、騍馬、口馬、龍馬、木馬、肉馬、石馬、天馬……(共95例)“馬”在前后兩個位置的搭配性都相當高,雙向基本平衡。 騾-:騾背、騾肉、騾子、騾馬(共4例)-騾:驢騾、馬騾、石騾、轅騾(共4例)“騾”在前后兩個位置的搭配性都極低,雙向也平衡。 驢-:驢背、驢鞭、驢車、驢糞、驢駒、驢騾、驢馬、驢群、驢肉、驢屎、驢蹄、驢腿、驢臉、驢子(共14例) -驢:腳驢、毛驢、藏西藏驢、草驢、公驢、叫驢、黑驢、母驢、牝驢、騷驢、小驢、野驢、禿驢、蠢驢(共14例)“驢”在我們的統計中屬于低搭配與中搭配的交界處。可以看到,它的搭配也是雙向平衡的。 以上只是三個例子,其實我們統計過許多單字,在詞根義項上體現出搭配性的雙向平衡性而在詞綴、類詞綴、助詞的義項上體現出單向高搭配性,是普遍的規律。 有一類王洪君(1994)稱之為“類名定中”的結構,似與類詞綴有糾葛,它的后字也有很高的搭配性。例如“鯉魚、鯽魚、甲魚、平魚……”,它們的后字都是表大類名的“魚”,前一成分則表示魚的具體小類。但要注意的是,類名結構后字的高搭配性往往是雙向而不是單向的:“魚肚、魚鰾、魚翅、魚鱗、魚皮、魚頭、魚尾……”,“魚”在前字位置上同樣有很高的出現頻率。另外,類名后字的意義泛化情況也與類詞綴不同,我們將在下文討論。
2. 3結構類型的個別化 詞根與詞根的組合,不論是詞法性質的還是句法性質的,都可以歸納為定中、聯合、述賓、狀中、述補、主謂等有限的幾種類型,(王洪君1998)可統稱為“基本復合結構類型”,簡稱“復合結構”。 詞綴、類詞綴、助字參與構造的結構則個體性很強,結構意義或功能基本由這些虛化成分決定。具體來說,三者的結構個別化有程度的差別。詞綴、助字參與的字組完全不能歸入上述基本復合結構類型,只能以個體命名為“-兒”綴詞、“的”字結構等。類詞綴的結構個別化進程稍差,有的還勉強可以歸入某種復合結構,有的則完全不可以。 先看定中結構。定中結構的特點是結構整體表示中心語的一個下位次類。盡管有些構詞結構附加了特殊的意義,其中的字義也或有引申或轉移,但從更抽象的意義組合模式上看,它們仍不超出定中結構的意義整合模式。如“白菜”是“菜”的次類,“河馬”、“海馬”是“像馬的動物”的一個次類。 名詞性詞綴、助字雖然與定中的中心語一樣可以決定整體結構的性質,但所組成的結構不具備“整體表示中心語的下位次類”的特點。比如,“刀子”、“刀兒”不等于一種“子”或一種“兒”,我們不能問“這是個什么‘子’呀?”或“這是什么‘兒’呀?”這樣的問題。同樣,“數學的”也不等于一種“的”,問“這是一種什么‘的’呀?”更是無稽之談。 類詞綴的情況有所不同。它組成的結構在一定程度上仍可看成復合結構。比如“數學家”可以看做一類“家”,我們可以問:“他是個什么‘家’呀?”但“一定程度上可以”,也就是說已經有了很大的困難。定中結構的基本鑒別式是“數量AB→數量B”(如“一條鯉魚→一條魚、一朵紅花→一朵花、一雙拖鞋→一雙鞋”),而“-家”和其他類詞綴字組基本都不適用這一鑒別式,如: 一位數學家→[*]一位家、一個炊事員→[*]一個員、一名拖拉機手→[*]一個手 類詞綴字組的復合結構類型已經十分模糊,它們常常不適用復合結構的基本鑒別式,個別的連基本意義模式都不適用了。下面再比較其他幾種類型: 1)超短、超硬、超自然、超階級——超車、超齡、超期、超支 2)丑化、綠化、個性化、多元化——火化、變化、消化、融化 每組左邊的結構是類詞綴字組,右邊的則是詞根復合字組。 1)組左邊的類詞綴結構一般被認為是述賓式,但它與右邊的詞根的述賓式復合結構有明顯差異。典型述賓式的功能特點是V+O→Vi,即述賓式的整體功能相當于不及物動詞;其語義組合模型是“動作+特定物→與特定物相關的自足活動”;其鑒別式是可中插/或后加“了”,構成“V了O(了)”格式,其基本的整體功能是加時體成分后做謂語。(王洪君1998)即使是有附加義或字義有引申的述賓式雙音詞,也都符合上述規則。比如“謝幕”、“打拳”的抽象語義分別是“與幕相關的致謝活動”和“與拳有關的廣義活動”,它們的入句功能都如同Vi,它們都可以變換為“謝了幕了”、“打了拳了”。 1)組右邊的“超車”等字組符合上述特點,如它們都可以中插或后加“了”:“超了車了”、“超了齡了”。加時體成分后可入句做謂語,不能再帶其他賓語(相當于Vi)。 而左邊含有類詞綴的字組則不具有這些特點,如“[*]超了短”、“[*]超了自然”。它們的基本功能是在名詞性成分之前做定語,起修飾作用,例如:“超短(裙)、超硬(材料)、超自然(能力)、超階級(立場)”等。它們的基本意義是區別名物,而不是表活動;總之,是區別性的而不是不及物動詞性的。 再來看2)組。“化”本為動詞,它用于構詞有兩種組合方式,一是與另一動詞組成并列式,如“變化”、“消化”、“融化”,二是與前邊的名性成分組成狀中式,如“火化”。這兩種方式都列在了2)的右邊。 2)組左邊的類詞綴字組,從形式上看,與狀中式的“火化”類一樣是“N+化”。但是名性狀語在狀中式中的典型意義是表示方式,如“火化”義為“用火化”,“手舉”義為“用手舉”。很明顯,2)組左邊各例無一能進入這一結構語義模式(“丑化→[*]用丑化”)。其他類型狀中的鑒別式,比如說能否插入“地”、“然”,能否用“怎樣V”提問等等,也都不適用“-化”結構。所以,很難把“-化”字組歸入狀中。與并列式的“V+化”也明顯無法類同。 總之,類詞綴字組的結構類型個別性較強,很難歸入復合結構的基本類型。與其勉強歸入某個復合結構類,還不如像詞綴、助字那樣每條都獨立一類處理為好。 2. 4類化作用 類化作用是詞綴、類詞綴、助字與詞根共同的重要區別,前人已有過討論。(馬慶株1995、朱亞軍2001,轉引自樸愛陽2002)類化作用指的是詞綴、類詞綴和助字有決定整個組合的語法功能的類范疇,詞根則沒有這樣的功能。例如,由后綴“-子”構成的字組都是名詞,“-然”則都是形容詞;由類詞綴“-手”和“-感”構成的字組都是名性的,“-式”則都是區別性的;帶助字“的[,3]”的結構都是名性的,帶“了[,1]”的都是動性的。 在名性類化作用方面,詞綴、類詞綴與名性詞根的差異還不那么明顯。比如,“箱”、“刷”分別為名詞性和動詞性的,加詞綴后的“箱子”“刷子”都為名詞性;“拖拉機”、“狙擊”分別為名詞性和動詞性的,加類詞綴后的“拖拉機手”“狙擊手”也都為名詞性。但是,后置的名性詞根也有同樣的功能,如“菜”、“水果”為名性的,“砍、切割、切菜”為動性的,而后加了名詞性詞根“刀”的“菜刀、水果刀、砍刀、切割刀、切菜刀”都是名詞性的。 但細分析起來,名性詞綴、類詞綴與詞根還是有細微的差別,這就是名性詞根與動性定語的配合還有音節方面的限制。與名性詞根相配的動性定語一般是雙音的:1)單音動詞做定語很不自由,如“砍刀”,但“?切刀”、“[*]削刀”、“[*]割刀”);2)三音節VP基本不做定語,如“削鉛筆刀”一般說成“轉筆刀”。名性詞綴不受1)的限制,類詞綴則1)、2)都不受限制。(如“滾雪球式、拉大鋸式、趕大集式、侃大山式、查家宅式[追問]、纏頭巾式[小帽]”) 區別詞性類詞綴與詞根的差別最大。比如,“式”、“型”是名性的,而“-式”、“-型”組成的結構都是飾詞性的;“超”、“反”是動性的,而“超-”、“反-”組成的結構也都是飾詞性的。 由于助詞有決定整體結構功能的類化作用,所以近期的生成語法中,已經把它們處理為結構的中心成分。這一處理的確能夠使“中心語支配原則”成為語言中一以貫之的重要原則。同理,詞綴和類詞綴也有決定詞或類詞整體功能的特點。從這一重要原則也可以看出,類詞綴在語言體系中與詞根不同而與詞綴、助詞相同的特點。 2. 5定位性 所謂定位性是指詞綴、類詞綴、助詞都出現在組合的固定位置上。前綴和類前綴只出現在組合的最前,后綴和類后綴只出現在組合的最后,漢語的助字一般處于組合的后面。而詞根在組合中的位置是不固定的,它可前可后,例如“花”在“鮮花”、“茉莉花”和“花朵”、“花卉”中位置不同,“人”在“人民”、“人類”和“男人”、“成人”中位置不同。 這是類詞綴很顯見的特點,這里不再多說了。需要說明的一點是,有的綴字的出現位置似乎可前可后,如“有”可以在前(如“有色、有機、有線、有軌、有理、有期”),也可以在后(如“寫有、刻有、畫有、裝有、種有、記載有、安裝有、保存有、出版有”)。但我們認為其中的“有”是不同的兩個成分,前者是區別詞性的前綴,而后者是動詞性的類后綴,含有這兩種附綴的字組的語法作用是不一樣的。
表2 表2中的第ⅰ點前人沒有提到過,下面將重點闡述。ⅱ、ⅲ、ⅳ、ⅴ點已有學者不同程度地論述過,本文將利用語料庫檢索到的材料給予更詳細、更全面地說明。另外,明確地區別“組合能力”和“新生類推潛能”這兩個概念也是本文的特點。 3. 2所黏附的層級 詞綴、類詞綴、助詞本身都是虛化成分,它們必須定位黏附于某個實義性的單位。而這三者的一個重要差異,就是它們所黏附的單位層級不同。 3. 2. 1漢語的單位層級——通貫語音-語法的定義 一般認為漢語語法的單位層級是(由小至大):語素-詞-短語-小句-句子。由于不像英語那樣有詞重音做形式標記,漢語的“詞”很難找到可操作的形式上的標準。因而漢語的詞在與語素、與短語這上下兩個方向上都難以從語法或語義上找到一刀兩斷的分界標準。無論是擴展插入法(陸志韋1957)、語義推斷法(如“白菜”≠“白”+“菜”,所以是詞),還是“平行周遍原則”(陳保亞2000,如“雞蛋”的前一位置上所有的卵生動物名都可以周遍地替換而整體結構義不改變,所以“雞蛋”是詞組)都不能完全解決問題。(詳參富麗2001) 近幾年來從韻律和語法接面的角度討論語言單位層級的思路很值得注意,它突破了只用語法或語音形式來定義單位層級的舊有思路,堅持了形式上的可操作標準,得出的結果與初步調查的社會心理一致。下面著重介紹這一思路。 馮勝利(1997)首先提出,“韻律詞”是漢語的基本單位。韻律詞用“音步”來定義,兩音節的為標準音步,2+1式的三音節定中為超音步,四音節的成語為2+2式復合音步,這些都是韻律詞。而“種大蒜、大房間”等1+2式述賓或定中結構為韻律短語。 從屬于語音層面的韻律的角度(或更具體地說,是節奏、節律)觀察詞與非詞,超越了國內一直以來對于詞和短語的區分標準。在這里,語法、語義方面的因素變得不是那么重要了。對于一個組合,無論它的中間能否插入其他成分,無論它的整體義是否等于部分義加結構義,也無論它的某個位置是否能平行周遍地替換成員,只要滿足兩個音節一音步的條件就是韻律詞,像“白菜”、“茶杯”、“雞蛋”、“木桶”等據此都歸為標準韻律詞。 還請注意,根據馮勝利(1997)的定義,雙音單音步的字組,即使是含兩個詞根(如“蔬菜、白菜、雞蛋、砍刀、大蒜”),也不再是復合詞,而是標準詞了。標準詞的再復合,如“公共汽車”才是復合詞。端木三(2000)也是這樣處理的。 王洪君(2000,2001,2002)系列論文也是從韻律的角度討論漢語單位層級問題,區分出韻律詞(簡稱“詞”)、類詞短語(簡稱“類詞”)、自由短語(簡稱“短語”)這三級單位。我們仍然堅持這三級單位的區分,并將這四條韻律標準再簡化為下表中的兩條: 韻律標準 詞 類詞 短語 ⅰ. 穩定的單音步,即更大組合中音步從不分裂 +- - ⅱ. 更大組合中內部成分間停延總是小于外部停延++ -
表3 根據上表所列標準而得到的分類,與語法語義的某種分類有很好的對應,如表4所示: 詞 類詞也稱黏合短語、句法復合詞(自由)短語 韻 內停延總小于外停延;穩 內停延總是小于外停延;可能多 內停延可以大于或總是大于 律 定的單音步 音步。外部停延;可能多音步。 性 黏合結構。音義對應單純 黏合結構。按規則臨時組配的單 非黏合結構。按規則臨時組 質 化的最小單元。 元,不涉及指示、情態、數量、時體 配的單元,涉及指示/情態/ 等句法范疇數量/時體等句法范疇 結 黏合兩字,2+1式粘合定1+2式粘合定中,2+2黏合狀 組合定中、狀中,特殊動詞的 構 中、動結、動趨。 中,多字黏合定中、4字成語。 述賓、主謂,等立結構。 實 雨傘、手舉、驟降、看清、冷 紙雨傘、并肩前進、中華人民共和這書、倆壺、敢去、是他、買雨 例 熱、再也、雨傘廠 國、一衣帶水、馬達加斯加 傘、剛走、(買了)蘋果
表4 該方案特別值得注意的是: 1)韻律標準考慮的是一個字組在不同的更大組合中的所有而非某一語段中的韻律表現。標準ⅰ考慮的是字組在各種更大的組合中是否都在一個音步中。比如,“種大蒜”在“他喜歡|種大蒜”中是一個音步,但在“不種|大蒜”中卻分在兩個音步。“種大蒜”不是“穩定單音步”,就不歸為韻律詞。而“雨傘廠”在更大組合中總在一個音步中,如“找|雨傘廠”、“雨傘廠|好”,“雨傘廠”是“穩定的單音步”,就歸為韻律詞。 2)標準ⅱ考慮的是某字組在更大組合中內停延與外停延的相對大小。比如,“中華|人民|共和國”內部可有兩個小的停延,但無論是在“熱愛||中華|人民|共和國”還是在“中華|人民|共和國||主席”中,其內部停延總是比外部的停延小。內停延總是相對地小,說明它是一個內部黏合的類詞。而“一輛|鳳凰牌|自行車”如果放在“我丟了|一輛||鳳凰牌|自行車”的更大組合中,表數量的“一輛”節奏上就會與“鳳凰牌自行車”分開,而與“我丟了”結合。內停延可以大于外停延,說明該字組內部成分比較松散。 與馮勝利(1997)不同,標準ⅰ明確地把“這書、倆壺、能去、想去、愛你、不去、也去、剛走”等帶有句法層次范疇的兩字組排除出了韻律詞,這與語法學界的一些研究成果有很好的契合。如,朱德熙(1982)已指出,指示、領屬、數量定語跟“的”字結構定語一樣與中心語關系較松(組合結構),其他不加“的”的定語與中心語關系較緊(黏合結構),句法作用相當于單個詞。生成學派近年來的研究指出,指示、領屬、數量成分是比NP還高一層級的DP短語的限定語,負責表達與說話人和語境的關聯,而其他不帶“的”的定中式黏合結構(如“中華人民共和國”、“小紙雨傘”等),生成派處理為“句法詞”。 我們的韻律單位與以上語法理論契合應該不是偶然的,考慮了所有分布的穩定性韻律特征才是語言深層的本質性的特征,才可能與語法語義的單位層級有很好的關聯。 根據我們的標準而劃定的“詞”,與漢語拼音方案規定的詞兒連寫規則基本一致,也與王立(2003)針對“什么是公眾語感的詞”而進行社會語言學調查的結果相一致,這應該是確實存在通貫語音語法層面單位層級的證據。
3. 2. 2類詞綴所黏附的單位層級 從“字-詞-類詞-短語”的單位層級來考慮詞綴、類詞綴、助字組配成分的區別,我們發現,體詞性(名性或區別性)類詞綴有自己既不同于詞綴、也不同于助詞的鮮明特點。如表5所示: 詞綴 類詞綴 助字 典型例 -子 -式-的 單字 案/子、刷/子 京/式、立/式我/的、買/的 詞喇/子 牌樓/式、擴散/式 牌樓/的、購買/的 類詞 [*]玻璃轉門/子 清代牌樓/式、雙向擴散/式 清代牌樓/的、集體購買/的 [*]桌與椅/子“羅密歐與朱麗葉”式羅密歐與朱麗葉/的 凝固短語 [*]桌對桌/子 “男人對男人”式 男人對男人/的 [*]人坐椅/子 “西方英雄救中國美人”式 西方英雄救中國美人/的 [*]這暗門/子 [*]這種牌樓/式 [*]二混和二流/子 [*]中國和蒙古/式 這種牌樓/的中國和蒙古/的 自由短語 [*]一個好的案/子 [*]一個好的國家/式 一個好的國家/的 [*]刮了胡/子 [*]去了頭/式 去了頭/的
表5 先以“-子”和“-式”為例看詞綴與類詞綴在組配單位層級的區別。 《信息處理用分詞詞表》收錄的以“-子”收尾的、名詞性條目共1310條。其中的多音節條目也不少,但“-子”大多并不加在多音節上。如“大/帽子”、“二道/販子”中的“-子”是加在單音詞根“帽”和“販”上。由于“帽子、販子”在詞表中已經單獨收錄了,條目“大帽子、二道販子”實際上并未增加“-子”的組配數目。經過字組內部的結構分析再經去重,與“-子”直接搭配的詞干就更少了。這些詞干的音節數分布如下: “-子”:單音702例>雙音60~240例>三音1例(?)>四音以上0例 雙音后附“-子”的數量有較大的變動范圍,是因為這部分條目的構詞層次有三種可能的情況:1)只能分析為“-子”加在雙音詞根上的2+1式60例,如“半語/子、耳刮/子、哈喇/子、后生/子、麻雷/子、么蛾/子、澡堂/子”等。2)只能分析為“-子”與單音字之后再前加單音字的1+2式280余例,如“八/輩子、表/蒙子、大/帽子、電/梳子、老/兒子、熊/瞎子”等。3)既可以分析為1+2式也可以分析為2+1式的180例。如“暗/門/子、筆/桿/子、車/牌/子、菜/團/子”等。這樣,如果從嚴掌握,雙音詞根配“-子”最少只有60例,如從寬掌握則可多至240例。“-子”直接配三音成分的可能只有1例,是方言詞“一塌刮子”,我們不太清楚它的內部結構,但至少它不是普通話,可忽略不計。總之,詞綴“-子”配單音成分的占了絕對多數,配雙音成分的驟減至配單音的1/3到1/11,配三音以上成分的是0。 與“-子”不同,“-式”與單音節的搭配反倒有較大的限制。先看數據。8億語料中共檢索到已經結構分析和去重處理的“-式”3466例,其組配成分的音節數目如下: “-式”:單音節152例<雙音2160例>三音451例<四音以上703例 數據顯示,類詞綴跟單音節搭配的最少,與雙音搭配的最多,兩者數量之比為7/100。而與三音及四音以上的成分搭配的已超過總數的1/3,并遠遠超過與單音節搭配的數量。 “-式”可以相當自由地與3音節字組搭配,包括屬于韻律詞的2+1式定中,也包括屬于類詞的1+2式定中和屬于凝固短語的1+2式述賓主謂等。如:防震棚式、保險柜式、大轉盤式、大團圓式、“滿堂灌”式、“一帶二”式、“搭積木式”。與“-子”不同,這些“-式”都是加在3音節整體的后面,無一可再分析為單音節或雙音節加“-式”,如“[*]防震/棚式、[*]倒/寶塔式、[*]大/團圓式”。 “-式”與四音節以上字組搭配的實例更多。其中不乏成語,但更多的是一般性類詞短語。如“產品性能[,定中]式廣告、長袍馬褂[,并列]式學位服、鞭打奴隸[,述賓]式的批判、產權分割[,倒置述賓]式交易、“爐邊談話[,狀中]式”會議、牧師布道[,主謂]式高亢的嗓音、買斷販賣[,復謂]式”等等。它們的構造類型十分全面,定中、狀中、并列、復謂、述賓、主謂等等都有,但大多是由兩個基本詞組成的典型類詞,共計677例。只有13例是由三個基本詞組成的6音節以上的字組,如“多點汽油噴射式發動機、安妮女王復興式風格、‘濃眉大眼紅臉蛋式’婚紗照”等等。雖然它們內部有三個或更多的基本詞,但沒有助詞且結構為偏正或并列,因此仍然是類詞字組性質。 再看“-式”與“-的”在組配成分上的差別。 四音節以上的“-式”還有13例從表面看是自由短語結構(占703例四音節以上“-式”的1.8%,所有3466例“-式”的0.38%)。它們或帶有短語標記或是由三個以上基本詞構成的“主動賓”式按內部結構的不同分類例子如下: 1)“羅密歐與朱麗葉”式愛情、“騎紅馬,扛大刀”式;2)“大馬拉小車”式運行、“西方英雄救中國美人”式;3)“泥做的骨肉”式、“發射后不管”式導彈;4)“我從此就是你的人了”式的愛情表白 我們把這些特例分為幾種情況與自由短語對比。ⅰ)并列結構。作為自由短語的并列結構,其主要特點之一是可以并列簡縮,如“我的和你的”可簡縮為“我和你的”。而1)中的實例雖然有并列連詞或頓號出現,但與自由短語的并列緊縮有明顯不同:“羅密歐與朱麗葉式”并不是“羅密歐式愛情與朱麗葉式愛情”這一自由短語的并列緊縮,而是“羅密歐與朱麗葉”結合起來代表一種特定的愛情關系,先已形成了不可分割的凝固語。同理,“騎紅馬、扛大刀”一起先合成了一個農民革命者的形象,而不是分別兩類形象的并列簡縮。ⅱ)含有三個以上基本詞的“主動賓”或復謂結構。這些結構雖然與句結構類似,但未出現指示詞、時體助詞,具有不跟具體說話語境相聯的超時空性,這是構成成語、慣用語的一般條件。這些例子也的確是表示已經在大眾心目中構成了固定樣式或方式的單一形象的。ⅲ)含有自由短語的標記“-的”、“-后”。“泥做的骨肉”是賈寶玉的名言,是“污濁男人”形象的代表,已成凝固語。“發射后不管”沒有主賓語和時體助詞出現,與“飯前洗手”等標示語一樣屬于半自由半凝固結構。ⅳ)最為極端,既有時體助詞“了”出現,又主謂賓俱全,是典型的句結構。但“我從此就是你的人了”是套話式引證語,引號不能省略,可以看成一種特殊的凝固語。 可見,“式”的前接成分大部分是典型的詞或類詞,也有極少的凝固性習用語(帶引號標記)出現,但絕不出現真正意義上的自由短語。 綜上,在體詞性的范圍內,詞綴的核心搭配范圍在單音字,延展到了一部分雙音詞;類詞綴與單音字的搭配已不太自由,其核心搭配已轉移到了雙音詞,并延展到了多音節詞和類詞;助詞則可與長短不限的自由短語搭配。可以說,詞綴只是基本詞的標記,類詞綴兼是基本詞和類詞的標記,助詞是自由短語的標記,它們各有分工。
4類詞綴與詞典收詞和第二語言教學 由于類詞綴字組語義上的透明性,母語者并不需要通過查字典來得知其語義,所以以母語者為對象的語文詞典幾乎不收錄它們是合理的。但計算機和第二語言學習者并不具備母語者這種潛在的語言知識,因此需要對類詞綴字組做相應的處理。怎么處理呢?以下幾點應注意: 1)與詞綴不同,類詞綴目前正處于能產活躍期,其新生類推潛能是無限的。因此任何一部詞典,即使是大型詞典也不可能窮盡地收錄類詞綴所搭配的所有字組。 2)與詞綴字組不同,不少類詞綴字組(特別是其中多音節的)的復現率極低,它們是根據需要而臨時創造的。如“‘濃眉大眼紅臉蛋’式[婚紗照]”在8億語料中僅出現一次,再增加語料也未必會再次出現。也即,許多類詞綴字組收錄在詞典中是很不經濟的。 3)與助詞不同,類詞綴字組的內部不涉及句法語義范疇,也即類詞綴字組的句法作用只相當于一個詞。如果類詞綴字組能與句法分開處理,無論是對于信息處理還是外國人學習漢語都是十分有必要的。正確地劃定類詞綴字組的界線,自動處理這一部分的語義信息,是進行句法分析之前的前期工作。 類詞綴字組的整體功能由類詞綴決定。一旦確立了類詞綴的性質,就可以相應地確立類詞綴字組的語法類別,類詞綴可成為計算機標注詞性或第二語言學習者理解句子結構的一個指示燈,可以用它來確定整個字組的語法性質,切分出句子結構的一些較大的單元。 也就是說,雖然詞典無法也無須收錄所有的類詞綴字組,但信息處理和第二語言習得卻又都需要在運用句法之前判定類詞綴字組的邊界和整體語義。 4)與詞綴、詞根不同,類詞綴字組有相當部分是生成向周遍可控的,幾乎全部都是接收向周遍可控的。因此,它們可以不收錄詞表而又能夠達到自動劃界和理解。 其策略應該是:把類詞綴單獨列表,并給出每個類詞綴有哪些生成向周遍的搭配規則,有哪些接收向周遍的搭配規則。 計算機只需要接收方向的組配規則。有了這些規則,知道了某個類詞綴可以與哪些格式或哪些語義類的成分搭配,就可以在相當程度上自動處理文本中類詞綴字組的外邊界(還會遇到歧義切分問題)和整體語義。 第二語言習得者不但需要接收方向的組配規則,還需要生成方向的規則,以避免生成不正確字組 (如“[*]笛子家”)。 此外,單音節與類詞綴搭配的字組有些特殊。除一些封閉性義場(如地名或民族的簡稱、姓氏、英文字母)外,它們中有不少語義不透明、同類類推能產能力差、產生時代早(如“作家、畫家”,“版式、復式”)。這些組配的后字雖然與類詞綴同形且有語源上的聯系,但其實該組配產生之時后字尚未虛化為類后綴,是按普通復合詞創造的,之后又以復合詞的身份增加了附加義。它們與類綴字組差別較大,而與一般復合詞性質相同,最好收錄詞典。 目前,信息學界對類詞綴問題已有不少關注和研究成果,如臺灣中央研究院資訊科學研究所中文詞知詞庫小組(1996)、吳贛(1998)、富麗(2001)等。當然,要使計算機能夠達到對類詞綴字組的自動處理,還需要更多、更細致的研究。 對外漢語教學方面對類詞綴的重視明顯不夠。比如,一位教員告訴筆者,一個留學生曾經抱怨,課本上出現的“無權”一詞,自己從未學過,為什么未收入生詞表。可以想見,確定一些常用的類詞綴,給留學生講解類詞綴接收向的意義推導規則、生成向的音節搭配規則和哪些語義類可以周遍生成的限制,定會提高留學生理解和運用漢語的能力。 總之,從應用方面詞根、詞綴、助詞與類詞綴應該采用的不同處理策略,也可以看出在漢語中應該把類詞綴作為單獨一類的必要性。
注釋: ①此數為估算數值:根據北工大兩億語料“的”的字頻減去所有含實義“的”的問和成語的頻率再乘4倍而估得8億語料中助詞“-的”頻率為1,868,440。 ②陳保亞教授指導的李洪彥同學2004年本科論文首次提出這兩個概念,只是“接收向”稱為“理解向”。
【參考文獻】 [1]北京大學中文系現代漢語教研室1993《現代漢語》,北京:商務印書館。 [2]卞成琳2000《漢語工程詞論》,濟南:山東大學出版社。 [3]陳保亞1999《20世紀中國語言學方法論》,濟南:山東教育出版社。 [4]陳光磊2001《漢語詞法論》,上海:學林出版社。 [5]端木三1999重音理論和漢語的詞長選擇,《中國語文》第4期,246—254頁。 [6]端木三2000漢語的節奏,《當代語言學》第4期,203—209頁。 [7]馮勝利1997《漢語的韻律、詞法與句法》,北京:北京大學出版社。 [8]馮勝利1998論漢語的“自然音步”,《中國語文》第1期,40—47頁。 [9]馮勝利2003韻律制約的書面語與聽說為主的教學法,《世界漢語教學》第1期,87—97頁。 [10]富麗2001《現代漢語類詞綴研究——兼論附綴字組的成詞性及詞庫收詞問題》,北京大學中文系碩士論文。 [11]葛本儀2001《現代漢語詞匯學》,濟南:山東人民出版社。 [12]胡明揚2000《語言學概論》,北京:語文出版社。 [13]胡裕樹1981《現代漢語》(增訂本),上海:上海教育出版社。 [14]黃伯榮廖序東1990《現代漢語》(增訂版)上冊,北京:高等教育出版社。 [15]黃居仁1997《資訊處理用中文分詞規范》設計理念及規范內容,《語言文字應用》第1期,92—100頁。 [16]梁源2000二字結構凝固度分級考察,《語言文字應用》第2期,21—32頁。 [17]劉叔新1990《漢語描寫詞匯學》,北京:商務印書館。 [18]劉源譚強沈旭昆1994《信息處理用現代漢語分詞規范及自動分詞方法》,北京:清華大學出版社,南寧:廣西科學技術出版社,聯合出版。 [19]陸志韋1957《漢語的構詞法》,北京:科學出版社。 [20]呂叔湘1979《漢語語法分析問題》,北京:商務印書館。 [21]馬慶株1995現代漢語詞綴的性質、范圍和分類,《中國語言學報》第6期,101—137頁,北京:商務印書館。 [22]樸愛陽2002《現代漢語派生詞研究》,南開大學博士論文。 [23]沈孟瓔1987略論新詞語的特征,載沈孟瓔《新詞·新語·新義》,福州:福建教育出版社。 [24]沈陽1997現代漢語復合詞的動態類型——談語言教學中的一種詞匯/語法單位范疇,《語言教學與研究》第2期,24—40頁。 [25]孫茂松李行健王洪君富麗2001《信息處理用現代漢語分詞詞表》,教育部九五社科重點項目結項報告(未刊)。 [26]臺灣中央研究院資訊科學研究所中文詞知詞庫小組1996《“搜”文解字——中文詞界研究與資訊用分詞標準》,技術報告96—01(未刊)。 [27]王洪君1994從字和字組看詞和短語——也談漢語中詞的劃分標準,《中國語文》第2期,102—112頁。 [28]王洪君1998從與自由短語的類比看“打拳”、“養病”的內部結構,《語文研究》第4期,1—11頁。 [29]王洪君2000漢語的韻律詞和韻律短語,《中國語文》第6期,525—536頁。 [30]王洪君2001音節單雙、音域展斂(重音)與語法結構類型和成分次序,《當代語言學》第4期,241—252頁。 [31]王洪君2002普通話中節律邊界與節律模式、語法、語用的關聯,《語言學論叢》第26輯,279—300頁,北京:商務印書館。 [32]王洪君2005動物、身體兩義場單字組構兩字的結構模式,《語言研究》第1期,1—11頁。 [33]王立2003《漢語詞的社會語言學研究》,北京:商務印書館。 [34]吳贛1998《現代漢語文章中后綴詞語的動態歸并》,北京工業大學人工智能研究所碩士論文。 [35]葉蜚聲徐通鏘1981《語言學綱要》,北京:北京大學出版社。 [36]俞士汶1999《現代漢語語料庫加工——詞語切分與詞性標注規范與手冊》,北京大學計算語言學研究所(未刊)。 [37]張家太1988漢語新詞語瑣議,《沈陽師范學院學報(社科版)》第2期。 [38]趙元任1979《漢語口語語法》(中譯本),呂叔湘譯,北京:商務印書館。 [39]朱德熙1980《現代漢語語法研究》,商務印書館。 [40]朱德熙1982《語法講義》,北京:商務印書館。 [41]朱亞軍2001現代漢語詞綴的性質及其分類研究,《漢語學習》第2期,24—28頁。