中文词类分析总表.docx

上传人:b****1 文档编号:19351 上传时间:2022-10-01 格式:DOCX 页数:53 大小:53.41KB
下载 相关 举报
中文词类分析总表.docx_第1页
第1页 / 共53页
中文词类分析总表.docx_第2页
第2页 / 共53页
中文词类分析总表.docx_第3页
第3页 / 共53页
中文词类分析总表.docx_第4页
第4页 / 共53页
中文词类分析总表.docx_第5页
第5页 / 共53页
点击查看更多>>
下载资源
资源描述

中文词类分析总表.docx

《中文词类分析总表.docx》由会员分享,可在线阅读,更多相关《中文词类分析总表.docx(53页珍藏版)》请在冰豆网上搜索。

中文词类分析总表.docx

中文词类分析总表

近代漢語斷詞手冊

前言

體裁問題(文言、詩詞歌賦)

如果某些動詞的使成用法在現代漢語中不再具有創生力時,即視為及物動詞,不再視為兼具及物與不及物用法的「作格動詞」(ergativeverb)。

只是這些特殊用法必須視為文言的遺留,和現代漢語中保有創生力的作格動詞不同。

有些副詞是文言的遺留,其搭配的動詞或副詞很有限制,因此會使人覺得應該和其他語素被合為一詞,不過

體裁問題(其他:

成語諺語)

壹、一般分詞原則

1.單字詞自為一個分詞單位。

2.多字而為單語素的自為一個分詞單位,因此連綿詞、音譯詞自為一個分詞單位。

3.疊字詞若非可由構詞律產生者,則自為一個分詞單位。

但AABB式若由AB式產生者,仍標為一個分詞單位。

4.無論何種複合結構,若是超過四個音節的,只要能再切分,原則上給與切分。

也就是一個字組如果在意義上雖為一體而還不是不可分的整體,如果音節過長,還是儘可能拆分。

但成語諺語不受此原則限制。

5.一個字組若是由構詞律組合者切分之。

5.專名原則上自為一個分詞單位。

6.語素(字)的組合產生的意義不只是字義單純累加的(意即意義經過轉化或重構的)合併選為一個分詞單位(以下就以「轉義」來簡稱意義的轉化或重構)。

7.離心結構合併為一詞。

8.附著語素依以下標準來決定是否獨立為詞:

(1).虛字為附著語素,依所附著的成分來決定是否獨立為詞。

傳統上列為虛詞的副詞(這裏的副詞並不包括名詞、動詞作狀語的)、介詞、連詞、助詞等儘管為附著語素,但都依附於詞組上,故原則上獨立為詞。

指代詞介於虛實之間,但通常獨自分為一詞(參第8條)。

(2).其他的虛字依其附著情況又大可分為兩類,是否獨立為詞也依此分類而定。

附著語素如果只附著於別的詞,不依附於詞組上,則和其他的詞合併為一個分詞單位(如「刀子」「忽然」)。

如果附著語素雖然常附著於詞,但也可以附著於詞組,則該語素獨自視為一個詞(如「兄弟們」的「們」)。

所以如果某語素同時也可以附著於詞組上,該語素就當作一個詞看。

但當這個附著語素只和一個封閉類的詞相結合時,則合併為一個分詞單位(如代詞是個封閉類,因此「他們」視為一詞)。

如果附著語素可以附著於詞和詞組,但能和該語素結合的詞已限定為少數幾個(也就是差不多失去衍生力了),則該語素和相結合的詞合併為一個分詞單位(例如「者」為一個詞,但「賢者」還是合併為一個分詞單位),和詞組結合的則該語素和詞組各自分為一個分詞單位。

(3).附著語素如果固定和某個無窮類的詞相結合而且負擔意義恒為不變的話,一律獨自視為一個分詞單位。

例如:

「第一」的「第」總是搭配數字,數字是無窮類,因此「第」獨自分為一個詞。

但如「第一義」之類有佛學意義,則合併為一個分詞單位。

(4).近代漢語實字是否為自由語素並不易判斷。

目前暫時把不能作名語的名詞和不作述語的動詞視為附著語素。

近代漢語實字如為附著語素,通常只依附於其他語素(包括自由語素和附著語素),這個實字和其他語素合併為一個分詞單位。

9.因為近代漢語實字是否為自由語素並不易判斷,我們也從其結合面的廣狹來幫忙決定是否算是個分詞單位(也就是視常用性或所搭配的語素多寡而定)。

結合面廣泛的語素除非在結合其他語素後造成轉義或者十分常用,否則原則上獨自視為一個分詞單位,虛詞可不用說,其他如指代詞、數詞原則上獨自視為一個分詞單位。

其中數詞即使是幾個數字共同組成一個數目,其中每個數字都各自分成一個分詞單位。

但指代詞、數詞也有和其他詞合併為一個分詞單位的,特別是在偏正結構中。

方位詞的結合面也廣,但在偏正結構中,方位詞與他詞的結合的緊密度,似乎依其地位而有所差別,所以是否獨立分詞,難以一概言之。

指代詞、數詞、方位詞在偏正結構中分詞與否的條件比較複雜,其施行細則見下文的貳之七。

其他實字也有結合面廣的,則以結合後有轉義的或語素搭配固定的為詞,否則各成分分別為詞。

10.實字搭配後為高頻率及共現率高的儘可能的合併為一個分詞單位。

11.離合詞或不連續的詞語原則上分詞,但可加上語法特徵來加以連繫。

12.根據以上標準而分合還猶豫難決的,暫時仍合標為一個分詞單位。

13.成語、諺語原則上合為一個分詞單位,但標上獨有的類別,以示非一般的詞。

如果中間有標點符號隔開,可用語法特徵來連繫。

14.為了比較之便,原則上,除了本手冊已有規則要分詞之外,現代漢語的詞我們也合併為一個分詞單位(衡量現代漢語是否為詞的標準大體依據中研院詞庫小組的電子詞典,但其中也有相異之處,主要的異同可參考第參節)。

貳、各結構類的選詞標準

因無現成的近代漢語詞庫,所以我們要利用在文檔上斷詞和加詞類標記的時候,來建立這樣的一個詞庫。

但要建立近代漢語的詞庫,就得避免把不該列在詞典中的詞語列進我們的詞庫中,在進行分詞時就不得不放棄用現代漢語組的構詞律來合詞,因此有些在現代漢語組該合併的詞語在近代漢語組就不得不分(參第參節)。

一個漢字若正好是一個詞,自不用說應為一個分詞單位。

兩個字以上的組合則有可能是詞或詞組,以下的選詞標準主要是針對兩個字以上的詞或詞組。

語素合併選為一個分詞單位的理由不外乎語素不獨自作述語或名語、語素合併後意義有所轉化、語素搭配固定、使用頻率高、音節不太多等等。

我們對近代漢語詞的分合可以按以下幾類來加以說明:

1.專名、2.連綿詞、3.音譯詞、4.重疊詞、5.派生詞與附屬詞、6.並列結構、7.偏正結構、8.述補結構、9.述賓結構、10.介賓結構、11.主謂結構、12.縮寫或節略、13.成語諺語、14.其他。

一、專名

1.專名不論語素多寡,一律不作切分,獨自作為一個分詞單位。

2.各書篇卷開頭的標題、作者不作標選。

3.專名與通名連用而又同位時(「專名+通名」,其中專名為人名、地名),合併為一個分詞單位。

如。

.

4.因為本標準把連用的專名與通名合併為一個分詞單位,因此造成專名與偏正結構區辨上的問題。

當專名又以通名為其中心語時(其實只限於同位的情況),有兩種可能的選詞法。

其一為選專名,其一為選偏正結構。

二、連綿詞

連綿詞包括雙聲疊韻詞與非雙聲疊韻詞(這些詞大體來自上古,因此是否雙聲或疊韻本應以上古漢語音系為準,而不能依賴近代漢語語音),是不能分解的單純詞(如「恍惚」「珊瑚」),所含各字皆非語素,也就是說每個字分開後獨自沒有意義。

就不能分解這一點言,連綿詞性質類似下述的音譯詞。

只是連綿詞限於二字,而且大體是上古漢語本有的詞或早期的外來詞;而音譯詞不限字數。

在斷詞時,連綿詞不切分,獨自作為一個分詞單位。

三、音譯詞

指外來語直接音譯為漢字而又非專名的。

音譯詞不切分,獨自作為一個分詞單位。

如「菩薩」「菩提」等。

四、重疊詞

(一)分合原則:

1.不是由重疊律產生的重疊形式列為一個分詞單位。

2.描繪情狀的AA式重疊形式不易判定是否由重疊律產生,其中有些可能不用或不常用不重疊的形式了,因此我們把這樣的重疊形式列為一個分詞單位。

表示程度加強的AA式事實上和描繪情狀的連綿詞性質相類,語法表現也相類。

由AB產生的AABB基本上也是描繪情狀的,雖然其中的AB仍為常用的詞,由於不能直接切分,為了斷詞切分的方便,仍列為一個分詞單位。

另外能夠重疊為AABB的ab也有限制,似乎和詞彙不無關係,因為語義相當的並不一定有平行的重疊形式。

比較「漂漂亮亮」和「?

美美麗麗」。

3.由重疊律產生的重疊形式若只是傳達特定的語法意義,不列為一個分詞單位。

如表示嘗試或暫時貌、逐指等。

4.不能直接切分的重疊形式列為一個分詞單位(如「明明白白」);不連續的重疊分詞(如「試一試」)。

(二)分合實例:

以下按疊字的形式來說明分詞的處理情形:

1.疊字詞最多的是AA式,也就兩個相同的字的重疊。

AA式有三種:

(1).AA或是不能拆的疊音詞,或是重疊表示程度上的加強。

如「青青」「了了」「輕輕」「奶奶」。

合為一個分詞單位。

(2).AA是A的重疊,表示逐指:

這一類的重疊,有普通名詞或量詞的重疊(如「人人」「色色」「一片片」)、時間詞的重疊(如「世世」)、副詞的重疊(如「各各」)等。

其中只有副詞的重疊合為一個分詞單位,因為副詞可以重疊的很有限。

(3)AA是動詞的重疊,表示嘗試或暫時貌。

如「試試」。

分為不同的詞。

這三類AA式性質是很不相同的。

第一種疊音詞事實上和連綿詞性質相類,只不過AA式是否全部都不是A的重疊,尚無定論。

2.AAB:

主要為動詞的重疊。

如「見見面」。

如果其中的AB為動賓複合詞的時候,在分詞上比較不好處理。

如「見見面」的「見面」仍分標為二詞,再加上指示其為複合詞的語法特徵,第一個「見」或許可比照第二個「見」的標示法。

3.ABB:

「赤條條」視如描繪情狀的AA式,合為一個分詞單位;「一次次」比照量詞的重疊,拆開來;「唱看看」的「看看」為嘗試貌的詞,獨自立為一詞。

4.AABB:

AABB如果不是AA和BB的單純並列,而是AB的重疊時,就合選為一個分詞單位。

有時AABB不像是AB的重疊,也不像AA和BB的相加,也合選為為一個分詞單位。

如「戰戰競競」。

當AABB是AB的重疊的時候,通常是表示情狀,都合選為為一個分詞單位。

如「歡歡喜喜」「打打殺殺」。

5.ABAB:

主要是AB式動詞的重疊,表示嘗試或暫時貌。

可以用構詞律產生,因此分為不同的詞。

如「走動走動」分為「走動走動」。

6.A裏AB:

「糊裏糊塗」。

雖主要由AB式狀態動詞衍生,但只限於少數動詞,因此合選為為一個分詞單位。

7.「AXA」式:

因為重疊的語素是不連續的,所以分為不同的詞。

如「試一試」「試他一試」「試一試這個」「數了一數」。

五、派生詞與附屬詞

我們這裏討論的詞頭、詞尾只包括具有衍生性的虛語素。

有時實語素搭配的是詞綴或是附屬詞並不易斷定。

(一)詞頭與前加附屬詞

詞頭如「阿母」的「阿」、「兀那」的「兀」和其所附著的語素合選為一個分詞單位。

「阿」「老」有接在姓名前的,如「阿嬌」「老王」。

也是和其所附著的語素合選為一個分詞單位,列入專名中,但需加上構詞成分的語法特徵。

「自」「相」「可」雖然負擔的語法意義固定,但一般直接在單音節的動詞前,且所搭配的動詞趨於固定,因此原則上與單音節動詞合詞。

至於在雙音節動詞前的「自」「相」「可」就獨立為一詞,歸類為副詞,列入偏正結構中處理。

「自」「相」「可」與單音節動詞搭配的也有不合詞的。

一般原則是:

「自」有反身作用的合詞;表示自主的如果跟的是及物動詞,則視此及物動詞後頭可否加賓語而定,可加賓語的不合詞,如「自主之」的「自」獨自為詞(但如「自主」的「自」是兼表示反身的仍合詞);「自」搭配不及物動詞的皆合詞,如「自然」。

「可」加動詞後如果還跟了賓語的一般要分詞,否則合詞。

如「可愛」「可殺之」。

「相」與單音節動詞的搭配一律合詞。

如「相打」「相罵」「相信」。

「第」雖然只搭配數詞,但數詞是無限的,且「第」在組合上永遠負擔固定的意義,我們可以視為附屬詞,把它獨立分為一詞。

只有在某些意義特定的固定組合上合詞,如佛學語彙「第一義」。

(二)詞尾與後綴附屬詞

詞尾通常和其所附著的語素合選為一個分詞單位。

如「子」「兒」在近代漢語可以確定為詞尾,因此「子」「兒」和其所附著的語素合選為一個分詞單位。

「王氏」「王某」的「氏」「某」和其所附著的語素合選為一個分詞單位,列入專名中,但需加上構詞成分的語法特徵。

動詞詞尾是一般所謂的構詞詞綴,表達特定的語法功能,且可搭配的詞多,因此就獨立分為一詞。

如「了」「著」「過」「看」「看看」「將」。

其中「將」一般放在移動動詞後趨向動詞前。

除了傳統所謂的語氣助詞以外,有些語素可附於詞和詞組之後,我們原則上都歸之附屬詞(語氣助詞也算是附屬詞,只是附著於句子。

另外方位詞也算是後接的附屬詞,而副詞、介詞、連詞也可算是前接的附屬詞,但因都已歸於傳統的詞類,可以不論)。

除了在某些條件下我們把它和其前的語素合併為詞以外,附屬詞通常獨自分為一詞。

大約可

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1