亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于認知屬性庫的原型范疇研究

2016-06-01 11:29:46銀思琪曲維光

中文信息學報 2016年6期

關鍵詞：分類理論

李斌，宋麗，銀思琪，曲維光，王萌

(1. 南京師范大學文學院，江蘇南京 210097；2. 南京師范大學計算機科學與技術學院，江蘇南京 210023；3. 江南大學人文學院，江蘇無錫 214122)

基于認知屬性庫的原型范疇研究

李斌1，宋麗1，銀思琪1，曲維光2，王萌3

(1. 南京師范大學文學院，江蘇南京 210097；2. 南京師范大學計算機科學與技術學院，江蘇南京 210023；3. 江南大學人文學院，江蘇無錫 214122)

原型范疇是認知科學研究中的重要理論，使用屬性來區(qū)分范疇中心成員及邊緣成員有著較強的解釋力，但該理論一直缺乏基于頻率信息的屬性數據支撐。該文借助認知屬性庫的23萬條數據，對原型理論研究中經常討論的“鳥”、“水果”、“交通工具”等范疇的典型成員和非典型成員進行分析驗證。認知屬性庫的數據顯示，在漢語中，“鳥”的典型成員是“麻雀”、“燕子”等，和“鳥”具有較多的共同屬性；而“企鵝”、“鴕鳥”則只共享了“鳥”很少的屬性，且缺少關鍵的屬性“飛”。大體上驗證了原型理論的觀點。同時，我們也發(fā)現“小鳥”的屬性特別豐富，具有典型成員的特性。在進一步觀察了“水果”和“交通工具”兩個范疇后，我們探討了范疇的跨類現象，進而從數學模型上區(qū)分了樹結構的層次分類體系和圖結構的范疇化體系。

認知屬性；原型范疇；語義分類；語義計算

1 引言

原型(Prototype)范疇理論是認知科學的重要理論，是對古希臘的亞里士多德以充分和必要特征為分類依據的范疇論[1]的揚棄，是吸收家族相似性理論[2]，以行為實驗為依據而形成的，在認知語言學研究中占有重要地位。在亞里士多德那里，從對萬事萬物分類的角度出發(fā)，主要關心分類的標準，并不區(qū)分同一范疇里面成員的典型性和重要性[1]。20世紀上半葉，維特根斯坦[2]的家族相似性(Family Resemblance)理論則從詞語如何判斷為某個范疇的分類依據出發(fā)，認為范疇不是因為共同特性而是因為成員之間重疊交叉的相似性結合在一起的，范疇中的成員因其與原型的相似性而被認為是范疇的成員。而現代的認知科學則進一步從人類認知能力的角度考慮，認為范疇內的成員有典型性的問題。Rosch[3]使用水果、家具、交通工具、武器、蔬菜和衣服六類共120個常用詞語，對400名大學生進行行為測試，以證明范疇中最典型的成員具有本范疇成員中最多的共同特征，而與其他范疇的成員具有最少的共同特征。

Rosch[4]進一步研究了基本層次范疇(Basic Level Category)問題，認為：基本層次范疇擁有同一個范疇內的大量公共屬性，它在范疇化的過程中最為重要，在兒童語言習得的過程中最早被范疇化和命名。她用行為實驗的方法，對200位美國大學生進行測試，對英文中的“bird(鳥)”等九個范疇的典型詞語進行判定。如“鳥”范疇下的“老鷹”、“麻雀”等，通過觀察下位詞語“禿鷹”、“歌雀”的典型性，進而區(qū)分出上位范疇、基本層次范疇和下位范疇(見表1)。

表1 Rosch對基本層次范疇的實驗材料樣例

Rosch[4]做了一系列相關實驗，包括各種類型的詞語和視覺實驗，結果發(fā)現：在范疇化過程中，范疇內的典型成員在共有屬性方面有優(yōu)勢，有些典型成員的重要性甚至超過了上位范疇。從而將典型成員劃為基本層次范疇。

總結起來，原型范疇理論有四個要點： (1)同一個范疇內的成員存在梯度差異，有一些成員是典型的原型(prototypical，譯作原典型)成員，其他成員依靠和原典型成員的相似性得以進入該范疇；(2)特征也是具有梯度的，有的特征是重要的，有的是不重要的；(3)同一范疇內的所有成員并不一定存在共同特征，而是呈家族相似性逐步擴散，范疇的邊界也并不明顯；(4)在上位范疇、基本層次范疇和下位范疇中，最重要的范疇是基本層次范疇。

盡管Taylor[5]發(fā)展和完善了原型范疇理論，但該理論仍然存在三個基本問題： (1)屬性特征的選取存在主觀性和隨意性[6]。該理論使用的行為實驗在準確度、可靠性上來說，是經得起驗證的，但是在測試用詞的覆蓋面上顯然存在數量上的局限。而在使用特征進行論證的時候，特征的數量很少，往往只是舉例性質。行為實驗關注的是驗證典型性的問題，特征并不是研究的重點。如果能夠將這些特征較為客觀地羅列出來，則可以更好地驗證原型范疇理論；(2)到底存在多少基本層次范疇，是不是在所有的分類層級上都存在基本層次范疇,并不清楚。按照這個理論，“蘋果”是“水果”基本層次范疇中的原典型成員，那么“蘋果”有沒有自己的典型成員，“水果”是否是其上位范疇的“植物”或“瓜果”的典型成員，“植物”是否是“生物”的典型成員，這些問題都值得討論；(3)范疇化是自然認知分類而不是有意識的科學分類。亞里士多德是科學分類的代表，層層劃分，每層有明確的分類標準。而自然分類的范疇化過程，是把相似的事物按照家族相似性逐步地歸并在一起。這兩種分類到底會引出哪些問題，應該在哪些場景下使用哪種分類方法都是值得探討的問題。

因此，如果能為原型范疇理論提供較為客觀的數據支持，在特征的數量和典型度上予以量化，則可以更好地發(fā)現這個理論存在的問題。過去特別缺乏大規(guī)模的特征屬性數據庫，而近年來李斌等[7]、Li等[8]構建的漢語認知屬性庫正提供了這樣的量化數據。該工作將傳統(tǒng)研究中的聯想意義和文化意義在認知語言學的視角下重新定義為日常感知知識之下的認知屬性，從互聯網上獲取了數百萬條漢語“像+喻體詞語+一樣+喻底屬性”的原始數據，人工校對后形成了23萬余條帶有頻率信息的“詞語—屬性”對，如“豬”的“懶”、“笨”、“肥”，“鳥”的“飛”、“自由”等。該庫共覆蓋了82 937個詞語和100 271個屬性，其中具有五種以上屬性的詞語達到6 745個。這個數據恰好可以用于驗證詞語的屬性以及范疇化問題。認知屬性提供了詞語概念所具有的屬性，而頻率信息則可以模擬這些屬性的重要程度。

我們使用認知屬性庫校對后的23萬條數據及其配套的可視化查詢系統(tǒng)*http://www.cognitivebase.com/，來分析“鳥”、“水果”、“交通工具”這三個前人研究和討論較多且范疇差別較大的語義類別。探討測試詞語的認知屬性這種來自于互聯網的數據能不能用于驗證原型理論，能不能更好地討論原型范疇理論的三個問題。使用認知屬性庫的缺陷是沒有聲音和圖像的表示，例如，“鳥”的輪廓信息，難以用文字表達，卻在范疇化過程中扮演重要角色。不過，限于全方位的特征屬性數據庫尚未出現，本文只嘗試用文字表達的認知屬性來測試原型范疇理論。

2 原典型成員的驗證

要驗證“水果”、“鳥”、“交通工具”三個類別的原典型成員，首先需要像Rosch[3-4]一樣，列出十個左右的常見下位詞和干擾詞，通過上位詞和下位詞認知屬性的匹配程度來確定原典型成員。匹配的屬性數量越多、頻次越高，則認為典型性越高，反之則越低。進而再觀察成員之間的屬性匹配程度，以驗證家族相似性。

2.1 水果

水果的品種很多，我們選取了十種常見水果，包括“香蕉”、“蘋果”、“梨”、“西瓜”、“桔子(橘子)”、“芒果”、“橙子”、“桃子”、“草莓”和“葡萄”。希望通過認知屬性庫來觀察人們平時常見的“水果”到底有哪些是典型成員，是“蘋果”的典型性更高，還是“葡萄”更高。另外，人們對“黃瓜”、“西紅柿”到底算不算水果的爭議一直存在，我們將其作為干擾詞一并分析。

表2給出了這些詞語和“水果”一詞的屬性共享情況?！八币辉~有59種屬性；“蘋果”有113種屬性，其中12種和“水果”共有；“葡萄”有78種屬性，其中七種與“水果”重合。

表2 水果詞語的屬性

表2中，按照和“水果”相同的屬性數量多少計算，水果的典型成員依次為“蘋果、葡萄、草莓、西瓜、桃子、梨、橙子、芒果、桔子、香蕉”，這與前人的研究和普通人的直覺基本相似。雖然“西紅柿、黃瓜、番茄”被排除在外，但它們與“水果”沒有共同屬性，則與直覺有些沖突。其實，在“西紅柿”的十個屬性中，有一個是“甜淡可口(頻次2)”，也近似地擁有“甜”的屬性。而“黃瓜”則沒有“甜”的屬性。如果我們進一步利用認知屬性庫的可視化查詢的功能，將這些詞的屬性同時呈現出來(圖1)，則可以看出一定的家族相似性?！拔骷t柿”與“蘋果”、“桃子”共有“圓”的屬性，與“蘋果”、“草莓”共有“紅”的屬性?！包S瓜”

與“葡萄”共有“綠色”的屬性，與“蘋果”、“梨”共有“脆”的屬性。這大致上可以驗證原型理論的成員梯度差異說?！跋憬丁彪m然是水果，然而屬性統(tǒng)計卻顯示它屬于最不典型的水果。從圖1可以看出，其實“香蕉”和“蘋果”、“桔子”、“梨”都有一些共同屬性，可以印證家族相似性理論。

圖1 水果詞的屬性圖注：深色結點表示概念詞語，淺色結點表示屬性詞語，連線的粗細代表“概念”和“屬性”之間的強度(同現頻率越高則線條越粗)，而線條的長短不表示任何意義。

再從屬性上看，“甜”為我們所觀察的水果類詞語共有(在“橘子”和“桔子”合并的前提下)，而“黃瓜”沒有，“甜”似乎具備了劃分類別的能力。但是，(1)“甜”這個屬性并不是“水果”頻次最高的屬性，也不是水果類詞語頻次最高的屬性；(2)“甜”也不是人們對于水果劃類的最主要依據，因為“糖果”等食品也很甜。利用認知屬性的屬性擴展查詢功能，自動生成一個詞圖，包含“水果”、水果的屬性以及具備這些屬性的詞(圖2)。圖上可以看出“水果”和“蛋糕”、“糖果”確實擁有不少共同屬性，以至于位置非常接近?！懊利悺薄ⅰ翱蓯邸?、“飽滿”為多種水果的共同屬性。但是這幾個屬性并沒有被“香蕉”、“西紅柿”所共享。所以，原型理論認為的劃類特征不一定存在的說法仍然是成立的。

值得注意的是： (1)每個詞語還有著大量的屬性沒有和其他水果詞共享；(2)“蘋果”的電子產品意義下的諸多屬性都沒有和其他水果詞共享，在很大程度上也有了詞義消歧的作用。

從圖2上看，“水果”和“紅蘋果”、“蘋果”、“草莓”最為接近?！八焙推渌悇e的“蛋糕”、“甜點”、“果凍”等甜食接近，與“陽光”、“雨”、“空氣”、“向日葵”也很接近。這說明，我們在調查原典型的時候，其實已經限定了相似詞語的語義類別，把不是水果的詞排除在外。可是，如果從口感和視覺上考慮，“水果”和“果凍”確實有很多相似之處。因此，我們認為，典型成員含有較多的共同屬性，但是與其他類別的詞語也可能具有很多共同特征。認知上相似的事物，按科學分類法則會列入不同的類別。

2.2 鳥

下面我們再對鳥類詞語加以分析。和水果詞相似，我們預期的有： (1)哪些鳥是典型的鳥，它們有哪些典型特征；(2)“企鵝”和“鴕鳥”是否具備“鳥”的典型特征，是否也呈現出家族相似性。

圖2 “水果”的屬性二級擴展圖

我們考察的詞語有八種比較典型的鳥： “麻雀”、“老鷹”、“燕子”、“鴿子”、“烏鴉”、“喜鵲”、“鴨子”、“天鵝”，它們作為鳥類的原型范疇。同時以“企鵝”、“鴕鳥”兩種不太典型的鳥作為干擾詞。

表3 鳥類詞語的屬性

根據表3的統(tǒng)計，和“鳥”共有屬性最多的是“老鷹”和“燕子”,都有15個共有屬性。其他依次為“鴿子”、“麻雀”、“鴨子”、“天鵝”、“烏鴉”、“喜鵲”?！捌簌Z”、“鴕鳥”這兩種鳥與“鳥”的共同屬性非常少。這與人們的直覺基本相似，不同的鳥的典型性可以根據屬性的多少和頻次形成梯度關系。

除了“企鵝”和“鴕鳥”，其他八種鳥都具有“飛”這個屬性。與水果的“甜”不同，“飛”幾乎位居各種鳥的屬性的前三位，是特別重要的屬性?？墒恰膀稹薄ⅰ昂?、“蜻蜓”、“飛機”也會飛，“飛”也很難作為劃類的單獨依據。我們把這些詞按照屬性生成詞圖(圖3)，同樣可以看出，“飛”這一屬性為各種鳥所共有，唯有“企鵝”和“鴕鳥”不具備?！傍B”和“老鷹、烏鴉、燕子、麻雀、鴿子”都具有相當多的共同屬性，呈現出家族相似性?！捌簌Z”和“鴨子”具有十種相同的屬性,“搖擺”、“呆”、“笨拙”等等；和“鵝”有四種共同的屬性: “笨”、“游”、“快樂”、“點頭”；和“天鵝”共有屬性“優(yōu)美”，和“麻雀”共有屬性“蹦蹦跳跳”?！傍r鳥”和“鴨子”、“燕子”共有屬性“跑”。

圖3 “鳥”類詞語的屬性圖

值得注意的是，“企鵝”和“天鵝”同有“鵝”字，屬性方面的差異卻很大，它們只有一個共同屬性“優(yōu)美”。這與認知語言學的理論判斷基本一致，也與行為實驗的結果基本一致，即下位范疇概念的屬性差異可能是較大的。認知屬性庫，實際上也可以看作是一種語言行為實驗的材料，是人們在網絡上的語言表達所凸顯出來的屬性。

如果從屬性二級擴展圖上觀察(圖4)，則與我們預想的差別較大。和“鳥”最相近的詞有“小鳥”、“水鳥”、“鳥兒”、“候鳥”、“大雁”，這些詞居然都沒在我們之前考察的鳥類詞語之列，這說明范疇化研究在缺少數據支撐的條件下，純粹依靠內省法選擇實驗材料，可能會存在一定的缺陷。只根據語義類別來選擇詞語，可能會遺漏屬性高度相關的詞語。另一方面，“貓”、“魚”、“天使”、“箭”、“蚊子”也呈現出和“鳥”的相似性，但這些相同的屬性并不能從家族相似性那里得到解釋，而應看作普通的屬性相同。離開語義分類條件下的語義類家族，就不是家族相似性，而只是普通概念之間的相似性了。

“小鳥、大鳥、候鳥、蜂鳥、水鳥、飛鳥、百靈鳥”也具有大量的屬性?！按篪B”和“小鳥”，用原型理論有點難解釋?！傍B”前面加了定語，它們應該屬于下位范疇，可它們具有的屬性數量較多，特別是“小鳥”的屬性數量為226個，甚至超過了“鳥”的200個。“小鳥”的屬性數量和強度已經具備了基本層次范疇的能力。該如何對此進行解釋就成了一個問題。

2.3 交通工具

帶著上面的問題，我們接著來看交通工具類詞語。這里同樣選擇了12種交通工具“車”、“船”、“汽車”、“貨車”、“公交車”、“自行車”、“火車”、“地鐵”、“馬車”、“摩托車”、“飛機”、“輪船”。作為上位范疇的“交通工具”，只有“方便”和“擠”兩個屬性，屬性數量之少有點出乎意料，所以很難像前兩節(jié)那樣用表格展示，只能直接分析這些交通工具詞語的詞圖(見圖5)。

從圖5可以看到： (1)認知屬性的數量不均衡。“車”、“飛機”、“汽車”、“火車”、“地鐵”、“公交車”、“船”、“自行車”的認知屬性都較為豐富。而“馬車”、“摩托車”相對較少；(2)沒有一個屬性是全部詞所共有的。覆蓋度比較高的屬性是“快”、“跑”、“行駛”。交通工具的速度不同，所以“快”沒能覆蓋所有的交通工具。交通工具內部差異巨大，而海上、陸上、空中的區(qū)別，也使得駕駛和行進的方式不同。所以，交通工具之間有一些共同屬性，但不是全體所共有的屬性，呈現出一定的家族相似性；(3)相比水果和鳥類詞語，成員之間的屬性共享程度并不高，大多數詞語的屬性都是獨享的。

圖4 “鳥”的屬性二級擴展圖

圖5 交通工具類詞語的屬性圖

上述三個語義類的詞語，基本上驗證了原型理論、家族相似性的基本要點。不過，仍然遺留了一些問題： (1)為什么“交通工具”的認知屬性如此少？(2)“小鳥”和“鳥”到底是什么關系？(3)“小鳥”是否可以進入基本層次范疇？我們在下一節(jié)集中討論。

3 基本層次范疇與層次分類體系的討論

3.1 分類體系的討論

“交通工具”作為上位范疇的認知屬性少，讓我們對于基本層次范疇有了新的認識。基本層次范疇的原意是相對于上位范疇來說的，人們對一個上位范疇的認知，實際上是通過基本層次范疇中典型的原型成員來完成的。然而，“交通工具”是否屬于其上位范疇的基本層次范疇？我們遇到的“水果”、“鳥”的認知屬性眾多，是否也屬于基本層次范疇？交通工具的上位范疇一般來說是“人造物”，而詞語“人造物”或“人工物”卻只有0個屬性。是不是越抽象、越上層的詞語，其認知屬性也越少？

帶著這些問題，我們重新審視這三個類別的詞語?！八钡纳衔环懂牎爸参铩庇?48個屬性，“鳥”的上位范疇“動物”有116個屬性，“動物”的上位范疇“生物”有46個屬性，屬性的種類依然較多。所以，并非越上層、越抽象的詞語的屬性就越少。那么，問題出在哪里呢？我們當然可以說，上位范疇本身不一定需要有很多屬性?？墒?，如果不需要很多屬性，那么如何判斷其與基本層次范疇之間的關系呢？

如果換一個思路來看，原型范疇所采用的層級型(樹形結構)的分類體系也許是個牢籠?！敖煌üぞ摺彼坪跤袀€“人造物”的上位范疇，“馬、牛、驢”也曾是農業(yè)社會的重要交通工具，也可以納入交通工具的范疇，可它們的上位范疇更應該是“動物”。所以，人們的分類體系本身可能是交錯的，而不完全是層級的。再以水果詞語來說，水果里面的“草莓”和“蘋果”，其實差異很大，其宿主一個是草本植物，一個是木本植物。而且，人們只是稱呼這些植物的果實為水果，而不是植物本身。所以“交通工具”和“水果”都是比較交叉的分類或范疇。層層分類的體系，也許并不是人們自然的分類方式，而是至少在亞里士多德那里就開始的二值邏輯的硬性層次分類。相反，人們的自然認知模式可能只是從某一個角度對事物進行范疇化，不是層層分類，而是歸類，把事物歸為一類或幾類。范疇化的歸類過程并不一定具有強烈的排他性，不那么涇渭分明。在很多情況下，范疇化可能只歸為一類，即把具有某些相同屬性或功能的對象統(tǒng)一命名而已。所以，如果按照層次分類方法，“馬”既屬于動物范疇，又屬于交通工具范疇?？墒?，如果拋棄層次分類方法，眾多范疇自然歸類的組織方式更值得探討。

層次分類方法的本質是建立分類標準，利用二值邏輯建立分類樹。而范疇化則是不斷從新的角度建立新類，新類與原有的類別可能界限分明，也可能有交叉。從離散數學建模的角度看，范疇化形成的自然歸類體系，不再適宜采用樹(tree)形結構，而應使用圖(graph)結構來表示。在圖結構上，范疇和范疇之間可以有關系，同一個范疇內部也可以劃分層次，范疇內的成員也可以和其他范疇及成員通過屬性發(fā)生關系。屬性可以有很多種，關系也可以有很多種。這種討論看起來并不新鮮，現在流行的語義網(semantic web)和語義網絡(semantic network)[9]都是基于三元組<概念1，概念2，關系>構成的圖結構。我們并不想否認層次分類方法的作用；相反，基于樹結構的層次分類由于結構性好，使用范圍很廣。我們想強調的是，人們自然的范疇化并不是樹形的分類體系。正是因為人們自然形成的范疇體系不是樹形結構，才需要做好層層分類的樹形分類體系，這種體系從亞里士多德一直做到今天。從這個意義上來說，認知屬性庫中詞和屬性所構成的圖，正體現了人們自然形成的范疇化體系。詞和詞之間通過屬性進行關聯，形成多樣的關系。認知屬性庫做不到的是確定詞語的上下位關系。

從這個角度回過頭來討論原型理論，也許更為清楚。人們在創(chuàng)立某一范疇的時候，根據典型成員來歸納范疇；人們在習得范疇的時候，也是通過典型成員的共同屬性來習得；在使用范疇的時候，則依據典型成員的共同屬性。某一新事物能否進入某范疇，就看能不能和典型成員具備一定的共同屬性。共同屬性多或具備了關鍵屬性，則接近典型成員；共同屬性少且強度低，則成為邊緣成員，形成梯度的成員集合。只要拋掉層層劃分的等級分類體系，原型范疇理論就會更加自然，不存在分類交叉的矛盾。

3.2 帶權二部圖

進一步來說，與語義網的三元組不同，認知屬性所構成的圖，可以抽象為一個帶權的二部圖。

圖6 二部圖示例

二部圖(Bipartite Graph)的一般定義是，設G=(V,E)是一個無向圖。如頂點集V可分割為兩個互不相交的子集V1、V2，并且圖中每條邊依附的兩個頂點都分別屬于這兩個不同的子集，則稱圖G為二部圖。如果每條邊上帶有權重，則稱為帶權二部圖[10]。

由帶權二部圖的定義可知，認知屬性庫的結構與語義網絡的普通圖之間確實有區(qū)別。認知屬性庫正好分為詞語和屬性兩類，“詞語-屬性”有頻次信息，可以作為權重，所以是典型的帶權二部圖。在這個圖上可以做三種基本操作： (1)給定一個詞，可以尋找其屬性；給定一個屬性，也可以尋找具有該屬性的詞；(2)給定一批詞，則可以找到它們的屬性的并集或交集；給定一批屬性，也可以找到具有這些屬性的詞語的并集或交集；(3)給定兩個不同的詞，可以依據各自的屬性集合判定它們的相似程度；給定兩個不同的屬性，也可以依據具有一種屬性的詞語集合判定這兩種屬性的相似程度。

所以，原型范疇理論的相關實驗可以看作第三種操作。即給定兩個詞，判定其相似程度。但是原型范疇理論并不僅止于此，而是附加了層次分類的樹形結構。在詞語集合V1中約定了詞語的樹形層次關系，如“交通工具”的下位詞有“汽車”，“汽車”的下位詞有“小轎車”等各種汽車。然后每個詞語再根據屬性進行原典型的判定。我們把這種附加了樹形結構的二部圖呈現為圖7。詞語集合的樹形層次關系，并不是完整的分類體系，而是只有三層： “上位范疇—基本層次范疇—下位范疇”。

圖7 原型范疇的附加樹形結構的二部圖

由此可以更清楚地看到，Rosch[3-4]的原型范疇理論雖然拋開了完整的樹形分類體系，卻依然使用了樹形層次結構。這三層樹結構，也許可以反過來解釋為何很難取得一致公認的完整的樹形分類體系。每個范疇建立的角度不同，建立后就會形成三層樹結構，而全部或很多的范疇放在一起要建立層次的時候，這些范疇的三層樹就會出現大量的成員交叉現象。

4 結論與未來工作

本文就認知科學和認知語言學中的原型理論進行了考察，使用認知屬性庫的數據，對“水果”、“鳥”、“交通工具”三個類別的詞語進行典型性分析。根據屬性的種類和頻率信息，基本驗證了原型范疇理論。然而，我們也發(fā)現“小鳥”這樣認知屬性豐富的詞語，它也具有典型成員的特性；而“水果”和“交通工具”中存在范疇的跨類現象，進而從數學模型上區(qū)分了樹結構的層次分類體系和圖結構的范疇化體系，利用二部圖探討了認知屬性庫和原型理論的模型差異。最后總結了認知屬性庫對于原型理論和心理學研究的價值。

我們得到的主要結論是： (1)認知屬性庫可以用于驗證原型理論關于原典型成員的界定；(2)原型范疇理論可以用帶樹結構的二部圖來描述；(3)原型理論可以解釋為何構建完整的層次分類體系是困難的。依然存在的問題是： (1)在原型理論中，“小鳥”這樣的詞語該如何定位；(2)如何構建更好的結構來描寫詞語關系。

在未來的工作中，我們將繼續(xù)關注詞義組織方式的研究進展，繼續(xù)構建符合人類認知特點且便于計算的詞義知識庫。在認知科學和語言計算的雙重視野下，進一步研究詞義理論存在的問題，以提出更符合行為實驗和語言材料的數學模型。

[1] 亞里士多德著. 方書春譯. 范疇篇[M]. 北京：商務印書館, 1959.

[2] 維特根斯坦著. 李步樓譯. 哲學研究[M]. 北京：商務印書館, 2000.

[3] Rosch E, Mervis C B. Family Resemblances: Studies in the Internal Structure of Categories[J]. Cognitive Psychology. 1975, 7： 573-605.

[4] Rosch E, Mervis C B, Gray W, et al. Basic Objects in Natural Categories[J]. Cognitive Psychology. 1976, 8(3)： 382-439.

[5] Taylor J. Linguistic Categorization： Prototypes in Linguistic Theory[M], Oxford: Clarendon Press, 1989.

[6] 汪桂英. 原型范疇理論缺陷再議[J]. 廈門大學學報(哲學社會科學版), 2011(6)：42-48.

[7] 李斌, 陳家駿, 陳小荷. 基于互聯網的漢語認知屬性獲取及分析[J]. 語言文字應用, 2012(3)： 134-143.

[8] Li Bin,Bai Xiaopeng, Yin Siqi, et al. Chinese CogBank: Where to See the Cognitive Features of Chinese Words[C]//Proceedings of the Third Workshop on Metaphor in NLP, Denver, Colorado, 2015: 77-86.

[9] Berners-Lee T，Hendler J, Lassila O. The Semantic Web[J]. Scientific American. 2001： 34-43.

[10] Reinhard Diestel 著. 于青林, 王濤, 王光輝譯. 圖論(第4版)[M]. 北京：高等教育出版社, 2013.

A Prototype Theory Study Using Cognitive Property Bank

LI Bin1, SONG Li1, YIN Siqi1, QU Weiguang2, WANG Meng3

(1. School of Chinese Language and Literature, Nanjing Normal University, Nanjing, Jiangsu 210097, China;2. School of Computer Science and Technology, Nanjing Normal University, Nanjing, Jiangsu 210023, China;3. School of Humanity, Jiangnan University, Wuxi, Jiangsu 214122, China)

As an important theory in cognitive science, the prototype theory is plausible to use properties to distinguish the central and periphery members in a category. However, there’s no quantitative evidence to support the theory. In this paper, we apply the cognitive property bank including 230,000 “word-property” pairs to validate the theory via 3 categories:bird,fruitandtransportation. The results show that in Chinese, the typical members of bird aresparrowandswallow, which share many properties withbird. While thepenguinandostrichshare very few properties withbird, especially lacking the key propertyfly. The data in cognitive property bank basically supports the idea of the prototype theory, but we also notice that thelittlebirdhas many properties, which make it available for a typical member in the category. We also distinguish between the tree based ontology and graph based categorization by bipartite graph.

cognitive property; prototype theory; semantic categorization; semantic computation

李斌(1981—),博士,副教授,主要研究領域為計算語言學。E-mail:libin.njnu@gmail.com宋麗(1993—),碩士研究生,主要研究領域為計算語言學。E-mail:songli1105@sina.com銀思琪(1990—),碩士,主要研究領域為計算語言學。E-mail:nnuyinsiqi@126.com

1003-0077(2016)06-0090-10

2016-09-27 定稿日期： 2016-10-15

教育部青年基金(16YJC740034)；山東省語言資源開發(fā)與應用重點實驗室開放課題；江蘇高校哲學社會科學研究項目(2016SJB740004)；國家自然科學基金(61272221，61300152)；國家科技支撐計劃課題(2014BAK04B02)

TP391