摘 要:針對人工智能模擬和還原特定人物的場景,文章從認(rèn)識論和知識論的角度分析特定人物的個人知識構(gòu)成。文章首先對人工智能視域下的知識進(jìn)行界定,然后以南朝梁的人物蕭繹作為研究標(biāo)本,研究發(fā)現(xiàn),其所具有知識的底層是人類共有的具身性知識,中層是歷史性模因知識、歷史性樸素理論知識,表層是個人習(xí)得知識與個人經(jīng)驗知識,另外還有歷史性社會事理知識和個性事理知識作為連接事件與經(jīng)驗的推理知識。知識構(gòu)成分析能夠起到知識校正與錨定的作用,同時通過知識構(gòu)建和邏輯推斷才可能突破現(xiàn)有知識與有記錄知識的局限。
關(guān)鍵詞:人工智能;認(rèn)識論;知識論;知識構(gòu)成;真人圖書館
中圖分類號:G250.7 文獻(xiàn)標(biāo)識碼:A
Analysis of the Knowledge Composition of Digitized Specific Individuals from the Perspective of Artificial Intelligence
Abstract This article analyzes the personal knowledge composition of specific individuals simulated and reconstructed by artificial intelligence, from the perspectives of epistemology and theory of knowledge. It first defines knowledge within the context of artificial intelligence and then uses Xiao Yi, a figure from the Liang dynasty of the Southern Dynasties, as a research sample. The study finds that the foundational layer of his knowledge comprises embodied knowledge shared by all humans. The middle layer consists of historical meme knowledge and historical naive theoretical knowledge, while the surface layer includes personal acquired knowledge and personal experiential knowledge. Additionally, there are historical social reasoning knowledge and individual reasoning knowledge, which serve as inferential knowledge linking events and experiences. Analyzing the knowledge composition can aid in knowledge correction and anchoring, and it is possible to overcome the limitations of existing and documented knowledge through knowledge construction and logical inference.
Key words artificial intelligence; epistemology; theory of knowledge; knowledge composition; human library
1 引言
真人圖書館是圖書館界的一項創(chuàng)舉,即是讀者將一個現(xiàn)實中的真人當(dāng)做一本書來閱讀,通過與真人的對話交流來獲取他人的知識與經(jīng)驗。真人圖書館源自歐洲,2009年由上海交通大學(xué)圖書館在國內(nèi)首次開展,隨后許多圖書館都舉辦了類似活動。真人圖書館使讀者能夠與閱讀對象實時雙向互動,彌補讀者在傳統(tǒng)閱讀中難以獲取個人經(jīng)驗知識的不足,因此廣受讀者喜愛,但是真人圖書館也存在真人圖書數(shù)量少、參與讀者數(shù)量受限、活動頻率不高、服務(wù)效果不理想、難以持續(xù)開展的問題[1]。這些不足都與真人管理難以規(guī)范化有關(guān),而發(fā)展機器智能來模擬真人,采用多輪問答系統(tǒng)或者閑聊機器人的形式,利用人工智能技術(shù)賦能真人圖書館,是解決這一困境的方法之一。針對數(shù)字化模擬和還原特定人物的場景,本文從認(rèn)識論和知識論的角度來分析探討特定人物的個人知識構(gòu)成。
2 人工智能視域下知識的界定
以往我們分析一個人物的知識構(gòu)成,主要指他的習(xí)得知識、專業(yè)技能、個人著述與個人經(jīng)歷知識,此時我們已經(jīng)預(yù)設(shè)他是一個完備的人,具有人類所應(yīng)有的心智能力。但是如果需要通過機器智能去模擬真人,從類似裸機的角度考慮,這些知識就遠(yuǎn)遠(yuǎn)不是人物所擁有的全部知識,而需要重新從根本上思考知識的意義。
古希臘柏拉圖定義知識是得到證成的真信念(Justified true belief),這個理論受到美國哲學(xué)家蓋蒂爾的質(zhì)疑,由此衍生出了現(xiàn)代“知識論”。人們在實踐活動中獲得客觀世界的信息,這些信息組合在一起形成一種信息結(jié)構(gòu),現(xiàn)在一般將這種信息結(jié)構(gòu)稱作知識,知識來源于人類對客觀世界的認(rèn)識與經(jīng)驗,它的基本單元是概念[2]。概念是人類特有的知識單元,是大腦在認(rèn)知進(jìn)化中的一個最優(yōu)選。人類大腦的功率大概在16.58W,是一個低能耗的處理器,為了盡量減少能量開銷,就必須減少信息處理量,將感官輸入的無數(shù)細(xì)節(jié)信息采用抽取概念的方式進(jìn)行簡化。以一個普通監(jiān)控攝像機來比較電腦與人腦,普通攝像機能夠在可見光范圍內(nèi)、在人類視覺尺度上窮盡所設(shè)定分辨率的全部圖像細(xì)節(jié),還能夠?qū)δ骋粫r段的海量細(xì)節(jié)進(jìn)行窮盡式的記憶,等需要回憶的時候可以逐幀回放;人腦如果要觀察或記憶某一時段的圖像,必須先從視覺經(jīng)驗中提取概念結(jié)構(gòu)[3],識別人物性別、衣服顏色、行為特征等,焦點也僅限于關(guān)注到的范圍,這樣相當(dāng)于對圖像信息進(jìn)行了壓縮,日后需要回憶的時候才能用概念作出目擊證詞。多個概念結(jié)合在一起,外化成一個模擬外部事件的信息結(jié)構(gòu),或者稱為模型。這個模型可以是數(shù)學(xué)模型、自然語言模型甚至是用火烤出裂紋的牛肩胛骨。模型是思考的工具,人類用它來描述和預(yù)測一次狩獵、一次戰(zhàn)爭或者行星運動軌跡。模型化或者形式化是知識的表示方法,自然語言中知識總是以命題的方式陳述出來。知識并非總是完全正確的,歷史上認(rèn)為萬世不易的知識也經(jīng)常會被顛覆,羅素甚至認(rèn)為“全部人類知識都是不確定、不精確和不全面的”[4]606。波普爾也認(rèn)為“科學(xué)知識是真正的猜測,它不可以證實為真,只可以檢驗”[5]。因為知識只是我們對外部世界的一個簡化認(rèn)知,是進(jìn)化歷程中的一個方便法門,但是這種認(rèn)知結(jié)構(gòu)中的模糊性、適應(yīng)性、用有限來包涵無限的功能,已經(jīng)遠(yuǎn)遠(yuǎn)超越了機器智能。
大腦是進(jìn)化的產(chǎn)物,知識也是進(jìn)化的產(chǎn)物,因此個體間存在大量相同的知識,而只有少量通過學(xué)習(xí)、訓(xùn)練、經(jīng)歷獲得的知識有所不同,那些大量相同的知識一般都默認(rèn)作為我們的背景知識而存在,卻一直被忽視,這是我們首先要探究的知識。除此之外,還有兩類知識,即陳述性知識和解釋性知識,也就是羅素所說的知識一般分為兩類:第一類是關(guān)于事實的知識;第二類是關(guān)于事實之間的一般關(guān)聯(lián)的知識[4]502。從形式上來說,人工智能構(gòu)建的特定人物知識必須能符號化,符號包括口語、文字、圖畫、音符、代碼等面向抽象概念的編碼解碼工具,還有用詞向量表達(dá)的自然語言知識、用矩陣表達(dá)的圖畫像素知識等二次編碼的信息。這些知識也就是波蘭尼所說的顯性知識,不可用符號表示或者尚未用符號表示的內(nèi)容為意識存在,不包含在人與機器交流的知識范圍內(nèi),除非它可以被轉(zhuǎn)換為符號表征方式。
3 數(shù)字化特定人物的知識構(gòu)成
分析數(shù)字化特定人物的知識構(gòu)成,無論是現(xiàn)代人物還是古代人物,都必須依靠歷史記錄。但是在歷史長河中,特定人物能夠被文獻(xiàn)記錄是偶然的,被遺忘遺失卻是必然的;而且即使有記錄,和他們實際所具有的知識相比較,已表述知識只占少數(shù),未表述知識卻占了絕大多數(shù)。因此需要用符合時代特征的共性知識進(jìn)行知識補全。
為了使人物和他具有的知識與當(dāng)今的現(xiàn)實世界產(chǎn)生疏離感,方便我們從一定距離上進(jìn)行觀察,我們選擇一個距今約1 500年,生活在南朝梁的人物蕭繹作為研究標(biāo)本。蕭繹字世誠,小字七符,為梁武帝蕭衍的第七子。他是一個當(dāng)時典型的知識制造與記錄者,有留存于世的個人著述和閱讀記錄,主要包含在《金樓子》一書中;同時他又具有非典型的人生經(jīng)歷,他死后被稱作梁世祖孝元皇帝,在《梁書》《南史》《資治通鑒》等古籍中都留下了歷史記錄。
3.1 具身性知識
具身性(embodiment)的概念源于胡塞爾、海德格爾、梅洛·龐蒂等人的現(xiàn)象學(xué),他們質(zhì)疑笛卡爾式的身心二元論,認(rèn)為人類的認(rèn)知并不是孤立于身體之外的精神實體的產(chǎn)物,身體是我們認(rèn)識世界的總媒介,人類的一切認(rèn)知都是由身體與環(huán)境的交互所塑造出來的[6]。以機器智能模擬的特定人物,人物本身為第一人稱,具身是指人物之身,不是機器之身,因此我們將與人物身體直接或間接相關(guān)的具身認(rèn)知所生成的命題稱作具身性知識。具身性知識的本質(zhì)是先驗知識,即不依賴經(jīng)驗而發(fā)生并使經(jīng)驗成為可能的先天認(rèn)知,其先于經(jīng)驗存在并作為經(jīng)驗知識的認(rèn)知條件[7]。具身性知識在人物的知識構(gòu)成總量中占有絕對主導(dǎo)性的比例,它是人類的共有知識,個體間差異極小。通俗的比喻就是:人類生來不是一張白紙,而是自帶操作系統(tǒng)的。
我們可以將具身性知識分為兩類:其一,是內(nèi)省的、以身體為感知器的具身性知識。我們最初對世界的知識源于感知,通過眼耳鼻舌身意(視覺、聽覺、嗅覺、味覺、觸覺、直覺)來觀察或測量客觀世界。以視覺中的注意力機制為例,我們的視覺系統(tǒng)會本能地過濾掉無關(guān)宏旨的事物,而將注意力集中在有關(guān)自身利益的事物當(dāng)中。比如我們隨意看到一個場景,往往不會留意里面靜態(tài)的樹木,而會關(guān)注動態(tài)的人物活動或者其他的物體活動,大腦會根據(jù)進(jìn)化的積累自動判斷哪些是重要的、哪些是不重要的;當(dāng)我們進(jìn)入一個陌生的環(huán)境,會觀察到很多在熟悉環(huán)境中觀察不到的細(xì)節(jié),因為在熟悉的環(huán)境中,人類面對的危險度降低,人體系統(tǒng)自動降低警戒級別,視覺系統(tǒng)也自動屏蔽一些觀察細(xì)節(jié),以節(jié)省能量,而一旦進(jìn)入陌生環(huán)境,人類面對的危險度提高,人體系統(tǒng)將自動提高警戒級別,視覺警惕性也會提高,對細(xì)節(jié)的分辨率也會提高;相比于混沌狀態(tài),視覺注意力對秩序有天然的趨向,我們天然會關(guān)注有秩序感的形狀和物體,比如六邊形的蜂巢、整齊擺放的石塊、幾何圖案、樹葉的脈絡(luò)等,這是人類審美的來源,其本質(zhì)是對效率的追求。以味覺判斷為例,我們的舌頭上分布著一萬多個味蕾,這些味蕾的功能就像一個化學(xué)實驗室一樣可以鑒別食物分子,然后通過大腦中樞對食物進(jìn)行分類,最后標(biāo)記出各種“味道”來告訴我們關(guān)于這個食物的知識。這種感性先驗知識是進(jìn)化道路上固化在基因中的直接的具身性體現(xiàn)。
其二,是觀照的、以身體為參照物的具身性知識。古希臘哲學(xué)家普羅泰戈拉曾經(jīng)說:“人是萬物的尺度?!蔽覀兡軌蜻M(jìn)行理性思考,都是源于搭建了一個以人體尺度為基本參照物的關(guān)于這個世界的認(rèn)知框架。比如我們一般會懼怕比自身大的物體或生物,不懼怕比自身小的物體或生物,這是因為我們以人類自身的尺度作為心理情緒警示的標(biāo)尺;再如,“ENTER”(進(jìn)入)這個概念可被分析為這樣一個身體經(jīng)驗圖式:物體自主移動身體,從一個源點出發(fā),沿著一定的路徑,進(jìn)入一個“容器”,并由此使自己成為一個參照身體的“容納物”[8]。我們?nèi)粘UJ(rèn)識事物的類比思維,物體的大小、高低、冷熱、長短、快慢等,這些概念、知識都是在具身尺度的框架內(nèi)形成的。
3.2 歷史性模因知識
模因(meme)又稱文化基因、謎米、覓母。英國科學(xué)家理查德·道金斯在《自私的基因》中提出,文化的傳播類似生物遺傳,它能導(dǎo)致某種形式的進(jìn)化,他將這種文化傳播或者模仿的基本單位稱作“meme”。道金斯認(rèn)為模因如同一個有生命力的結(jié)構(gòu),通過模仿的過程在人們的大腦間轉(zhuǎn)移傳遞,從而在模因庫中進(jìn)行繁殖,它是一種新的復(fù)制因子,也具有遺傳、變異和選擇的特征[9]。
模因構(gòu)成的知識,涉及語言、信仰、審美、藝術(shù)、技術(shù)、風(fēng)俗、建筑、服裝、飲食、器物等人類文化的每一個領(lǐng)域,也可以說人類的文化和觀念都是由模因塑造而成。對特定人物來說,模因知識就是在生活與教育環(huán)境中潛移默化被植入腦中的文化背景觀念,而人物生活的歷史時代的文化背景觀念就是歷史性模因知識。
以蕭繹生活時代的建筑知識為例,他出生并長期生活在建康城中,南朝時期的建康城沿用了西晉洛陽的建筑布局,城市在蕭繹的父親蕭衍手中達(dá)到了鼎盛時期,宮室建在都城中心偏北處,構(gòu)成以宮室為中心的南北軸線布局[10]。這種圍繞軸線、按禮制展開的布局,在南北朝的亂世中,城市一次次地毀滅又復(fù)興,儒家的禮法、等級制度的模因無數(shù)次地遺傳、變異,卻始終影響著城市的布局所體現(xiàn)的等級秩序。在蕭繹的前朝,齊東昏侯蕭寶卷曾經(jīng)大興土木,《南史·齊本紀(jì)》載其大起諸殿,皆匝飾以金璧,每一座建筑的落成,都是一次設(shè)計師頭腦中的模因復(fù)制過程,屋頂、屋身、臺基的形制、構(gòu)件與之前的歷史樣式既有遺傳又有變異,但是千百年來,依然保存著中國傳統(tǒng)木構(gòu)建筑的典型結(jié)構(gòu)和審美特征。梁武帝崇信佛教,大力營造佛教寺院,史載當(dāng)時建康城共有佛寺五百余座,皆富麗堂皇、宏偉壯觀[11]1721,今天通過敦煌壁畫依然能夠想見當(dāng)時壯麗的佛寺、佛塔,精美的佛教雕塑和壁畫,能夠感受到這是在繼承秦漢傳統(tǒng)建筑模因的基礎(chǔ)上,又糅合了印度、犍陀羅和西域的佛教藝術(shù)元素,多種模因混合而形成的新的模因。如果我們讓數(shù)字化的蕭繹描述一個公元五百年的建筑,在他頭腦中呈現(xiàn)出來的一定是如魏晉南北朝時期敦煌壁畫建筑一樣的圖像,而絕非伊斯蘭或者哥特風(fēng)格的建筑,因為即使在他的著述中從未提及任何具體建筑形式,但是關(guān)于當(dāng)時建筑的歷史性模因知識已經(jīng)自行演化并根植于他的腦中了。傳統(tǒng)建筑模因遺傳穩(wěn)定性很高,保存至今也具有很強的辨識度,而事實上大部分模因都遺失在了歷史長河中,以歌謠、俗語為例,這種出口入耳的模因由于地域、時事、方言等流傳變異原因,保真度很低,比如《金樓子·志怪篇》所載:“寧得一把五加,不用金玉滿車;寧得一斤地榆,不用明月寶珠?!盵12]今天已經(jīng)很難辨別它保留下來的是什么樣的文化基因殘片。
3.3 歷史性樸素理論知識
發(fā)展心理學(xué)認(rèn)為兒童具有關(guān)于客觀世界的樸素理論,這種理論雖然只是關(guān)于事物和現(xiàn)象的日常理解,但是能夠?qū)⒖陀^世界的實體有一定內(nèi)在邏輯地組織在一起,能夠?qū)陀^現(xiàn)象作出樸素、直觀的解釋和預(yù)測,這個解釋和預(yù)測可能具有違背現(xiàn)代科學(xué)的錯誤,卻往往符合眼見為實的日常經(jīng)驗,比如向上拋一枚硬幣,會被解釋為上升時拋力大于重力,下降時重力大于拋力[13]。樸素理論主要包括樸素物理學(xué)、樸素生物學(xué)和樸素心理學(xué),這三個領(lǐng)域構(gòu)成了兒童的核心知識系統(tǒng)[14]。研究表明,樸素理論的信念不只存在于兒童的認(rèn)知中,在受過良好教育的成年人中也普遍存在[15],伽利略所做的兩個鐵球同時落地的實驗就證明了人們普遍存在的直覺認(rèn)知錯誤。在此我們假定特定人物具有某一歷史時代背景的樸素理論知識,不同歷史時代的人物具有不同的歷史性樸素理論知識。
樸素物理學(xué)是最重要的樸素理論知識,它研究人們對物理實體、過程和現(xiàn)象的直覺認(rèn)識。樸素物理學(xué)最早由帕特里克·海斯提出,他發(fā)展了一套樸素的流體物理學(xué)公理[16]。以《金樓子》中包含的樸素物理學(xué)知識為例,試舉幾例:①常識性樸素物理學(xué)知識:“水至寒而有溫泉之熱,火至熱而有蕭丘之寒。重者應(yīng)沉而有浮石之山,輕者當(dāng)浮而有沉羽之水?!盵12]已知水寒火熱,石重羽輕,可以推導(dǎo)出水的溫度比火低,火的溫度比水高;石的重量比羽重,羽的重量比石輕的樸素物理知識。②天圓地方的宇宙結(jié)構(gòu)知識:“天道圜而地道方?!盵12]③開始、結(jié)束與時間、空間無限的物理概念:“謂始必終,而天地?zé)o窮焉?!盵12]④潮汐有規(guī)律漲落現(xiàn)象的物理解釋:“鯨入穴則水溢為潮來,鯨出穴則水入為潮退,鯨鯢既出入有節(jié),故潮水有期?!盵12]
樸素生物學(xué)是人們對生物和生理現(xiàn)象、過程的直觀認(rèn)識。以《金樓子》中包含的樸素生物學(xué)知識為例,試舉幾類:①真名與實體能夠交感,即認(rèn)為名字和它們所代表的生物或物體之間不僅是思想概念上的聯(lián)系,而且是真實存在的物質(zhì)聯(lián)系[17]:“山中有寅日稱虞吏者,虎也;稱當(dāng)路者,狼也;辰日稱雨師者,龍也。知其物,不能為害矣(同《抱樸子·登涉》:‘但知其物名,則不能為害也?!?。”[12]②毫毛繁殖,生物的成長皆是起始于非常微小的胚芽:“晉寧縣境內(nèi)出大鼠,狀如牛,土人謂之鼴鼠。天時將災(zāi),則從山出游畎畝,散落其毛悉成小鼠,盡耗五稼?!盵12]
3.4 個人習(xí)得知識
蕭繹的個人習(xí)得知識可從他的讀書與著書中探知。蕭繹自幼酷愛讀書,《梁書·本紀(jì)》記載他六歲的時候,高祖蕭衍問他能讀什么書,他答:“能誦《曲禮》”[18];《南史·梁本紀(jì)》稱其性愛讀書,因患有眼疾不能自己持卷看書,于是設(shè)置專人為其讀書,輪流值班,晝夜不息[11]234-245。蕭繹讀過哪些書,直接記錄有具體書名并且傳世的不多,除上述《曲禮》外,大概有從母親阮修容處接受的教育,《金樓子》記載蕭繹幼年即親承慈訓(xùn),學(xué)習(xí)過《孝經(jīng)》《論語》《毛詩》等儒家典籍;還有成為帝王后他曾經(jīng)登殿講學(xué),《梁書·本紀(jì)》記載承圣三年(554年)九月辛卯日,蕭繹登龍光殿親自為群臣講述《老子》之精要[18]。蕭繹還讀過哪些書,數(shù)量最多的間接證據(jù)就是他的藏書。蕭繹是南朝著名的藏書家,在《金樓子·聚書篇》中蕭繹自言當(dāng)時自己已經(jīng)四十六歲,聚書已有四十年,藏書共計八萬卷,史傳漢河間王劉德的私人藏書量與整個國家藏書量相等,蕭繹頗為自得地認(rèn)為自己已經(jīng)超越了河間王劉德。蕭繹藏書有記載的包括:《續(xù)漢春秋》《晉書》《晉陽秋》《肘后方》《離騷》《爾雅》等;另外,按照古人“述而不作”的編述方式,《金樓子》中有大量內(nèi)容雜采自其他古書,包括《呂氏春秋》《淮南子》《文選》《說苑》《漢書》等[19],這些書也應(yīng)該包括在蕭繹的知識范圍內(nèi);還有《金樓子》篇章中提及的古書,大多也應(yīng)該包括在蕭繹的知識范圍內(nèi),包括《新語》《祭法》《月令》《國語》等。
蕭繹崇尚立言于世,“由年在志學(xué),躬自搜纂,以為一家之言”[12]。蕭繹一生著述頗豐,《梁書·本紀(jì)》和《南史·梁本紀(jì)》記載了四百余卷,《金樓子·著書篇》記載了37種677卷,尚存于世的只有《金樓子》《古今同姓名錄》以及少數(shù)詩篇,是記錄蕭繹個人習(xí)得知識的主要典籍。
3.5 個人經(jīng)驗知識
個人經(jīng)驗知識是特定人物所親身經(jīng)歷的事件知識,包括他經(jīng)歷的社會實踐活動和個人心理體驗知識。
蕭繹生于帝王之家,為梁武帝蕭衍第七子。六歲即受封為湘東郡王,后任會稽太守、丹陽尹、平西將軍、都督九州諸軍事、鎮(zhèn)西將軍、荊州刺史。侯景之亂時,鎮(zhèn)守江陵的蕭繹兵力強盛,本無緣帝位的他看到了機會,擁兵自重,在亂世中逐漸崛起,密詔假黃鉞、大都督中外諸軍事,麾下名將有王僧辯和陳霸先,后改元稱帝,但是在位僅兩年多就在西魏與蕭詧進(jìn)攻江陵的戰(zhàn)役中戰(zhàn)敗被殺。
蕭繹一生的經(jīng)歷及個人心理歷程都極為復(fù)雜。《南史·梁本紀(jì)》評價他天資聰明,相貌俊朗,英姿勃發(fā),每有言論則聲若鳴鐘,卻又生性好矯飾,猜忌心盛,從不將名譽給予他人,若有人略勝于他,必加以迫害[11]234-245;《梁書·本紀(jì)》評價他稟性猜忌,對人沒有親疏之別,沒有辦法管理下屬,即使陷入危險也不知懼怕,因此功績和美德都有很大缺陷[18]。他的性格、行事又與他自幼的心理、生理體驗息息相關(guān)。蕭繹自幼便遭受疾病的痛苦,從出生即患眼疾,少年時又患瘡疾,十三歲開始患有心氣疾,人到中年時五個兒子逐一死去[12]。庶出、不被家庭重視、天生殘疾,蕭繹由生理的病態(tài)造成了心理的自卑與嫉妒、猜忌,《金樓子·序》開篇便是:“先生曰:余于天下為不賤焉?!盵12]這種心理自卑促使他發(fā)奮好學(xué),同時內(nèi)心也傲慢自大。他與王妃徐昭佩矛盾重重,終生唯一的感情依靠便是母親阮修容,母親的去世令他“貫切痛絕”,以至于他決定死后也要葬在母親的墓旁,在《金樓子·終制篇》中坦然記載了自己的歸骨之地:“山地東北隅,始生山陵小墓之前,可以為冢。已具別圖,庶魂兮有奉,歸骨有地,然壙中石屏風(fēng)、木人、車馬、涂車、芻靈之物,一切勿為?!盵12,20]
3.6 歷史性社會事理知識
人類社會的活動就是一系列事件在時間與空間維度上持續(xù)進(jìn)行的過程,這個過程的規(guī)律和模式就是我們做出推理判斷的事理知識。傳統(tǒng)知識可以回答When、Where、Who、What等問題,事理知識可以回答Why、How等更深層次的問題,也可以對沒有預(yù)設(shè)或尚未發(fā)生的問題作出解釋或預(yù)測性推斷。事理知識表示的是一系列事件發(fā)生的推理機制,我們當(dāng)前探討的人工智能不接觸物理實體,因此這里的推理機制也只是從事件例證文本中提取的文本推理知識,其推理邏輯關(guān)系主要包括:因果事理、順承事理、條件事理、并發(fā)事理、上下位事理、反轉(zhuǎn)事理、組成事理等[21]。如果某個歷史時期具有社會上普遍認(rèn)可的事理知識,我們就將之稱作歷史性社會事理知識。
以一個蕭繹曾經(jīng)做過記載的事件為例說明,《金樓子·箴戒篇》載有6條關(guān)于漢昌邑王賀被廢的記錄,既入箴戒篇,說明蕭繹認(rèn)同昌邑王劉賀被廢的理由和推斷?!稘h書·霍光金日磾傳》詳述了在朝堂之上以霍光為首的一眾大臣是如何論證劉賀應(yīng)當(dāng)被廢的理由:“高皇帝建功業(yè)為漢太祖,孝文皇帝慈仁節(jié)儉為太宗,今陛下嗣孝昭皇帝后,行淫辟不軌?!对姟吩疲骸晃粗?,亦既抱子?!灞僦畬?,莫大不孝。周襄王不能事母,《春秋》曰‘天王出居于鄭’,繇不孝出之,絕之于天下也。宗廟重于君,陛下未見命高廟,不可以承天序,奉祖宗廟,子萬姓。當(dāng)廢?!盵22]第一句陳述了認(rèn)定的歷史事實;第二句引用《詩經(jīng)·抑》封住了以年輕作為脫罪的借口;第三句“五辟之屬,莫大不孝”又是引用《孝經(jīng)·五刑》指出事件相關(guān)法條;第四句直接引用《春秋公羊傳·僖公二十四年》,背景是漢代可憑《春秋》決獄,根據(jù)公羊?qū)W“原心定罪”原則,引用經(jīng)典的內(nèi)容作為處理重大政治事件的依據(jù),以“褒、貶、誅、絕”的春秋條例推理出劉賀“絕之于天下”[23];最后給出一個與第一句歷史事實相銜接的技術(shù)性理由及最后的處理結(jié)果。我們可以看到,從昌邑王劉賀求長鳴雞卵、衣車載女子、道不素食、發(fā)璽不封等事件到“光即與群臣俱見太后,具陳昌邑王不可以承宗廟狀”,直到“皇太后詔曰:‘可?!边@一系列事件鏈條都是對已發(fā)生的事實知識的順承描述,而霍光奏疏上引用《詩經(jīng)》《孝經(jīng)》《春秋公羊傳》才是推理機制的關(guān)鍵,致使前面的事件成為最后昌邑王被廢事件的原因,整個事件鏈條的邏輯關(guān)系從順承事理轉(zhuǎn)變成了因果事理,因此引用儒家經(jīng)典成為了一個當(dāng)時社會公認(rèn)的事理知識。
不止政治事件的推導(dǎo)需要事理知識,有時物理事件的推導(dǎo)也同樣需要事理知識?!督饦亲印ぶ竟制份d:“凡藏諸寶忘不知處者,以銅盤盛井花水,赴所擬地照之,見人影者物在下也。”[12]其意在于:通過井中水能看到地下的物體,那么將井中水盛入銅盆,造成一個人為的同構(gòu)物,則能看穿地下寶藏的特征也會遷移到銅盆水中。這種同構(gòu)特征遷移的事理知識也是當(dāng)時人們的普遍認(rèn)知。
3.7 個性事理知識
個性事理知識與歷史性社會事理知識類似,只不過反映的是個人對事件演化過程的邏輯關(guān)系認(rèn)知。蕭繹擅長占筮,《南史·梁本紀(jì)》記載蕭繹對于各種技藝方術(shù)無所不通,軍中曾經(jīng)很久沒有收到南部的消息,他就卜了一卦,卦象是由“剝”轉(zhuǎn)為“艮”,他由此判定:“南部的消息已經(jīng)送到了,應(yīng)當(dāng)派人去看一下?!苯Y(jié)果正如他的判斷,賓客們都驚訝于蕭繹占筮的玄妙,他對此解釋道:“艮卦為門,當(dāng)日的時辰正好在寅時,與日辰相合,故此占得了結(jié)果?!彼歉鶕?jù)卦象和事件發(fā)生的時辰推測的[24]。蕭繹自幼學(xué)道,花十年之功寫作周易研究著作《連山》,說明他的思維受易理的影響非常深,很多事件的發(fā)生他都會用易理來解釋,用占筮的結(jié)果去處理,這是他的個性事理知識。
蕭繹生逢亂世,經(jīng)歷的是中國歷史上最波瀾壯闊、最嘆為觀止而又駭人心目的魏晉南北朝,期間皇族骨肉相殘的事件頻繁出現(xiàn),有童謠流傳:“遙望建康城,小江逆流縈,前見子殺父,后見弟殺兄?!边@種殘酷的現(xiàn)實對熟讀史書的蕭繹一定有深深的觸動,他曾言:“人間之世,飄忽幾何,如鑿石見火、窺隙觀電。螢睹朝而滅,露見日而消?!盵12]因此他的行事風(fēng)格帶有一定的瘋狂和乖張,江陵兵敗后命舍人將自己畢生所集的十四萬卷藏書盡皆焚毀,拔劍斫柱,嘆道:“文武之道,今夜盡矣!”這是個不難想象的場景,應(yīng)該也契合他以往獲得的個性事理知識。
4 符號主義與連接主義
人工智能一直有符號主義和連接主義兩條代表性進(jìn)路,符號主義主張模擬人類的心智,以符號表示知識,通過邏輯運算推理的方式形成智能;連接主義主張模擬人腦的神經(jīng)網(wǎng)絡(luò)連接及強度變化,以數(shù)據(jù)為驅(qū)動訓(xùn)練參數(shù)權(quán)重從而生成智能。符號主義在發(fā)展中陷入了框架問題的困境,即如何在一個動態(tài)變化的系統(tǒng)中表述事實,同時又保證系統(tǒng)中其他具有蘊含關(guān)系的事實屬性不被這些行為所影響[25],這是由于人工智能不具備常識與技能的“白板”狀態(tài)而造成的“牽一發(fā)而動全身”的困擾,框架問題成為了“一代代哲學(xué)家未曾注意的新的深層認(rèn)識論問題”[26],研究者們提出了“廉價測試”(cheap test)和“省事策略”(sleeping dog)兩種解決方案,但是結(jié)果都不理想;以深度學(xué)習(xí)為代表的連接主義則發(fā)展更加順利,近年來在預(yù)訓(xùn)練的大型語言模型(Large Language Model, LLM)BERT、GPT、百度文心上都獲得了極大成功。
本文所做的特定人物知識構(gòu)成分析遵循典型的符號主義進(jìn)路,那么現(xiàn)階段這種研究的意義何在?著名計算機科學(xué)家、圖靈獎得主楊立昆(Yann LeCun)認(rèn)為語言只承載了人類全部知識的一小部分,單純依靠語料數(shù)據(jù)驅(qū)動會受到互聯(lián)網(wǎng)數(shù)據(jù)偏差、有限的上下文、缺乏常識這樣的限制,從而不可能真正理解語言和外部世界,也不可能接近人類智能水平。事實上,這兩種認(rèn)知模型都有各自的優(yōu)缺點。隨著知識圖譜為代表的符號人工智能新方法的發(fā)展,符號主義與連接主義融合的趨勢也越來越清晰,從符號主義的語義符號空間和連接主義的特征向量空間進(jìn)化到可計算的語義向量空間,“神經(jīng)-符號機”等理論被提出,在神經(jīng)網(wǎng)絡(luò)中嵌入知識、概念與邏輯推理,可以解決知識接收瓶頸困境問題,同時提高算法的推理能力和可解釋性[27]。知識圖譜可用于LLM的優(yōu)化,提供結(jié)構(gòu)化知識表示及推理能力,提升模型的記憶力、邏輯性、可解釋性及連貫性等;LLM及深度神經(jīng)網(wǎng)絡(luò)也可用于知識圖譜的知識抽取和知識注入,可以根據(jù)已有三元組推導(dǎo)出缺失的三元組,以進(jìn)行知識補全和完善,也可以通過事前及事后可解釋推理模型建立用戶信任[28]。
對本文所研究的人物知識構(gòu)成而言,進(jìn)行知識分析與重構(gòu)的意義,第一,可以起到知識校正與錨定的作用,形成一個結(jié)構(gòu)化的領(lǐng)域知識圖譜,避免人工智能系統(tǒng)涉及具體知識時經(jīng)常出錯的問題;第二,單純連接主義的成就永遠(yuǎn)是在人類已知的束縛中徘徊,而通過知識構(gòu)建和邏輯推斷才可能突破現(xiàn)有知識的極限,突破有記錄知識的局限,探究特定人物所未曾言及的事物,從而讓我們走出已知、踏向未知。
5 結(jié)語
許慎在《說文解字·敘》中講遠(yuǎn)古創(chuàng)造符號系統(tǒng)時“近取諸身,遠(yuǎn)取諸物”,表明在人類文明史的上一個重大認(rèn)知工具革命中,具身性與對外部客觀世界的感知是知識的基本來源,那么在今天人工智能帶來的認(rèn)知工具革命中,它們依然會是知識的基本來源,是文明發(fā)展的基礎(chǔ)。
本文以分析的方法,論述了構(gòu)造一個特定的數(shù)字化虛擬真人,其所應(yīng)當(dāng)具備的知識。特定人物的知識,不同于通用人工智能知識,它具有個性與歷史性限制。它的底層是所有人類共有的具身性知識,中層是歷史性模因知識、歷史性樸素理論知識,表層是個人習(xí)得知識與個人經(jīng)驗知識,另外還有歷史性社會事理知識和個性事理知識作為連接事件與經(jīng)驗的推理知識。具身性知識相當(dāng)于底層操作系統(tǒng),中層和表層知識是關(guān)于事實的知識,歷史性社會事理知識和個性事理知識是關(guān)于事實之間的一般關(guān)聯(lián)的知識。
物理學(xué)家費曼有句名言:“凡我不能創(chuàng)造的,我就不能理解?!比绻幸惶煳覀兡茏屓斯ぶ悄苣M的真人走入圖書館,這是否意味著我們對人物、對知識、對自己都有了更深刻的理解?再或者借助因果關(guān)系之梯[29],讓蕭繹做一個反事實推斷:“如果我沒有在江陵燒毀十四萬卷書籍,那會怎樣?”是否那時我們對歷史也會有更深刻的理解?
參考文獻(xiàn):
[1] 明均仁,陳曉禹,楊艷妮,等.我國真人圖書館建設(shè)現(xiàn)狀調(diào)查與研究[J].圖書館工作與研究,2021(5):16-22.
[2] 李德毅,于劍.人工智能導(dǎo)論[M].北京:中國科學(xué)技術(shù)出版社,2018:23.
[3] KUMARAN D,SUMMERFIELD J J,HASSABIS D,et al.Tracking the Emergence of Conceptual Knowledge during Human Decision Making[J].Neuron,2009,63(6):889-901.
[4] 羅素.人類的知識:其范圍與限度[M].張金言,譯.北京:商務(wù)印書館,1983.
[5] 波普爾.猜想與反駁:科學(xué)知識的增長[M].傅季重,紀(jì)樹立,周昌忠,等譯.上海:上海譯文出版社,1986:162.
[6] 龐蒂.知覺現(xiàn)象學(xué)[M].楊大春,張堯均,關(guān)群德,譯.北京:商務(wù)印書館,2021:281-286.
[7] 康德.純粹理性批判[M].李秋零,譯.北京:中國人民大學(xué)出版社,2004:26-43.
[8] 徐英瑾.具身性、認(rèn)知語言學(xué)與人工智能倫理學(xué)[J].上海師范大學(xué)學(xué)報哲學(xué)社會科學(xué)版,2017,46(6):5-11.
[9] 道金斯.自私的基因[M].盧允中,張岱云,陳復(fù)加,譯.北京:中信出版社,2018:217-232.
[10] 劉敦楨.中國古代建筑史[M].北京:中國建筑工業(yè)出版社,1984:86.
[11] 李延壽.南史[M].北京:中華書局,1975.
[12] 蕭繹.金樓子[M].臺北:臺灣商務(wù)印書館,1986:22-146.
[13] CLEMENT J.Students’preconceptions in introductory physics[J].American Journal of Physics,1982,50(1):66-71.
[14] WELLMAN H M,GELMAN S A.Cognitive development:foundational theories of core domains[J].Annual Review of Psychology,1992,43(1):337-375.
[15] MCCLOSKEY M,KOHL D.Naive physics: the curvilinear impetus principle and its role in interactions with moving objects[J].Journal of Experimental Psychology:Learning、Memory and Cognition,1983,9(1):146-156.
[16] 海斯.人工智能哲學(xué):樸素物理學(xué)宣言[M].劉西瑞,王漢琦,譯.上海:上海譯文出版社,2001:231-278.
[17] 弗雷澤.金枝[M].徐育新,譯.北京:大眾文藝出版社,1998:364.
[18] 姚思廉.梁書[M].北京:中華書局,1973:113-136.
[19] 陳志平.“一家之言”與《金樓子》[J].諸子學(xué)刊,2012(2):367-384.
[20] 王志高.丹陽三城巷(1)南朝陵墓石獸墓主身份及相關(guān)問題考訂[J].東南文化,2011(6):64-74.
[21] 陳華鈞.知識圖譜導(dǎo)論[M].北京:電子工業(yè)出版社,2021:262-267.
[22] 班固.漢書[M].北京:中華書局,1962:2945-2946.
[23] 宋艷萍.公羊?qū)W與漢代政治:由?;韬钅顾觥洞呵铩奉惡啝┮l(fā)[J].東方論壇,2022(1):30-57.
[24] 宋亞莉.論《金樓子》的占筮實例與蕭繹的周易情結(jié)[J].東方論壇,2015(2):108-113.
[25] CHOW S J.What’s the Problem with Frame Problem?[J].Review of Philosophy and Psychology,2013,4(2):309-331.
[26] 丹尼特.人工智能哲學(xué):認(rèn)知之輪-人工智能的框架問題[M].劉西瑞,王漢琦,譯.上海:上海譯文出版社,2001:198-230.
[27] 魏斌.符號主義與聯(lián)結(jié)主義人工智能的融合路徑分析[J].自然辯證法研究,2022,38(2):23-29.
[28] 侯中妮,靳小龍,陳劍赟,等.知識圖譜可解釋推理研究綜述[J].軟件學(xué)報,2022,33(12):4644-4667.
[29] 珀爾,麥肯齊.為什么:關(guān)于因果關(guān)系的新科學(xué)[M].江生,于華,譯.北京:中信出版社,2019:3-29.
作者簡介:楊平生,西安建筑科技大學(xué)圖書館館員,研究方向為智慧圖書館。
收稿日期:2023-12-28編校:王曉琳 王學(xué)思