亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        描寫還是解釋:由ChatGPT反思語言學的兩種目標

        2025-01-10 00:00:00袁毓林
        語言戰(zhàn)略研究 2025年1期
        關鍵詞:句法語義語言

        提 要 本文在現(xiàn)代大語言模型語境下反思語言學研究的兩種目標之爭:精確描寫(語言事實,how)還是科學解釋(語言能力,why)?以此為中心,討論了一系列相關的問題,并考察了ChatGPT 能否捕獲長距離依存、能否理解句法與語義分離的句子、對語言的科學解釋與精確描寫是否對立。得出的結論是:(1)ChatGPT 等大模型能夠超越馬爾可夫過程模型,來捕獲語句中不同詞語之間的長距離依存關系;能夠隱式地學習基本的句法和語義知識,從而理解、識別和生成語義異常的句子。(2)對語言的精確描寫和科學解釋并不對立,并且前者比后者更加重要。(3)生成語法學的“原則與參數(shù)”范式下的范疇語法,對于描寫人類自然語言有不可克服的困難。(4)語法學的研究取向應該是語義優(yōu)先,而不是句法優(yōu)先。(5)大模型的成功說明:對語言事實的準確描寫遠比對語言能力的抽象解釋更為基本。

        關鍵詞ChatGPT ;語言模型;描寫/ 解釋;語言事實/ 語言能力;語義優(yōu)先/ 句法優(yōu)先

        中圖分類號H002 文獻標識碼A 文章編號2096-1014(2025)01-0062-13

        DOI 10.19689/j.cnki.cn10-1361/h.20250106

        一、引言:語言模型的成功值得語言學家反思

        2022 年11 月30 日,這也許是一個值得語言學人永遠記住的日子:在這一天,美國人工智能機構OpenAI 發(fā)布了ChatGPT,這是一款以聊天機器人形式呈現(xiàn)出來的人工智能系統(tǒng),它仿佛真的能夠理解和生成人類自然語言;因此,也有可能動搖主宰當代語言學的某些理論假設或研究信念。不信的話,你可以試著跟它像朋友一樣問答聊天和爭辯糾正,看看期間有沒有什么違和感。比如,下面是2023年5 月4 日筆者跟它的一段對話:

        筆者:澳門跟廣州之間有直達火車嗎?

        ChatGPT:是的,澳門和廣州之間有直達火車。目前,澳門與廣州之間的高速鐵路連接已經(jīng)建成并運營。您可以從廣州南站、廣州火車站或廣州東站乘坐高鐵到達澳門,車程約為1 ~ 2 個小時。不過需要注意的是,因為疫情等因素,火車班次和運行時間可能會有所調整,請您提前查詢具體信息并遵守當?shù)氐穆糜魏头酪咭?guī)定。

        筆者:據(jù)我了解,澳門和廣州之間沒有火車。請問,乘汽車方便嗎?

        ChatGPT:非常抱歉,我的之前的回答有誤。您所說的是正確的,目前澳門和廣州之間沒有直達火車。不過,您可以選擇乘坐汽車前往澳門,這是一種比較方便的交通方式。您可以從廣州的多個汽車客運站出發(fā),前往澳門旅游。從廣州的天河客運站或廣州汽車客運站出發(fā),到澳門口岸的車程約為3 ~ 4 小時左右,票價在100 ~ 200 元之間。此外,您也可以選擇在珠?;驒M琴島口岸下車,然后乘坐輪渡前往澳門。但需要注意的是,由于疫情等原因,旅行前最好提前查詢相關信息,并遵守當?shù)氐穆糜魏头酪咭?guī)定。

        正如OpenAI 網(wǎng)站上所介紹的:“對話格式使得ChatGPT 能夠回答后續(xù)問題、承認錯誤、挑戰(zhàn)不正確的前提,并拒絕不適當?shù)恼埱??!比欢撜Z言模型也存在許多嚴重的問題,比較突出的是“一本正經(jīng)地胡說八道”,即出現(xiàn)“幻覺”(hallucination)。這也是大語言模型目前遭受批評的一個普遍性問題。因為,大模型是一種具有眾多參數(shù)和復雜計算結構的機器學習系統(tǒng),經(jīng)過海量自然語言文本等數(shù)據(jù)的訓練,來預測用戶給定的文本后面的下一個詞語,依此推進,最終生成符合人類語言習慣的文本。至于這個文本的內容的真實性,則是無法保證的。也就是說,它只能基本上保證語法正確(合式的,well-formed),但是并不能夠保證內容的正確和可靠(可信的,trust)。

        但是,不管怎么說,“讓機器理解人們向它發(fā)出的自然語言指令”,這個自然語言處理和計算語言學多少年來夢寐以求的目標,似乎已經(jīng)初步達成。大家可能記得,以前的人工智能系統(tǒng)基本上是各有專長的專家系統(tǒng),分別擅長圖像分類、人臉識別、語音分析、目標檢測、機器翻譯、語言理解等特定任務。但是,ChatGPT 卻像一個全能的“X 戰(zhàn)警”,不僅能夠聊天和回答問題,而且還能夠編程序、寫文章、做攻略、畫表格、列算式、解方程……以一種近似人類水平的通用人工智能的姿態(tài),掀起新一輪生成式人工智能的熱潮:從生成創(chuàng)意內容到協(xié)助科學研究,帶動大語言模型逐步融入我們的學習、工作、科研和日常生活。這就難怪它這么受到大眾用戶的歡迎和熱捧:ChatGPT 問世后僅僅兩個月,月活躍用戶數(shù)就成功破億,成為IT 產(chǎn)品史上月活用戶數(shù)最快過億的消費級應用。這也意味著ChatGPT 等大語言模型,除了為人們的語言交往和信息交流提供新的動力和趣味之外,還在改變相關行業(yè)(比如教育)、簡化工作流程(比如招聘)、創(chuàng)造新的產(chǎn)品和藝術內容(比如藥品和動漫);甚至重新開啟我們對于技術的異想天開式的期望,走向創(chuàng)造一種人類跟機器可以像人跟人一樣親密無間交流的夢幻般未來。

        想一下吧!近在10 年前,有關業(yè)內人士還在壯膽式地高喊:“自然語言處理是人工智能皇冠上的明珠。”沒想到,現(xiàn)如今人類似乎已經(jīng)把這顆璀璨的明珠妥妥地收入囊中了。好事來得實在太快,對此,我們語言學人如果不做出一些反思,無論是關于語言的認識論,還是關于語言學的方法論,好像都說不過去。因為,ChatGPT 等大語言模型首先是關于語言的計算模型;其次,它采用的是不被語言學家看好的基于統(tǒng)計的概率方法。比如,早在1950 年代人工智能概念剛剛提出的時候,彼時的新銳語言學家喬姆斯基已經(jīng)聲稱:基于統(tǒng)計的概率模型不能真正刻畫自然語言(Chomsky 1956,1957)。于是,問題就來了:不能刻畫自然語言的概率模型,何以能夠在語言生成和理解方面都有如此杰出的表現(xiàn)呢?諸如此類的問題,都是在當下ChatGPT 等大模型高歌猛進的語境下,具有理論興趣的語言學家應該思考的問題,更是正在規(guī)劃自己未來的職業(yè)生涯的研究生們必須直面和正視的問題。

        為此,我們下面將分別介紹60 多年來喬姆斯基對基于統(tǒng)計概率的語言模型的持續(xù)質疑,以及人工智能專家Norvig(2011)對他的評論;其中,重點討論下列語言學理論與計算處理的關鍵問題:(1)現(xiàn)代大語言模型能不能超越有限狀態(tài)的概率轉移,來捕獲語句中不同詞語之間的長距離依存關系?(2) 現(xiàn)代大語言模型能不能理解和識別“colorless green ideas sleep furiously”(Chomsky 1956 :116)之類經(jīng)典的句法合格但語義異常的句子?(3)對語言的“精確描寫”和“科學解釋”是否對立?哪一個更加重要?(4)生成語法學的“原則與參數(shù)”范式下的范疇語法,對于描寫人類自然語言有沒有不可克服的困難?(5)語法學的研究取向應該是“句法優(yōu)先”還是“語義優(yōu)先”?(6)語言學家可以從語言大模型的成功中獲得什么樣的經(jīng)驗與教訓?

        二、喬姆斯基對概率模型的持續(xù)質疑

        ChatGPT 雖然炫酷,甫一出世就技驚四座;但是,說到底ChatGPT 等大語言模型都只是一種人類自然語言的可計算數(shù)學模型。于是,以研究人類自然語言的結構和功能為志業(yè)的語言學家應該是“與有榮焉”了吧?很不幸,答案是否定的。因為ChatGPT 等大模型不僅繞開了包括生成語法理論在內的最前沿的現(xiàn)代語言學理論模型(詳見Piantadosi 2023),而且使用的恰恰是幾十年前被喬姆斯基判了死刑的基于統(tǒng)計的概率模型。比如,Chomsky(1956 :113)在摘要中開宗明義地指出:

        通過從一個狀態(tài)到另一個狀態(tài)的轉移來產(chǎn)生符號的有限狀態(tài)馬爾可夫過程(fi nite-stateMarkov process)不能充當英語語法。并且,隨著n 的增加,產(chǎn)生英語n 階統(tǒng)計近似的此類過程的特定子類,并不會更接近地匹配英語語法的輸出。

        Chomsky(1957 :17)毫不含糊地指出:

        我認為,我們不得不得出結論:……概率模型(probabilistic model)沒有對句法結構的基本問題給出任何洞見。

        Chomsky(1969 :57)又直截了當?shù)刂赋觯?/p>

        必須認識到,“一個句子的概率”是一個毫無用處的概念,不管從這個概念的什么意義上來說[都是如此]。

        半個多世紀以來,喬姆斯基的這一觀點一直沒有改變。2011 年,在麻省理工學院紀念建校150 周年的一個討論會上,主持人平克(Steven Pinker,哈佛大學心理系教授)向喬姆斯基發(fā)問:“如何看待概率模型近年來在認知科學領域到處開花的趨勢?”喬姆斯基的回應是:

        確實有許多研究工作在嘗試用統(tǒng)計模型來解決各種各樣的語言學問題。其中有一些取得了成功。但是大多數(shù)是失敗的。

        如果不考慮語言的實際結構就應用統(tǒng)計方法,那么所謂的成功不是正常意義上的成功。就科學研究的歷史經(jīng)驗來說,這種意義上的成功并非主流。這就好像研究蜜蜂行為的科學家只是對著蜜蜂錄像,通過記錄蜜蜂的歷史行為,加以統(tǒng)計分析,來預測蜜蜂未來的行為。也可能統(tǒng)計方法可以預測得很好,但這算不上科學意義上的成功。研究蜜蜂的科學家并不關心這種預測。

        直到ChatGPT 火爆出圈、名滿天下,喬姆斯基依舊不改初心,在《紐約時報》上跟人合作發(fā)表文章,直言不諱地批評ChatGPT 等機器學習系統(tǒng):“只是在隨時間變化的概率中進行交互學習,沒有提出任何因果機制或物理規(guī)律,無法解釋英語語法規(guī)則;因而,其預測將總是膚淺而又不可靠的?!保–homsky 2023)甚至在受到Piantadosi(2023)等的猛烈批評以后,仍然在接受社會學家Mirfakhraie 的采訪時堅稱:“大語言模型無法闡明人類語言的習得問題,因為它們只是掃描天文數(shù)字量級數(shù)據(jù)以找到統(tǒng)計規(guī)律,并根據(jù)它們所分析的龐大語料庫來預測在序列中可能出現(xiàn)的下一個單詞?!保∕irfakhraie2023)

        那么,應該怎樣看待喬姆斯基的這些觀點呢?下面先從Norvig(2011)說起。

        三、現(xiàn)代大語言模型能不能捕獲長距離依存關系?

        對于喬姆斯基在2011 年的研討會上以及此前的相關觀點,人工智能專家、時任Google 公司研究主管的Peter Norvig 撰文(Norvig 2011)提出異議。首先,他歷數(shù)了基于統(tǒng)計的語言模型在搜索引擎、語音識別、機器翻譯、問題回答、詞義消歧、指代求解、詞性標注、句法解析等各項自然語言處理任務上的壓倒性成功(對世界做出準確的預測),說明喬姆斯基在2011 年的那個研討會上對統(tǒng)計模型的評價不符合事實。其次,他用下面這些例子來說明早期的簡單的概率模型的確有問題:

        (1)I never, ever, ever, ever, ... fi ddle around in any way with electrical equipment.

        (2)She never, ever, ever, ever, ... fi ddles around in any way with electrical equipment.

        (3)* I never, ever, ever, ever, ... fi ddles around in any way with electrical equipment.

        (4)* She never, ever, ever, ever, ... fi ddle around in any way with electrical equipment.

        從理論上說,無論句子中的ever 重復多少次,都不影響(1)(2)是合語法的,而(3)(4)是不合語法的。不過,一個有n 種狀態(tài)的馬爾可夫鏈概率模型在碰到句子中ever 的個數(shù)超出n 的值的時候,就分不清(1)(2)跟(3)(4)的區(qū)別了。因此,概率性的馬爾科夫鏈模型不能處理所有的英語句子。但是,這并不意味著所有的概率模型都要遭到同樣的批評。從喬姆斯基剛剛出道的1957 年到現(xiàn)在,已經(jīng)發(fā)展出許多概率模型。上面這4 個例子就可以用有限狀態(tài)模型來區(qū)分。此外,還有能力更強的概率上下文無關語法(PCFG),可以處理此類問題。

        為了測試現(xiàn)代大語言模型有沒有理解長距離依存關系的能力,我們去掉(3)(4)句前面的星號,問ChatGPT-4 :“下面4 個句子,哪些是符合語法的,哪些是不符合語法的?為什么?”它的回答是(2024 年1 月10 日):

        ChatGPT:在分析這些句子時,關鍵是注意動詞與主語的一致性。動詞應該根據(jù)主語是第一人稱(I)還是第三人稱(she)來調整其形式。下面是對每個句子的分析:

        1. I never, ever, ever, ever, ... fi ddle around in any way with electrical equipment.

        這個句子是符合語法的。主語是“I”(第一人稱),因此動詞使用基本形式“fi ddle”。

        2. She never, ever, ever, ever, ... fi ddles around in any way with electrical equipment.

        這個句子也是符合語法的。主語是“She”(第三人稱單數(shù)),因此動詞使用第三人稱單數(shù)現(xiàn)在時的形式“fi ddles”。

        3. I never, ever, ever, ever, ... fi ddles around in any way with electrical equipment.

        這個句子是不符合語法的。主語是“I”,但是動詞使用了第三人稱單數(shù)的形式“fi ddles”。

        正確的形式應該是“fi ddle”。

        4. She never, ever, ever, ever, ... fi ddle around in any way with electrical equipment.

        這個句子也是不符合語法的。主語是“She”,但是動詞使用了基本形式“fi ddle”。正確的形式應該是“fi ddles”。

        總的來說,(1)和(2)句子是符合語法的,因為它們正確地使用了與主語相一致的動詞形式。而(3)和(4)句子是不符合語法的,因為它們的動詞形式與主語不一致。

        可見,ChatGPT 的語言理解和生成能力都非常強,不僅懂得用戶問什么,而且能夠用語法學概念來分析、判斷和做出說明。那么,為什么它有如此強大的語言處理能力呢?因為它采用了轉換器(Transformer)這種神經(jīng)網(wǎng)絡架構,使得計算機能夠通過分析文本中單詞和短語之間的關系來理解、解釋和生成人類語言。尤其是轉換器中的注意力機制(attention),不僅專注于它當前正在處理的單詞的含義,并且關注上文中跟當前詞語相關的詞語;從而捕獲句子中不同位置上相關單詞之間的關系,比如上面4 個句子中“I/she…fiddle/fiddles”之間長距離的一致關系,無論它們中間插入了多少個ever。正是轉換器的這種構架和注意力機制,使得語言大模型能夠捕獲句子成分之間長距離的依存關系,以類似人類的方式聊天、寫作和思考、推理;并且,不僅沒有違和感,而且有時還逼真、自然得令人驚訝(詳見袁毓林2023 及其所引文獻)??磥?,基于統(tǒng)計的概率性語言模型的威力還真的不容小覷。

        四、現(xiàn)代大語言模型能不能理解句法和語義分離的句子?

        Norvig(2011)指出,每一個概率模型實際上都是一個確定性模型的超集(superset),后者只不過是將概率值嚴格地限定為0 或1 而已。對概率模型的合理批評必然是因為它們表達能力過強,而不是因為它們的表達能力不夠。喬姆斯基(Chomsky 1956 :116 ;1957 :15)提出了一個著名的例子,同時也是對有限狀態(tài)概率模型的一個批評:

        (5)Colorless green ideas sleep furiously.(無色的綠色思想狂怒地睡覺。)

        (6)Furiously sleep ideas green colorless.(狂怒地睡覺思想綠色無色的。)

        盡管(5)(6)及其任何部分都未曾在說英語者的語言經(jīng)驗中出現(xiàn)過,但(5)是合語法的,(6)是不合語法的。喬姆斯基認為,沒有一個n 階近似模型可以把這兩種句子區(qū)分開來。Norvig(2011)指出,雖然就整個句子而言,喬姆斯基的判斷顯然是正確的;但說到句子中的“部分”,則并不盡然。下面是一些部分(二詞組合)出現(xiàn)的例子:

        (7)“It is neutral green, colorless green, like the glaucous water lying in a cellar.” The Paris WeRemember, Elisabeth Finley Thomas (1942)

        (8)“To specify those green ideas is hardly necessary, but you may observe Mr. [D. H.] Lawrence in therole of the satiated aesthete.” The New Republic, Vol. 29, p. 184, William White (1922)

        (9)“Ideas sleep in books.” Current Opinion, Vol. 52 (1912)

        撇開關于“部分”的爭議不說,實際上基于統(tǒng)計訓練的有限狀態(tài)模型可以區(qū)分上面(5)(6)兩例。Pereira(2002)就提出了一個這樣的模型,在增加了詞類信息后,對新聞語料進行期望最大化的參數(shù)訓練,計算結果是例(5)的概率為(6)的概率的20 萬倍。為了說明這不是因為這兩個句子在新聞語料訓練得到的模型中有如此區(qū)別,Norvig 本人用Google 圖書語料庫(1800 ~ 1954)的訓練模型重復做了計算,結果是例(5)的概率為例(6)的10 萬倍。如果可以在樹結構的基礎上計算,則對句子“合語法性程度”的估計效果會更好。而不是像喬姆斯基提出的基于范疇的語法那樣,僅僅只是區(qū)分“合語法/ 不合語法”。

        饒有趣味的是,趙元任先生曾經(jīng)設想使不合理的組合“Colorless green, green ideas, ideas sleep, sleepfuriously”合理化的語境(Levenson amp; Chao 1977 :256):

        我有一個朋友,他腦子里總是充滿各種想法:好的想法和壞的想法,精美的想法和粗陋的想法,舊的想法和新的想法。在把他的新想法付諸實踐之前,他通常會在它們身上睡覺,讓它們成熟起來。但是,有時匆忙之間,他會在想法尚未成熟之前(即它們尚在青澀之時)將其付諸實踐。他的有些綠色想法相當生動、豐富多彩,但也并非總是如此,有些想法則相當平淡乏味和缺少色彩。當他想起自己的一些毫無色彩的想法仍然太青澀而無法使用時,他就會在它們身上睡覺,或者用他的話說,讓它們睡覺。然而,其中有一些想法可能是相互沖突和矛盾的,當它們在同一個晚上睡在一起時,它們會發(fā)生激烈的爭斗,把睡眠變成一場噩夢。因此,我的朋友經(jīng)常抱怨他那無色的綠色想法在瘋狂地睡覺。

        照此說來,在句法(詞類組配)合格的前提下,還真的沒有絕對的語義不合格的句子。值得一提的是,Piantadosi(2023 :15 ~ 16)指出,(5)通常被作為句法功能跟語義分開(而且轉移性概率統(tǒng)計用不上)的例子。有趣的是,ChatGPT 不僅可以學習相關的統(tǒng)計數(shù)據(jù),而且可以解釋這句話為什么有趣:因為這是一個語法正確但是沒有語義的句子;甚至在接到用戶的仿造指令后,造出了10 個類似的句子。下面是我們跟ChatGPT 的對話:

        筆者:下面兩個英語句子符合語法嗎?

        1. “Colorless green ideas sleep furiously.”

        2. “Furiously sleep ideas green colorless.”

        ChatGPT:第一個句子是著名的例子:“Colorless green ideas sleep furiously.”這是由語言學家諾姆·喬姆斯基(Noam Chomsky)提出的句法結構上合法但在語義上毫無意義的例子,以強調語法結構和語義意義之間的區(qū)別。第二個句子,“Furiously sleep ideas green colorless.”在語法上是合法的,但它的語義可能會令人困惑。這是因為英語中通常采用主語?謂語?賓語的結構,而這個句子的結構略顯不同,使得理解起來可能不那么直觀。

        ChatGPT 對“Furiously sleep ideas green colorless.”的判斷不正確。按照包括喬姆斯基在內的大多數(shù)語言學家的意見,這是一個在語法上也不合格的句子。我們接下來把任務改成讓它造句:

        筆者:請仿照“Colorless green ideas sleep furiously.”(無色的綠色觀念狂怒地睡覺)造 10 個英語句子,和10 個相應的漢語句子。

        ChatGPT :Certainly! Here are 10 English sentences following the structure of “Colorless green ideassleep furiously.” And the corresponding Chinese translations:

        1. Bitter cold thoughts whisper silently. 刺骨的寒冷思緒悄無聲息地低語。

        2. Mysterious silver dreams fl oat gracefully. 神秘的銀色夢想輕盈地漂浮。

        3. Vibrant orange emotions dance wildly. 充滿活力的橙色情感狂野地舞動。

        4. Fragile golden memories echo softly. 脆弱的金色回憶輕聲回響。

        5. Enigmatic purple theories hum melodiously. 高深莫測的紫色理論悠揚地哼唱。

        6. Serene blue aspirations glide peacefully. 寧靜的藍色志向寧靜地滑翔。

        7. Chaotic crimson fantasies burn fi ercely. 混沌的赤紅幻想燃燒得熊熊燃燒。

        8. Whispering turquoise concepts fl utter aimlessly. 低語的青綠概念漫無目的地飄舞。

        9. Lively coral fantasies shimmer vividly. 活潑的珊瑚幻想生動地閃爍。

        10. Timeless lavender beliefs resonate mysteriously. 永恒的淡紫信仰神秘地回響。

        顯而易見,跟原句(5)相比,ChatGPT 仿造的句子在語義上更加合理和可以理解;因為,在訓練語料中缺乏像(5)那種人為造成的合語法但是無語義的句子。并且,這10 個句子跟Piantadosi(2023 :15)中由ChatGPT 仿造的10 個,沒有一個是重合的??梢姡M管在訓練語言模型時,工程師們沒有向它注入顯式的句法與語義分離的知識,但是語言大模型依然可以在用戶的提示下,清楚地區(qū)分有關句子的句法與語義層面。

        五、對語言的科學解釋跟精確描寫并不對立

        其實,喬姆斯基反對語言的概率模型,還有更加深刻的哲學考慮,那就是,科學的目標是解釋世界,提供關于研究對象的洞見,探索事物為何是它現(xiàn)在這個樣子(why);而不是描寫世界、模擬現(xiàn)象或為事實建模,描述事物怎樣成為這個樣子(how),以取得工程上的成功。對此,Norvig(2011)的評論是:科學和工程是互相成就的,工程上的成功可以作為科學上的成功模型的證據(jù)。科學是事實和理論的混合體,理論不能過分凌駕于事實之上??茖W發(fā)展史是一個不斷積累事實的過程,語言學也不應例外。為了佐證自己的觀點,Norvig(2011)調查了當時最近的期刊《科學》(Science)和《細胞》(Cell)上的文章,還有2010 年諾獎中物理、化學、生理和醫(yī)學方面的工作,結論是:這些研究工作100% 地重視“精確地模型化這個世界”(即how),勝過“提供對這個世界的解釋”(why)。當然,他承認區(qū)分這兩種工作有時并不容易。

        Norvig(2011)還指出,語言學中的傳統(tǒng)模型往往是離散的、范疇化的、定性描述的。比如,一個詞要么是動詞,要么不是,并沒有關于它的“動詞性”(verbiness)的量化程度的描述。但是,母語者對很多短語和句子的合語法性,也有拿不準的時候。比如:

        (10)The earth quaked.

        (11)? It quaked her bowels.

        quake 這個動詞一般在詞典中都標記為不及物動詞。因此,根據(jù)基于范疇的形式語法模型,上面的例(10)是合語法的,而例(11)是不合語法的。但是,例(11)這樣的句子又確實出現(xiàn)在英語中。于是,基于范疇的形式語法模型就陷入了兩難的困境:接受或排斥例(11)都有問題。像這樣的問題,在概率語法模型中就不存在困難。只需要說quake 的不及物用法概率很高、及物用法概率很低,就可以了??梢?,概率化的訓練模型可以比范疇化的無訓練模型更好地表示自然語言。正因為合語法性并不是范疇化的、確定性的判斷,而是概率性的,所以,花時間觀察真實語料中的例句是值得的。觀察跟直覺在科學研究的歷史中并不相悖。只不過,從來都是觀察,而不是直覺,在科學研究中占據(jù)主流地位。

        考慮到ChatGPT 是一個基于統(tǒng)計的概率模型,我們嘗試檢測它對于例(11)的合語法性的判斷能力:

        筆者:請把英語句子“It quaked her bowels.”翻譯成漢語。這個英語句子可以說嗎?表達什么意思?符合語法嗎?

        ChatGPT:這個英語句子“It quaked her bowels.”在語法上是合法的,但是這樣的表達并不常見,而且可能被認為是相當生硬或過于直白。這句話的字面意思是“它震動了她的腸道?!保@種表達方式通常不是文學作品或正式場合中常用的表達方式。在文學或書面表達中,人們更傾向于使用更為文雅或隱晦的方式表達相似的感覺,以避免使用過于直接或生理的描寫。因此,這個句子在某些語境下可能會引起不適或被認為是不雅的。如果你能提供更多上下文,我可以幫你找到更適當、更自然的表達方式。

        可見,就此而言,基于概率的語法模型比基于范疇的語法模型更加靈活;我們實在沒有理由把對自然語言的“精確描寫”和“科學解釋”對立起來。并且,在科學探索的過程中,描寫事實通常比理論解釋更加基本和重要。比如,進化論的奠基人達爾文以創(chuàng)立了富有洞察力的理論而聞名;但是,他更強調“精確描寫”的重要性。物理學家費曼也說過:“物理學可以不需要證明而進步,但沒有事實則不可能進步?!保ㄞD引自Norvig 2011)

        六、“原則與參數(shù)”范式下的范疇語法及其困境

        喬姆斯基一向追求語言學理論的簡潔與優(yōu)美,而刻畫語言數(shù)據(jù)的統(tǒng)計概率模型在數(shù)學上勢必是非常復雜的,因此,他從心底里不喜歡基于統(tǒng)計概率的語言模型。喬姆斯基早期的語法理論強調語言是一個受規(guī)則支配的系統(tǒng),后來又明確區(qū)分語言能力和語言運用兩個層面:前者指語言使用者由遺傳獲得的內在的語言知識,其理論概括就是普遍語法;后者指語言能力在一定語境中的具體實現(xiàn),其外在表現(xiàn)就是語言數(shù)據(jù)。他認為語言學應該研究語言能力,普遍語法可以理論化為數(shù)目有限的原則與參數(shù)(詳見Chomsky amp; Lasnik 1993)。比如,在代詞脫落(pro-drop)這個參數(shù)上,西班牙語的取值是1(即“真”,true), 而英語的取值是0(即“假”,1)(詳見Chomsky 1981)。因此,表示“我餓了”的意思,英語必須說“I’m hungry”,代詞主語不能省略;而西班牙語中必須說“Tengo hambre”(字面上相當于“have hunger”),做主語的代詞Yo 脫落了。依此類推,如果我們可以找到描述所有語言的為數(shù)不多的一系列參數(shù),并且確定每個參數(shù)的具體取值,那么我們就真的理解了語言了。

        對此,Norvig(2011)指出,問題是語言的現(xiàn)實情況比這個理論要雜亂得多。其實,英語中也有代詞脫落現(xiàn)象。例如:

        “Not gonna do it. Wouldn’t be prudent.” (Dana Carvey, impersonating George H. W. Bush)

        “Thinks he can outsmart us, does he?” (Evelyn Waugh, The Loved One)

        “Likes to fight, does he?” (S.M. Stirling, The Sunrise Lands)

        “Thinks he’s all that.” (Kate Brian, Lucky T)

        “Go for a walk?” (countless dog owners)

        “Gotcha!” “Found it!” “Looks good to me!” (common expressions)

        語言學家可以為如何解釋上面這些現(xiàn)象爭論個沒完沒了。但是,語言的多樣性似乎遠比用布爾值(true or 1)來描述代詞脫落的參數(shù)值要復雜。一個理論框架不應該把簡單性置于反映現(xiàn)實的準確性之上??梢姡x散的范疇語法對于語言參數(shù)的取值一般是正反二元對立的,沒有給連續(xù)性的概率取值留下任何空間。

        Norvig(2011)分析了喬姆斯基為什么要這樣做的原因。第一,他的哲學理念是:我們應該關注深層的“為什么”(why,比如:為什么只有人類才具有語言能力?),只解釋表層的現(xiàn)實(how, 比如:我們聽到和看到的單詞、句子或人際交流等語言運用)是不夠的。第二,他一直把注意力放在了語言的生成性上。從這個方面來說,非概率性的理論是合理的。如果他把注意力放在語言的另一面“理解(解釋)”上,那么他或許會改變他的說法。在“理解”這一面,聽話人需要對收到的信號進行消歧,決定哪種可能的解釋概率最高。a 這很自然地會被看作一個概率問題。語音識別的研究者是如此看待對語音的解釋的,其他領域的研究解釋的科學家也是如此的。第三,他更喜歡把語言學看作數(shù)學。喬姆斯基(Chomsky 1965 :4)說:“語言學理論是心理的,關心的是比實際行為更基礎的心理現(xiàn)實。觀察語言的實際應用或許可以提供一些證據(jù),但是并不能構成語言學的主題?!逼浔澈蟮膿目赡苁牵喝绻P注語言運用和采用統(tǒng)計模型,那么就會讓語言學成為一門經(jīng)驗學科,而不是形式科學的數(shù)學。但是,我們無法想象物理學家拉普拉斯(Pierre-Simon Laplace)會說,觀察行星的運動不能構成軌道力學的主題。物理學家會研究理想的、從實際世界中抽象出來的力學(比如,忽略摩擦力),但是這并不意味著摩擦力不能成為物理學的研究主題。

        Norvig(2011)的結束語同樣是發(fā)人深省的:

        語言是復雜的、隨機的、不確定的生理過程,受到進化和文化變遷的影響。構成語言的不是一個外在的理想實體(由少量的參數(shù)設定),而是復雜處理過程的不確定的結果。因其不確定性,用概率模型來分析語言就是必然的選擇。

        顯而易見,語言現(xiàn)象的實際情形(真相)遠比任何語法學理論模型復雜。當離散的、非此即彼的、擅長定性描述的范疇語法,遇到復雜的、隨機的、不確定的語言現(xiàn)象時,難免會捉襟見肘。因此,基于規(guī)則的自然語言處理路徑被基于統(tǒng)計概率的語言模型取代,也就是不可避免的大趨勢了。

        七、智識上的分歧:句法優(yōu)先還是語義優(yōu)先?

        在認知科學界,不贊成喬姆斯基語言學路線的大佬也不乏其人。比如,同為麻省理工學院著名教授的計算機科學家馬文·明斯基。不知道是出于個人認識還是政治因素,明斯基對喬姆斯基的語言學理論頗有微詞。說起來,這兩位科學家都精通數(shù)學,都提出了有關基本心理過程的理論;并且,他們都在1950 年代后期推動了認知科學和人工智能的興起和繁榮,都稱得上是認知科學和人工智能的重要奠基者。但是,也許是出于深刻的智識上的分歧,也就是對適合于理解心智的目標和方法存在著根本性的差異,他們對于語言學首先應該干什么,有著截然不同的見解:明斯基更加關注的是語言所能實現(xiàn)的功能,而不僅僅是它的結構。因此,他埋怨喬姆斯基太過專注于句法,以至于一度幾乎將語義問題完全排除在語言學之外;結果,一個重要的研究領域(語義學)被一個相對不重要的領域(句法學)取代了。對于明斯基來說,這是根本沒理解問題的正確起點(即甚至沒有提出正確的問題,“not even have the problem statement right”)。他認為喬姆斯基被抽象的數(shù)學所迷惑,而忽略了更有趣、更實質的問題,即意義和機制是如何相互關聯(lián)的。

        明斯基的議論在很大程度上觸及了語言學和/ 或語言信息處理是句法優(yōu)先還是語義優(yōu)先的問題。就語言信息處理而言,鮮有倚重句法的模型或系統(tǒng)獲得成功的先例;而像ChatGPT 等語言大模型成功的關鍵是倚重語義,特別是通過基于分布式語義學的詞向量嵌入表示〔詳見袁毓林(2022,2023)及其所引文獻〕。這從工程應用的角度,給語言學理論研究的取向和側重點的選擇,提供了一個反思的維度和衡量得失的參照。

        不過,對于喬姆斯基來說,語言是一個心智的計算系統(tǒng),其主要功能是思維,而不是交際。他堅持認為,交際是語言的次要的、附帶的功能(詳見史有為 2022)。因此,語言學的研究對象不是語言運用,即我們能看到和聽到的單詞、句子或人際交流行為;而是人類內在的語言能力,即一種潛在于人類心智中的普遍語法,是所有語言共享的一種幾乎肯定是通過進化而融入我們的生物學的結構。他假設這種結構的核心和基本特征是遞歸,即能夠無限地在短語中嵌套短語,從而表達思想之間的復雜關系(比如“湯姆說| 丹聲稱|| 諾姆相信……”)。因此,喬姆斯基的生成語言學必然是句法優(yōu)先的。

        但是,挑戰(zhàn)性的事實是人類學家和田野語言學家丹尼爾·埃弗雷特(Daniel Everett)發(fā)現(xiàn)了一種亞馬孫語言,即皮拉罕語(Pirah?),它不具備遞歸性。例如:

        (12)a. 男人打我。男人壞。

        b. 打我的男人壞。

        (13)a. 月亮是綠奶酪做的。彼得說。約翰說。

        b. 約翰說彼得說月亮是綠奶酪做的。

        (14)a. 你喝酒。你開車。你進監(jiān)獄。

        b. 如果你喝酒開車,那么你會進監(jiān)獄。

        (15)a. 給我?guī)б恍┽斪踊貋?。丹買了那些釘子。它們都是一樣的。

        b. 把丹尼爾買的釘子給我?guī)б恍┗貋怼?/p>

        在皮拉罕語中,沒有b 這種嵌套式的遞歸結構,只能說成a 這種平鋪開來的一組句子。正如Futrell etal.(2016)所指出的:有些現(xiàn)代人類語言的層級結構低于喬姆斯基推測的層級結構。

        對此,信從喬姆斯基理論的人當然可以理直氣壯地回應稱:即使皮拉罕語沒有遞歸,這對普遍語法理論也毫無影響。因為這種能力是內在的,即使它并不總是被利用。正如喬姆斯基及其同事在一篇合著論文中所說:“我們的語言能力為我們提供了構建語言的工具包,但并非所有語言都使用所有工具?!保‵itch et al. 2005)對此,Okrent(2017)敏銳地指出,這關系到的不是埃弗雷特對喬姆斯基理論的挑戰(zhàn),而是喬姆斯基對科學方法本身的挑戰(zhàn)。因為,根據(jù)哲學家卡爾·波普爾(Karl Popper)的可證偽性準則:理論除非具有被證偽的潛在可能性,否則就不是科學。如果你聲稱遞歸是語言的基本特征,并且無遞歸語言的存在并沒有推翻你的主張,那么還有什么可能使它無效呢?是啊,一個不能被事實反駁的理論,還稱得上是一種科學理論嗎?語言學還到底是不是一門科學啊?該不會是一門哲學或一種宗教吧?這是不是有一點兒細思極恐???

        2007 年,在接受Edge.org 的采訪中,埃弗雷特說,他給喬姆斯基發(fā)了一封電子郵件:“普遍語法做出了什么我可以證偽的單一預測?我怎么測試它?”據(jù)埃弗雷特稱,喬姆斯基回答說:“普遍語法并不做出任何預測。它是一門研究領域,就像生物學一樣。”(引自Okrent 2017)如果情況屬實,那么就徹底刷新了我們對于普遍語法的固有認知:普遍語法是一種關于語言能力的理論。難道這是為了逃避可證偽性測試而臨陣換將和改旗易幟嗎?

        事實上,不僅是遞歸,而且“合并”(merge)這種普遍語法的句法操作,即把兩個成分組合成一個更大的成分,也不是所有語言都采用的。比如,埃弗雷特和芭芭拉·克恩(Barbara Kem)宣稱:合并理論對亞馬孫的瓦里語(Wari)做出了錯誤的預測;語言學家雷·杰肯道夫(Ray Jackendoff )和伊娃·維滕堡(Eva Wittenburg)宣稱:在印尼廖內語(Riau)中尋找合并操作是徒勞的(詳見Everett2017)。這說明,合并可能是人類語言的一種重要的類似二進制的句法操作,但是不一定是人類語言的必不可少的結構基礎。反過來,對于語言來說,更加重要的是語言形式的意義和交際者之間的互動,而不是語言的結構及其抽象的運算方式。也就是說,語義研究可能比句法研究更加重要。

        八、結語:我們能夠從中得到什么教訓?

        技術進步的速度常常會超出業(yè)內資深專家們的估計。比如,在距今不遠的那些歲月中,曾經(jīng)有過下面這些信心爆棚、信誓旦旦的預判(引自Jason 2024):

        1. 高速行駛的鐵路火車是不現(xiàn)實的,因為,乘客會由于車速太快不能呼吸,窒息而死。——狄奧尼修斯·拉德納(1793 ~ 1859),自然哲學、天文學教授,倫敦

        2. 折騰交流電是浪費時間,人們永遠也不會使用它?!旭R斯·愛迪生,1889 年

        3. 馬匹不會過時,而汽車只是流行一時的新奇事物。——美國密歇根州儲蓄銀行總裁,1906 年

        4. 全世界所需要的計算機大概是……五臺?!狪BM 公司,1943 年

        5. 過了一開始的6 個月,電視就不會再有任何市場了,人們很快就會厭倦每天晚上盯著一個膠合板做的盒子。——二十世紀??怂垢吖苓_里爾·扎納克,1946 年

        6. 人們沒有理由想要在家里擁有一臺電腦?!獢?shù)字設備公司總裁肯·奧爾森,1977 年

        7. 移動電話不會取代固定電話?!R蒂·庫珀,1981 年

        8. 我預測互聯(lián)網(wǎng)很快將成為壯觀的超新星,而到1996 年就會遭遇災難性的崩潰。—— 羅伯特·梅特卡夫,1995 年

        9. 不支持3G,造價高,而且連最起碼的摔落測試都沒能通過,不太可能對諾基亞構成威脅?!Z基亞工程師對第一代iPhone 的評估報告,2007 年

        后來的現(xiàn)實當然是:這些預言家被事實無情地啪啪打臉,有時簡直讓當事人無地自容。同樣,當許多語言學家以為基于統(tǒng)計的概率模型無法真正刻畫自然語言時,ChatGPT 等基于統(tǒng)計概率的大語言模型卻大獲成功。從中,我們語言學家能夠得到哪些經(jīng)驗和教訓呢?

        關于經(jīng)驗和教訓,粗略地說,至少有下面幾點。(1)ChatGPT 等現(xiàn)代大語言模型基于深度神經(jīng)網(wǎng)絡,在詞語的嵌入式向量表示和轉換器的注意力機制等的加持下,能夠超越馬爾可夫過程模型的有限狀態(tài)的轉移網(wǎng)絡,來捕獲語句中不同詞語之間長距離的依存關系,從而達到接近于人類水平的語言生成與理解。(2)ChatGPT 等現(xiàn)代大語言模型基于海量文本語料的訓練,通過詞向量進行語言上下文關系等知識的壓縮,能夠隱式地學習基本的句法和語義知識,從而能夠理解、識別和生成“Colorlessgreen ideas sleep furiously.”之類經(jīng)典的句法合格但語義異常的句子。(3)對語言的“精確描寫”和“科學解釋”并不對立,并且前者比后者更加重要,因為對語言的科學解釋必須建立在對語言的精確描寫的基礎上。比如,ChatGPT 等現(xiàn)代大語言模型通過學習海量文本語料中的詞語與句式的概率分布,相當于達到了對某種語言的精確描寫,以至于連人類文本中的各種偏見和刻板印象都習得了;然后通過集束搜索等采樣解碼策略來預測下一個詞語,最終達到語言的生成和理解〔居然還是通過生成來達到理解(詳見Radford et al. 2018)〕。因此,從某種意義上講,現(xiàn)代大語言模型本身就可以看作一種關于語言運用的科學理論。(4)人類自然語言由眾多的社會成員使用,內部難免參差不齊,對于有關句子的合語法性和可接受性也不會有整齊劃一的標準。因此,生成語法學的“原則與參數(shù)”范式下的范疇語法,對于描寫人類自然語言肯定有不可克服的困難。(5)從語言的交際功能這種實際用途出發(fā),無論是語言生成還是語言理解,都是以意義為中心的;相應地,語法學的研究取向可能不應該是“句法優(yōu)先”,而應該是“語義優(yōu)先”。只要想一下在人類進化的漫長征途中語言的形成過程,就可以明白:首先得有一批人類文化所創(chuàng)造的概念(意義)跟社會認同的形式(語音)相結合的象征符號,然后才有怎樣讓多個象征符號合并和組合成符號串的句法。正如Luuk amp; Luuk(2014)所指出的:句法最初是從符號連接開始發(fā)展的,然后從單純的連接發(fā)展到嵌入語法。(6)語言學家從語言大模型的成功中獲得的最大經(jīng)驗與教訓是:對能夠直接觀察的語言事實(我們每天都說的單詞、句子等)的準確描寫,遠比對不能直接觀察的語言能力及其本質(一種特定于語言和人類的抽象特性等)的解釋更為基本。前者可以用語料和大語言模型來驗證并且支持有關的教學和工程應用,后者則不容易證偽并且容易陷于“確認偏差”(confi rmation bias,即傾向于發(fā)現(xiàn)有利于自己先前所持的信念、假設或理論的證據(jù),而忽略對自己不利的證偽性數(shù)據(jù)、事實或理論)。當然,也不排除這樣一種可能性:前者囿于語言的表面現(xiàn)象而失去關于語言本質的洞察力,后者則開辟了一條通向認識語言(和人類及其思維)本質的光明大道。另外,在計算技術和數(shù)學模型面前,我們應該保持足夠的謙遜!因為,語言技術變革的速度、效力和前途,可能會比人們通常預想的更快、更高和更遠!

        參考文獻

        史有為 2022 《從喬氏對答談語言的思維功能》,微信公眾號“西去東來中傳站”,2022?10?25。

        袁毓林 2022 《在人類生境約束下思考語言的設計原理和運作機制》,《語言戰(zhàn)略研究》第6 期。

        袁毓林 2023 《超越聊天機器人,走向通用人工智能——ChatGPT 的成功之道及其對語言學的啟示》,《當代語言學》第5 期。

        袁毓林 2024 《ChatGPT 等大型語言模型對語言學理論的挑戰(zhàn)與警示》,《當代修辭學》第1 期。

        Chomsky, N. 1956. Three models for the description of language. IRE Transactions on Information theory (Volume 2, Issue 3),113?124. Chomsky, N. 1957. Syntactic Structures. The Hague: Mouton.

        Chomsky, N. 1965. Aspects of the Theory of Syntax. Cambridge, MA.: MIT Press.

        Chomsky, N. 1969. Some empirical assumptions in modern philosophy of language. In Philosophy, Science and Method: Essays in Honor or Ernest Nagel. St. Martin’s Press.

        Chomsky, N. 1981. Lectures on Government and Binding. De Gruyter.

        Chomsky, N. 2023. The False Promise of ChatGPT. New York Times, Mar. 8, 2023.(《喬姆斯基:ChatGPT 的虛假承諾》,微信公眾號“語言治理”,2023?03?10,https://mp.weixin.qq.com/s/e9KDOZ3vwd10PFvH6hbtmg ;《終于,喬姆斯基出手了:追捧ChatGPT 是浪費資源》,微信公眾號“機器之心”,2023?03?10,https://mp.weixin.qq.com/s/MyiLZYE_hcL27i_qtm7lSA。)

        Chomsky, N. amp; H. Lasnik. 1993. Principles and parameters theory. In J. Jacobs, A. von Stechow, W. Stemefeld, amp; T.Vennemann (Eds.) Syntax: An International Handbook of Contemporary Research. Berlin: de Gruyter.

        Everett, D. L. 2017. How Language Began: The Story of Humanity’s Invention. New York · London: Liveright Publishing Corporation.(《語言的誕生:人類最偉大發(fā)明的故事》,何文忠,樊子瑤,桂世豪,譯,北京:中信出版集團,2020。)

        Fitch, W. Tecumseh, M. D. Hauser, amp; N. Chomsky. 2005. The evolution of the language faculty: clarifi cations and implications.Cognition 97(2): 179?210.

        Futrell, R., L. Stearns, D. L. Everett, S. , et al. 2016. A Corpus Investigation of Syntactic Embedding in Pirah?. PLoS One.https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0145289.

        Gazzaniga, M. S. , R. B. Ivry amp; G. R. Mangun. 2009. Cognitive Neuroscience: The Biology of the Mind (3rd Edn.). W. W.Norton amp; Company, Inc.(《認知神經(jīng)科學—— 關于心智的生物學》,周曉林,高定國,等,譯,北京:中國輕工業(yè)出版社,2011。)

        Hinton, E. G. 2024.《數(shù)字智能會取代生物智能嗎?》,2024 年2 月19 日于牛津大學的公開演講,衛(wèi)劍釩,編譯,微信公眾號“衛(wèi)sir 說”,2024?03?08,https://mp.weixin.qq.com/s/u72sPc0PxwIaQBFK-TCKJw。

        Jason. 2024.《從GPT-5 是什么說起》,微信公眾號“信息平權”,2024?01?21,https://mp.weixin.qq.com/s/1uKg8QulI7AmWLqS9Q8toA。

        ……

        (因版面不足,以下參考文獻從略,可在中國知網(wǎng)上閱讀、下載完整版)

        責任編輯:王 飆

        猜你喜歡
        句法語義語言
        句法與句意(外一篇)
        中華詩詞(2021年3期)2021-12-31 08:07:22
        述謂結構與英語句法配置
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        語言與語義
        句法二題
        中華詩詞(2018年3期)2018-08-01 06:40:40
        讓語言描寫搖曳多姿
        詩詞聯(lián)句句法梳理
        中華詩詞(2018年11期)2018-03-26 06:41:32
        累積動態(tài)分析下的同聲傳譯語言壓縮
        “上”與“下”語義的不對稱性及其認知闡釋
        我有我語言
        亚洲久无码中文字幕热| 夜夜躁狠狠躁2021| 亚洲一区中文字幕在线电影网 | 中国丰满人妻videoshd| 日韩性爱视频| 东京热人妻一区二区三区| 最新国产乱视频伦在线| 国产一区二区三区4区| 人妻中文字幕一区二区三区| 最新露脸自拍视频在线观看| 全球中文成人在线| 久久久久久av无码免费看大片| 久久精品国产亚洲AV香蕉吃奶| 亚洲av一区二区在线| 乱子轮熟睡1区| 亚洲国产精品特色大片观看完整版 | 日本视频一区二区三区在线观看| 一区二区三区中文字幕| 精品高潮呻吟99av无码视频| 亚洲伊人久久成人综合网| 91蜜桃精品一区二区三区毛片| 国产精品自拍盗摄自拍| 国产亚洲美女精品久久久2020| 国产露脸精品产三级国产av | 亚洲色偷偷色噜噜狠狠99| 色琪琪一区二区三区亚洲区| 喷水白浆视频在线观看| 欧美成人国产精品高潮| 久久精品中文字幕一区| 亚洲自拍另类欧美综合| 全程国语对白资源在线观看| 美女视频黄是免费| 亚洲∧v久久久无码精品| 亚洲免费毛片网| 精品国产黄一区二区三区| 免费久久人人爽人人爽av| 国产精品久久码一区二区| 白白在线免费观看视频| 国内少妇毛片视频| 亚洲男同志网站| 少妇熟女淫荡丰满|