王寧 張世傳
【摘要】人工智能語言存在表達生硬、分析固化及話輪轉(zhuǎn)換滯后等問題,原因在于其自然語言處理機制對自然語言理解不足,過度依賴書面語料進行分析。在不改變語料類型的前提下,關(guān)鍵在于理解并優(yōu)化書面語與口語之間的轉(zhuǎn)換。本文結(jié)合語言學(xué)與人工智能理論,探討了文字和語言的關(guān)系,分析了人工智能語言與人類語言的差異,并給出相應(yīng)建議,即人工智能應(yīng)重視語境分析與應(yīng)用,基于數(shù)據(jù)庫解析的“最優(yōu)解”未必適應(yīng)靈活的話語空間,同時,對話中上下文聯(lián)系也應(yīng)得到關(guān)注。
【關(guān)鍵詞】語言;文字;人工智能;ChatGPT
【中圖分類號】H021? ? ? ? ? ? 【文獻標識碼】A? ? ? ? ? ?【文章編號】2096-8264(2024)22-0134-03
【DOI】10.20024/j.cnki.CN42-1911/I.2024.22.041
一、引言
人工智能的語言生成能力受限多種因素,如語料規(guī)模和類型。書面語因其易總結(jié)應(yīng)用,被AI廣泛采用,而口語則因難以模仿,較少被采用。文字作為書面語的載體,在口語表達中有局限。當前,對如何利用文字表達語言的理解已深化。本文探討將“文字生動表示語言”的理論應(yīng)用于“AI語言生成問題”的可行性。
語言障礙已成為21世紀全球化發(fā)展的制約因素。因此,讓計算機理解自然語言,實現(xiàn)自動化處理和個性化服務(wù),是國際前沿研究,也是全球共同目標。[1]在ChatGPT廣泛應(yīng)用下,袁毓林(2023)提出語言學(xué)研究應(yīng)轉(zhuǎn)向以數(shù)據(jù)/計算密集型為主要構(gòu)造對象的第四、第五范式,為語言學(xué)發(fā)展指明方向。
有學(xué)者認為,人工智能與人類有本質(zhì)區(qū)別,前者學(xué)習(xí),后者創(chuàng)造。然而,這與創(chuàng)造AI的初衷不符。盡管ChatGPT改善了以往AI語言的產(chǎn)力、話語死板、用詞單一、句法簡單等問題,但如何使其更接近人類語言仍待解決。原因在于語言和文字的本質(zhì)。
二、書面語系統(tǒng)與口語系統(tǒng)的區(qū)別
(一)書面語系統(tǒng)
書面語是文字書寫的產(chǎn)物,用于記錄語言。文字的出現(xiàn)就是為了記錄語言,于省吾提到,文字起源于原始社會,初衷是簡單記錄事物,防止遺忘。隨著階級形成和國家出現(xiàn),生產(chǎn)力提升,人事繁雜,文字逐漸用于記錄語言。[2]文字從語言獨立成符號后,相較于語言,延長了思維時間,并經(jīng)歷了簡化過程,導(dǎo)致書面語與口語差異。
人工智能語言代碼的輸入與輸出的機制構(gòu)想是摹仿人腦對語言的輸入與輸出進行架構(gòu)的,人所使用的是人腦,人工智能所使用的是自然語言處理機制,這是言語產(chǎn)出是否能符合語言的根源。文字是表達于書面的通過大腦加工后的語言代碼,包括表音文字、表意文字和符號等類型,這些存在于視覺、聽覺等感知下的文字與語言之間的變換是人工智能需要關(guān)注的重要一環(huán)。我們要清楚地認識到,人工智能的代碼輸入和輸出機制與人類的語言解析和產(chǎn)出并不完全一致(雖然我們是這樣預(yù)想的),而是與文字的表述模式有一定的相關(guān)性。因此,當回答“人工智能所發(fā)出的語言如何才能更像人的語言”這個問題時,關(guān)鍵之處在于如何使得文字的表述更接近以至于成為“真實的”語言。
(二)口語系統(tǒng)
口語是語言的表達形式,人類依賴語言進行思考和交流。言語是心理現(xiàn)象,是人類運用語言的行為。起初,言語無固定規(guī)則,但隨著社會共同語言的出現(xiàn),受到制約,但仍保持自由生成性,為語言更新提供動力。大腦是言語接收與發(fā)出的中樞[3],語言信息處理依賴詞匯和語法。
在普通語言學(xué)中,存在兩個基本的觀點:第一,語音是語言的本質(zhì),文字是語言表達的輔助工具。第二,語言的存在先于語法,語法是對語言規(guī)律的滯后總結(jié)與歸納[4]。對于第一種觀點,文字是大腦組織語言思維后的視覺映射,傳遞視覺圖像和字義;語言則是思維組織輸出為聽覺的聲響,傳遞語音序列和語義。這種差異導(dǎo)致語言受語境、心理等因素影響,文字受書寫、表達方式等影響。
第二種觀點中,“滯后”包括歷時和共時的雙向滯后。語法對新生語言的控制力逐漸減弱,如古代漢語語法不適用于現(xiàn)代漢語。嚴格遵循語法規(guī)律創(chuàng)造語言,忽略語境、用詞和語氣,會導(dǎo)致聽眾難以接受,如人工智能回答問題時過于死板。
(三)人工智能語言分析
人工智能語言追求準確性,因此其表達更為正式,易于識別與人類語言的差異。人類語言反映思維,聽話者可判斷說話者狀況;而人工智能語言依賴于程序等,僅反映不完美的語法系統(tǒng),難以實現(xiàn)人機語言融合。如某人言:“我該得的那個,你付都多了,我該得的應(yīng)該得,這里拿多掉了?!彪m語法錯誤,但人類能理解。這是因為非規(guī)范語言具有真實感,聽話者可根據(jù)說話者身份、心理等進行判斷。而人工智能缺乏這種能力。此外,這種語言難以文字表達,因文字需更多大腦加工。楊立昆(2022)認為,語言僅承載人類知識一小部分,大部分知識和動物知識非語言(非象征符號的)。[5]但人工智能語言具有強制正確性,輸入輸出固定,表達受限。能否將人類語言轉(zhuǎn)移至人工智能?可從漢語獨特性入手。
三、如何用書面語語料表現(xiàn)口語
當模仿物缺少必要現(xiàn)象,即失去了“靈魂”。常說漢語缺少形態(tài)變化,語序和虛詞至關(guān)重要。人工智能的自然語言處理不僅需要理解語序、虛詞帶來的差異,更要理解在某些情況下語序與虛詞的改變在意義表達不會產(chǎn)生任何影響這一人類語言理解特征。
(一)語序
語序是一種語法手段,但卻不一定會改變意義的表達。例如下面的兩個句子:
(1)你淋著雨沒有/雨淋著你沒有
(2)肉末夾燒餅/燒餅夾肉末
例(1)同義,例(2)異義。例(1)前句,在實際語言環(huán)境中的使用更傾向于詢問“你”的感受,身上是否被雨打濕;后句則更傾向于對“雨”效果的詢問,雨有沒有被你躲開。例(2)前句給人以肉包裹著燒餅,肉多的心理體驗;后句則是燒餅為主,夾縫中有肉末,讓人覺得肉少。
問ChatGPT兩者區(qū)別,AI回答:兩種表達方式主語和語序不同,但含義相同,并以系統(tǒng)中所保存的“著”表示“現(xiàn)在”的依據(jù)作出這兩句話是在詢問“正在”發(fā)生的事情。實際中,“著”在此句中僅起結(jié)構(gòu)助詞作用,對語義無影響。
在進一步對ChatGPT進行詢問的回答中更為明顯:
問:這兩種表達方式都只能表示“正在”嗎?
答:對的,這兩種表達方式通常用來詢問對方當前的狀態(tài)或情況。它們都含有“正在”的意思,即詢問是否在某個特定的時間點或時間段內(nèi)正在被雨淋著。請注意,這些表達方式強調(diào)的是持續(xù)性的動作或狀態(tài),而不是雨是否曾經(jīng)淋過你或你曾經(jīng)淋過雨。
人工智能僅僅以‘“著”表示現(xiàn)在,不表示過去或未來這一程序代碼為依據(jù),對于語境與事實置若罔聞,在實際語言環(huán)境中,若是下雨后問對方是否淋雨了,也會以這種方式進行詢問。詢問發(fā)出的時間是現(xiàn)在,對象也是現(xiàn)在,而問詢的事物是過去。
ChatGPT對于例(2)的回答更是讓人啼笑皆非:
問:“肉末夾燒餅”和“燒餅夾肉末”有什么區(qū)別?
答:二者實質(zhì)相同,僅表述順序不同。通常可互換,無明顯區(qū)別。前者指切開燒餅,夾入肉末,再合上;后者是將肉末置于燒餅上,對折或卷起,使肉末被包裹。簡言之,二者皆描述同一種食物組合,順序差異而已。
首先這段話的邏輯就出現(xiàn)了語義矛盾。首句末句皆言明是同樣的食物,同樣的組合,只是順序不同,但描述時卻用不同的制作工藝技巧進行敘述,說前句是“夾有肉末的燒餅”,是半包裹狀態(tài),后句是“肉末被燒餅包裹”,是全包狀態(tài),因此得到的食物并不同。事實上,在實際語言環(huán)境中這兩種表達描述的是同一種食物,只是給人的感覺不同。前一種表述給人以肉多的心理體會,即肉包裹著燒餅;后句給人以肉少的感覺,即燒餅包裹著肉。食材的前后順序給人以食物數(shù)量多少的心理體會,就如配料表是以含量多少進行排序,排名靠前則含量更多,靠后則較少。
總之,對于語序帶來的影響應(yīng)當被準確對待,細致劃分,了解到這種表述的社會性是一個很重要的方面。
(二)虛詞
虛詞在現(xiàn)代漢語中很重要,但有時刪減不影響句意。如:
(3)買不起別買/要是買不起就別買
(4)洗干干凈凈收著/洗得干干凈凈收著
例(3)和例(4)前后句意思相同,虛詞的省略并無語義上的改變,尤其在口語中更常見。兩句在自然口語對話中并沒有顯著的區(qū)別,GPT卻過于敏感:
問:“買不起別買”和“要是買不起就別買”有區(qū)別嗎?
答:兩者微小差別?!百I不起別買”簡潔,強調(diào)行為建議,若買不起,別買。未提條件。“要是買不起就別買”較復(fù)雜,先給條件(買不起),再建議不買。語氣較靈活,可尋求替代品或改變消費習(xí)慣。核心意思相同,皆建議經(jīng)濟不允許時不購買。第二句提供條件,給人更多思考空間。
人工智能難以理解“意合法”,雖前句省略了“要是……就”,但當我們對其進行解讀時會自動加上這種關(guān)聯(lián),口語中轉(zhuǎn)換無礙。但問人工智能,由于后句增加了關(guān)聯(lián)結(jié)構(gòu),其解讀就必然會有所增加以解讀關(guān)聯(lián)詞的出現(xiàn),這種解讀是毫無必要的,更是不符合人之解讀的。
例(4)后句的“得”是句子中表示結(jié)構(gòu)關(guān)系的虛詞,但在口語中也可以不說出來,人工智能卻把注意力放在了“得”上:
問:“洗干干凈凈收著”和“洗得干干凈凈收著”有區(qū)別嗎?
答:“洗干干凈凈收著”和“洗得干干凈凈收著”的區(qū)別在于前者強調(diào)結(jié)果,后者強調(diào)過程和結(jié)果。兩者均表示洗凈后收起,但“洗干干凈凈收著”更簡潔,注重結(jié)果,而“洗得干干凈凈收著”更詳細,強調(diào)過程和結(jié)果。根據(jù)場景和喜好選擇即可。
回答單純從虛詞“得”入手進行分析,而漢語語法意合性顯著,非典型規(guī)則不易把握?!暗谩钡恼Z法功能在本句中已經(jīng)虛化,而回答反復(fù)從語法、語用角度解釋“洗”在句子中的語法作用和語用表現(xiàn),是語言規(guī)則的刻板表述,是被輸入的語法代碼的表述。這種解讀并不適用于現(xiàn)實生活,在口語中人們經(jīng)常使用省略“的、地、得”這種結(jié)構(gòu)助詞的表述方式,對于語義和表達并無影響。
總之,GPT的自然語言處理并沒有意合的“程序”。在自然口語對話中,也經(jīng)常有不理解對方意義的情況出現(xiàn),但這種情況是少數(shù),即使出現(xiàn)了,也能夠通過多次的對話去解決這個“誤會”。GPT不僅難以持續(xù)性對話,更是以高頻詞“誤解”顯現(xiàn),這是不合適的。若將詞序和虛詞作為一種自然語言的特殊現(xiàn)象對人工智能進行培養(yǎng),或許會出現(xiàn)對同一問題的不同形式而意義相同的回答,相對于同樣的死板回答來說則更顯得“人性化”。
(三)語境表現(xiàn)
從根本上說,當前系統(tǒng)只能構(gòu)建語言骨架,無法充分展示語言豐富性。嬰兒表現(xiàn)的不流暢、錯誤的發(fā)音卻可以被識別,這是因為其獨特的音調(diào)、音高、音色及氣力不足導(dǎo)致的斷句、重音。言語障礙者雖然無法通過語言被他人理解,但卻可以通過情緒感知、不斷詢問猜測到想要表現(xiàn)的意思,這是因為失語癥患者仍然具有“人”的語言能力,通過聲帶震動和肢體語言表達。這些體現(xiàn)了語言魅力和“人”的語言特點,即使不使用規(guī)范的語言,也能表達意義,這與認知和文化共鳴有關(guān),是共情和意義相通的關(guān)鍵。
總之,這些都無法通過大數(shù)據(jù)或基本方程獲得。真正“語言”的真實構(gòu)建不僅需要結(jié)構(gòu)主義語言學(xué)對操作程序的講究、轉(zhuǎn)換生成語法對結(jié)構(gòu)模式及其背后心智過程的探索,以及功能語言學(xué)基于認知科學(xué)的研究,還需要經(jīng)驗觀察,立足于“言語”事實,不能只關(guān)注局部,而忽視整體,只有兩者相結(jié)合,才能實現(xiàn)人工智能自然語言的正確發(fā)展。
深度神經(jīng)網(wǎng)絡(luò)受生物學(xué)啟發(fā),瞳孔攝入像素,大腦皮層細胞發(fā)現(xiàn)邊緣和方向,判斷物體形狀和類別。這種程序?qū)е氯斯ぶ悄茈y以真正理解運用語言,生理判斷雖似人類思維,實為簡單思維模式,這不僅包括“看山不是山,看水不是水”這樣的高度抽象思維邏輯,還包括無需思考的“習(xí)慣” ①邏輯。
語言學(xué)有一個經(jīng)典歧義問題,即:
(5)咬死了獵人的狗
說話人身處于“獵人”的尸體旁,眼睛觀測到了一幅“狗”咬死“獵人”的場景,經(jīng)過大腦的思維后,從口中對他人以語言的形式指出“這條狗是咬死了獵人的那條”這件事實,接收信息者以聽覺形式接收的信息在大腦中思索不會感覺有歧義或不解;但如果說話人以文字的形式進行書寫,接收信息者以視覺形式接收的信息經(jīng)過大腦分析后卻會得到兩種不同的理解:狗被咬死了/獵人被咬死了,以致產(chǎn)生不知所云與不明其意的困惑感。而人工智能是以文字為基數(shù),通過視覺或聽覺方式發(fā)出信息的一種傳輸系統(tǒng),其使用文字符號來表情達意,即使是以音響形式發(fā)出,也是以文字的思維邏輯原封不動地表述,這也就是為什么人工智能有時被戲稱為“人工智障”,總是與人類的語言有著顯而易見的差別感。
當今人工智能以深度學(xué)習(xí)為主要學(xué)習(xí)方法,這種學(xué)習(xí)確實會使機器獲取大量語言范式并生成語言藍本,但這種學(xué)習(xí)是由無數(shù)的人類語言組合而成的類似“共同語”的系統(tǒng),其選擇的解答也通常為“最優(yōu)解”。但在不同語言環(huán)境中,這種所謂的“最優(yōu)解”并非適合人類的思維感情。因此,對于語境的認識勢必要成為人工智能在對話中語言選擇的主要影響因素。
四、結(jié)語
書面語系統(tǒng)與口語系統(tǒng)存在現(xiàn)實差異,我們可以通過對語序、虛詞等漢語自身特點在書面語、口語上的表現(xiàn)來解決這些差異問題。這就需要我們更加深入地對自然口語對話進行研究以及對自然語言處理的研發(fā),找到更多的具有漢語特征的口語語料,與書面語語料進行對比分析,以實現(xiàn)一種數(shù)據(jù)密集型的研究范式,為語言學(xué)及人工智能語言提供進一步發(fā)展的空間。
注釋:
①例如:中國人見面后常問“吃了嗎”屬于文化邏輯,熟練使用鍵盤的人可以不看鍵盤快速打字屬于空間邏輯,人在看見美好事物的時候眼球會隨物而動屬于生理邏輯等。
參考文獻:
[1]中國科學(xué)技術(shù)協(xié)會主編,中國人工智能學(xué)會編著.人工智能學(xué)科路線圖[M].北京:中國科學(xué)技術(shù)出版社,2022:57-58.
[2]于省吾.關(guān)于古文字研究的若干問題[J].文物,1973,
(02):32-35.
[3]程琪龍.認知語言學(xué)概論——語言的神經(jīng)認知基礎(chǔ)[M].北京:外語教學(xué)與研究出版社,1999:37-38.
[4]索緒爾.普通語言學(xué)教程[M].裴文譯.上海:教育出版社,2002.
[5]楊立昆.語言的有限性決定了AI永遠無法比肩人類智能[DB/OL].https://mp.weixin.qq.com/s?_biz,2022-8-26.
作者簡介:
王寧,女,河南焦作人,碩士研究生,研究方向:漢語國際教育。
張世傳,男,河南鄭州人,碩士研究生,研究方向:漢語言文字學(xué)。