摘 要:長久以來,作為人工智能的關(guān)鍵問題,自然語言理解的發(fā)展一直局限于以詞匯、句法、語義、語用的分析為基礎(chǔ)。無論是機器翻譯,語料庫研究,語篇理解研究,還是概念層次網(wǎng)絡(luò)理論,只是研究形式不同,究其根本都是在進行語言規(guī)則與統(tǒng)計的研究,都未能脫離傳統(tǒng)模式的束縛。本文突破傳統(tǒng),從信息屬性著手,提出了信息耦合屬性概念。
關(guān)鍵詞:自然語言理解;人工智能;信息耦合
自然語言理解是人工智能的一個重要分支。國外自然語言理解研究較早,也誕生了諸多較有影響的理論。自二十世紀50年代以來,在眾多語言學家、邏輯學家、心理學家等的努力下,各種關(guān)于自然語言理解的理論體系紛紛誕生。其中較有影響的有:轉(zhuǎn)換生成語法、依存語法、語義網(wǎng)絡(luò)、蒙塔鳩語法、擴展轉(zhuǎn)換網(wǎng)絡(luò)、系統(tǒng)語法、格語法、概念依存理論、境況語義學等。近年來,語料庫語言學又得到迅速發(fā)展。國內(nèi)自然語言理解研究起步較晚,要從二十世紀70年代末算起。早期階段以語形分析為主,中期及中后期開始注重語義分析并開始探索基于語料庫的統(tǒng)計方法。近期則語料庫統(tǒng)計與規(guī)則分析并重。
對于自然語言理解,從國際上看當前的問題主要表現(xiàn)為,一方面是哲學,認知科學,思維科學和心理學等學科所研究的層次太高,太抽象,宏觀與微觀隔離,提出的方案根本無法付諸具體實施;另一方面是,一直局限于以語法、語義、語境研究為基礎(chǔ)的應(yīng)用語言學所研究的層次太低,談不上是真正的自然語言理解。就國內(nèi)而言,其特點是:課題比較分散,應(yīng)用項目偏多,基礎(chǔ)研究比例略少;選題時,容易跟著國外的選題走,立項論證時,關(guān)鍵考慮國外怎么做,很多課題沒有取得理論上的突破。
總的來看,無論是國外的研究還是國內(nèi)的探索,各種自然語言理解方法理論體系歸根結(jié)底都毫無例外地遵循下面的原則:1.把所需要研究的語言問題形式化。2.找出解決問題的相應(yīng)算法。
然而審視問題角度的差異常常會從根本上制約我們對事物的認知。就如同我們怎樣看待蘋果落地一樣。是蘋果天經(jīng)地義就應(yīng)該落地,就像我們已經(jīng)認知的其他萬千事物一樣,不需要再考慮,還是另有引力促成?對于自然語言理解是必須把所要研究的語言問題形式化,得出其相應(yīng)算法,就像長久以來人們對其認知的情況一樣,不需要再考慮,還是另有信息屬性促成呢?
眾所周知,計算機解決問題的關(guān)鍵是算法。但我們?nèi)祟悶橛嬎銠C賦予某種算法后,計算機也只能解決這些算法能使其解決的問題。自圖靈測試提出以來,人們想盡各種方案來解決這一難題。但人們最終發(fā)現(xiàn),計算機執(zhí)行命令是必須要有算法的,只要計算機按照一定的算法去執(zhí)行一定的命令,那么似乎它就永遠也不可能突破圖靈測試,無法實現(xiàn)真正的自然語言理解。除非有一種算法,這種算法可以使計算機像人類一樣接收外界萬事萬物的信息,并對其做出自主的反應(yīng)。然而,當前來看,這似乎是不可能的。因為外界萬事萬物的信息數(shù)量是無限的,其變化發(fā)展亦是無限的。我們根本無法找出所有信息的特點及信息與信息之間的關(guān)系,并將其賦予計算機,使得計算機能夠?qū)θ魏涡畔⒆龀龊侠矸磻?yīng)。
從算法的角度看,人的智能是靈活無限的,而計算機只能按照人編排好的算法去執(zhí)行有限的命令。目前,尚無一種算法能夠完成對所有事物關(guān)系的認知。只要我們賦予計算機以一定的算法,就無法使其真正智能化。而沒有算法,計算機解決問題就無從談起。除非能找到一種無算法算法,才可能使其從根本上有所突破,否則就談不上是真正的自然語言理解。而這聽起來就是矛盾的。
那么,從審視計算機的角度來看,人腦的智能應(yīng)是何來呢?是人腦中天生就存有宇宙中所有事物的關(guān)系,所以才有著無限的認知能力么?顯然,這是荒謬的。那么,人是如何能了解宇宙萬物的呢?既然不是內(nèi)有,那么就一定是外來。這些關(guān)系一定存在于事物信息之中。
如果事物關(guān)系是存在于信息自身當中,那么就恰恰為無算法算法的實現(xiàn)提供了充分必要條件。所謂無算法算法,其中算法就是指賦予計算機以一定的算法去處理信息,無算法就是對于外部世界無限數(shù)量的具體信息間的邏輯關(guān)系與處理方案,是根據(jù)信息耦合屬性,從信息自身中去提取而不是人為去賦予。
那么,信息在什么結(jié)構(gòu)環(huán)境下,怎樣交互作用才會解出事物關(guān)系呢,這會不會是一種極為復(fù)雜的情況呢?有人認為,在對人腦沒有透徹的了解之前,無法實現(xiàn)真正的智能。這就好比是在說,在沒有找到能飛上月球的鳥進行研究之前,人類是不可能制造出登月飛船的。
試想,人類是在自然環(huán)境下進化而來的。這是個極為緩慢的過程。從單細胞生物開始,到目前經(jīng)歷了數(shù)十億年,生物體長久以來絕大部分機能還只是用在維系生命體的存活上了。萬千生物當中,目前,也只有人類一種生命體達到了智能的水平。因此,從歷史的角度來看,智能到目前為止還應(yīng)該是一個基于生物性基礎(chǔ)上萌發(fā)的一個相對極為簡單而絕非復(fù)雜的事物才對。
對于自然語言理解,之所以長久以來找不到能真正解決問題的答案,問題在于前提條件的錯誤。人們假定了這樣前提條件,計算機在什么條件下執(zhí)行什么樣的命令要由人來預(yù)先指定,接下來一切對于答案的努力都是基于這個錯誤的前提下進行的,因而找不到答案。
[參考文獻]
[1]馮志偉.機器翻譯研究[M].北京:中國對外翻譯出版公司.2005.
[2]黃昌寧.統(tǒng)計語言模型能做什么?[J].語言文字應(yīng)用,2002,1.
[3]黃曾陽.HNC理論概要[J].中文信息學報.1997,11.
作者簡介:胡振波(1979.6-),男,吉林省舒蘭市人,學歷:碩士,專業(yè):英語語言學,研究方向:應(yīng)用語言學。