李嫣然
(河南大學(xué) 大學(xué)外語教學(xué)部,河南 開封 475004)
語義網(wǎng)是一種圖結(jié)構(gòu)的概念。同時,語義網(wǎng)也可以看作是知識表示方法。通過此類表示方法,不僅可以更好地理解語義,還可以對常識進(jìn)行推理。然而,語義網(wǎng)中也有一系列有待于提升之處,致使語義網(wǎng)的推理能力受到一定程度的限制,且難以用語義網(wǎng)表示復(fù)雜的關(guān)系。對部分語義,只通過圖構(gòu)的方式,很難使語義間的接近程度被有效表示出來。鑒于此,基于認(rèn)知語言學(xué)的自然語言語義表示方法已經(jīng)成為業(yè)內(nèi)人士亟待研究的一項重要課題。
自然語言處理是一件非常系統(tǒng)性的事項,其可以被看作是一種通訊技術(shù),在實現(xiàn)過程中需要自然語言以及計算機(jī)的輔助。在自然語言的處理中,最重要的一點,就是使計算機(jī)能夠更好地“理解”自然語言。鑒于此,自然語言又有另一種叫法,其被稱為“自然語言理解”。自然語言可看作是語言信息處理中的一部分。同時,在人工智能課題中,它也是最重要的一部分,主要研究方向為使計算機(jī)能夠更好地使用自然語言。[1]
通過計算機(jī)對自然語言進(jìn)行理解是一件頗為系統(tǒng)的事項,其可以分成兩部分:一部分是口語的理解,一部分是對書面語的理解。前者具體是指語音識別、合成以及分析等;而后者主要包括信息過濾以及機(jī)器翻譯等事項。
通過計算機(jī)對自然語言進(jìn)行有效理解的過程中,有許多需要注意的事項,主要包括以下三方面的程序:
首先,一定要明確研究對象,并將相關(guān)問題在語言層面進(jìn)行形式化,使其能夠通過數(shù)字形式被合理的表達(dá)出來。其次,將此數(shù)學(xué)形式用算法來表示,使它在計算層面更加形式化。最后,依照相關(guān)算法完成計算機(jī)程序的編寫,使其能夠在計算機(jī)上實現(xiàn)。鑒于此,在對自然語言進(jìn)行有效處理的過程中,一定要具備足夠的語言學(xué)方面的知識。除此之外,還應(yīng)具備相應(yīng)地數(shù)學(xué)層面以及計算機(jī)層面的知識,使自然語言在處理過程中,具有一定的數(shù)學(xué)性和計算機(jī)性,成為一門交叉性較強(qiáng)的學(xué)科,同時跨越文科以及理科、工科。
從語言學(xué)的層面,幾乎所有的語言都具備以下特點:1.語法。語法是構(gòu)成語言的基本規(guī)則,也代表著各相關(guān)符號之間的關(guān)系;2.語義。語義又被稱為各個符號之間的含義,也可以看作是符號以及含義之間的關(guān)系;3.語用。語用研究的方向主要是在不同環(huán)境下對語言的理解和使用。鑒于此,語言的分析以及理解并不是簡單的事項,而是具有較強(qiáng)的層次性,主要包括語匯分析以及句法分析兩方面的內(nèi)容。[2]其體現(xiàn)出的這種層次性為人們對語言本身進(jìn)行更好地理解提供了便利。
現(xiàn)階段,計算機(jī)功能還有待于提高,對自然語言的理解水平遠(yuǎn)未達(dá)到和自然人一樣的標(biāo)準(zhǔn)。據(jù)專業(yè)人士分析,即便是在未來,計算機(jī)水平也不可能達(dá)到這樣的水準(zhǔn)。在這種情況下,宜從系統(tǒng)功能的角度著眼,對輸出、輸入文本的反映引起重視,將其看作衡量計算機(jī)語言的一項最重要的標(biāo)準(zhǔn)。國外曾有認(rèn)知心理學(xué)家提出了語言理解的標(biāo)識,主要分為以下四個層面:1.對相關(guān)問題的具體回答;2.對材料摘要進(jìn)行重點提取;3.明確不同詞的語敘;4.不同語言的有效翻譯。現(xiàn)階段,隨著社會的不斷完善,計算機(jī)技術(shù)的發(fā)展日新月異,且信息全球化趨勢也不斷增強(qiáng),使自然語言的理解內(nèi)涵更加豐富。
在新時期,計算機(jī)技術(shù)以及互聯(lián)網(wǎng)技術(shù)不斷完善,人類已經(jīng)逐漸進(jìn)入信息時代。在這種情況下,計算機(jī)可處理的自然語言文本數(shù)量也得以不斷增多,且包含多方面的事項,其可在海量信息中進(jìn)行文本挖掘以及信息提取等方面的事項。在人機(jī)交互等需求不斷強(qiáng)化的情況下,自然語言處理有著非常重要的意義。同時,對自然語言進(jìn)行有效研究將會在極大程度上影響人們的生活。近年來,我國社會主義現(xiàn)代化建設(shè)不斷發(fā)展,在這種時代背景下,信息處理技術(shù)的自動化越發(fā)引起人們的重視。同時,在日常工作與學(xué)習(xí)過程中,人們所涉獵的信息,有80%是以語言文字的方式進(jìn)行記載以及傳播的。在這種情況下,自然語言的處理越發(fā)引起人們的重視。在我國的信息化以及現(xiàn)代化的過程中,自然語言的處理也有著非常重要的現(xiàn)實意義。[3]簡言之,在中文信息自動化處理過程中,漢語處理是一門非常關(guān)鍵的技術(shù),在語言處理水平得到顯著提高的情況下,我國的多個領(lǐng)域都將從中受益,包括科學(xué)技術(shù)、經(jīng)濟(jì)建設(shè)等等。反之,若是語言處理水平停滯不前,會使我國在相關(guān)方面的需求難以得到有效滿足,且逐漸落后于國際水準(zhǔn)。
在對原子對象進(jìn)行表示的過程中,可以通過數(shù)值對其語義進(jìn)行具體表示。例如,在對顏色特征的語義進(jìn)行有效表示時,基于RGB空間的三元組有著非常重要的選用價值。在三元組中,各分量的取值范圍都有一定規(guī)律,均為從0到255之間的整數(shù)。在此過程中,紅色可以用相關(guān)數(shù)值來表示。除此之外,味覺以及空間位置等和顏色大體一致,說明語義的數(shù)值空間在一維之上。除此之外,長度以及溫度、質(zhì)量等源自對象的語義可以有更直接的表示方式,通過單一維度表示即可。同時,也有極少一部分原子對象無法對其進(jìn)行數(shù)值轉(zhuǎn)化。對于此類狀況,可以通過固定的特征使語義被有效轉(zhuǎn)化成數(shù)值空間內(nèi)的一個點。如果是基本形狀對象,通過形狀邊數(shù)或是三角形的數(shù)量來明確語義不失為一種有效的方式。在數(shù)值空間的環(huán)境下,對象語義的表示方法具有顯著的特點,主要表現(xiàn)在以下幾方面:首先,在相同的數(shù)值空間中,可通過計算的方式明確不同對象語義間的關(guān)系。其次,通過數(shù)值空間對語義進(jìn)行表示的過程中,對于維數(shù)以及取值范圍等,不要求其具備一致性。
然而,在對部分基于經(jīng)典范疇理論的語義進(jìn)行表示時,也可以通過數(shù)值的方式對語義進(jìn)行表示,比如,可以用“1”來表示“男”;用“0”來表示“女”。然而,于具體的認(rèn)知語言學(xué)中,性別概念非常復(fù)雜,且具有較強(qiáng)的系統(tǒng)性,涉及到相關(guān)的心理模型,已經(jīng)超出原子對象的范疇。
于具體的意象圖式中,可通過對象節(jié)點來表示對象,通過關(guān)系節(jié)點和力量——動態(tài)節(jié)點對對象間的關(guān)系進(jìn)行有效表示。在不同節(jié)點之間,可通過有向弧線段進(jìn)行連接。在此過程中,弧的方向有著非常重要的意義,其對于特定關(guān)系下對象以及其它對象之間的角色起著決定性作用。
在一些特定情況下,對一些關(guān)系所涉及的默認(rèn)對象的確定并不復(fù)雜,可通過常識進(jìn)行判斷。同時,也有一些空間一項圖式等語義的表示較為復(fù)雜,往往需要將其和不同屬性的空間結(jié)合,在此基礎(chǔ)之上,才能將其語義完整表示出來。除此之外,“重復(fù)”意象圖式以及“循環(huán)”意象圖式的語義也不容易表達(dá),需要依靠時間特征才能有效表示出來。
語義操作序列的概念是一個系統(tǒng)性的概念,其具體是指由多個原子語義操作所構(gòu)成的序列,此序列具有較強(qiáng)的有序性。對特定的語義操作序列進(jìn)行有效實現(xiàn)有著非常重要的意義,其可以使對應(yīng)語義圖以及屬性空間的動態(tài)構(gòu)建以及修改事項更加順利,在此基礎(chǔ)之上,可以有效表示以及理解對應(yīng)詞匯或者句子的語義。
在具體對語義圖以及空間屬性進(jìn)行修改、構(gòu)建的過程中,一定要明確節(jié)點間連接的方向,對于對象所扮演的角色也應(yīng)明確。將語義的表示和語義的理解有效轉(zhuǎn)化為特定語義操作序列非常重要,可以使語義圖的推理能力以及語義拓展能力得到一定程度的強(qiáng)化,便于相關(guān)人員進(jìn)行研究。
現(xiàn)階段,語言學(xué)的發(fā)展也進(jìn)入一個新的歷史時期,相關(guān)領(lǐng)域?qū)φZ法的研究漸趨于“語境化”,其在認(rèn)知語言學(xué)中得到了充分體現(xiàn)。根據(jù)目前的情況,詞匯學(xué)很可能被應(yīng)用到語言學(xué)中。從認(rèn)知語言學(xué)的角度,可對語境功能進(jìn)行有效展示。在認(rèn)知語言學(xué)中,充分體現(xiàn)了對語義的重視。此外,其使語義的真實值被有效打破,顯示出一定的學(xué)術(shù)價值。在個別細(xì)節(jié)之處,相比認(rèn)知語言學(xué),部分語言學(xué)理論的研究價值更顯著。然而,認(rèn)知語言學(xué)的價值和意義也不容忽視,其實現(xiàn)了對該理論的有效整合,且使語言學(xué)的研究發(fā)展趨勢更加明確,并使人們得以更好地了解到認(rèn)知語言學(xué)的成功原因。
簡言之,在現(xiàn)階段的理論語言學(xué)體系中,認(rèn)知語言學(xué)是一種新范式,其不僅擁有自己的理論體系,且擁有自身獨(dú)有的研究方法。在對自然語言語義進(jìn)行具體表示的過程中,更傾向于對詞匯和語義的對應(yīng)的過程進(jìn)行有效表示。相比傳統(tǒng)的語義網(wǎng),語義圖的語言表示能力更強(qiáng),其能夠?qū)㈥P(guān)系節(jié)點的語義通過意向圖形的方式有效表示出來,且通過屬性空間將各種屬性有效表示出來。由此不難看出,語義圖將不斷發(fā)展和完善,其推理能力以及語義拓展能力都將逐步得到顯著增強(qiáng),從而更好地滿足新時期的發(fā)展需要。
綜上所述,現(xiàn)階段,基于認(rèn)知語言學(xué)的自然語言語義表示方法的研究非常重要。本文對語義圖進(jìn)行了深入研究,其所表現(xiàn)出來的語義拓展能力更加靈活,同時,語義表現(xiàn)能力以及理解能力也更強(qiáng)。對語言語義表示方法進(jìn)行有效研究可以有效促進(jìn)相關(guān)領(lǐng)域平穩(wěn)、較快地發(fā)展,且更好地服務(wù)于新時期的發(fā)展需要。
[1]葉錫君,尹巖.基于認(rèn)知語言學(xué)的自然語言語義表示方法[J].計算機(jī)科學(xué),2014,41(z1):98-102.
[2]賈茜,張斌.基于認(rèn)知語言學(xué)的文獻(xiàn)主題元語義表示與結(jié)構(gòu)分析[J].情報理論與實踐,2015,38(2):6-10,5.
[3]尹巖.基于意象圖式的語義理解模型研究[D].南京農(nóng)業(yè)大學(xué),2013.
[4]王新新.基于認(rèn)知語言學(xué)的自然語言語義表示方法探究[J].校園英語(中旬),2014(11):225-225.