(鄭州中學 454170)
摘要:現(xiàn)在國際上數(shù)學的發(fā)展十分的先進,但還在相似算法方面的研究內(nèi)容還比較的稀缺,目前已經(jīng)有學者提出來了相似算法的廣義的定義。這種定義是以案例推理為基礎(chǔ)建立的,本文主要介紹的就是案例推理的內(nèi)涵以及案例推理中相似度算法的使用情況及在該領(lǐng)域內(nèi)相似度算法的發(fā)展情況。
關(guān)鍵詞:相似度算法;案例推理;發(fā)展狀況;
一、相似運算的含義
案例推理的運算系統(tǒng)是通過依賴以往的解決問題的方法經(jīng)驗來應對現(xiàn)在面臨的問題。當我們遇到一個新的問題的時候,系統(tǒng)會通過搜索以往處理過的問題并進行相似度的匹配,直到找出相似度最高的那個問題,通過借鑒那個問題的解決方法來處理當前問題。所以相似度對于案例推理運算而言有著重要的意義,除此之外,還有許多領(lǐng)域的發(fā)展運用都需要運用到相似的技術(shù)。
二、如何對相似度進行評估
案例推理的相關(guān)工作者通過和心理學的知識認知方面的內(nèi)容進行結(jié)合,在對相似度進行評估的方面形成了一種共同的認識,也就識對相似度進行評估需要依賴輸入的案例和歷史數(shù)據(jù)庫,或者在檢索的過程中能夠保障自動化程度較高,使得輸入的案例可以與大量的歷史數(shù)據(jù)進行快速的比對??墒怯捎谝恍﹥?nèi)容之間的聯(lián)系比較的抽象,對比推理起來難度較大,那么對于案例推理系統(tǒng)的聯(lián)想能力要求就更高了。
三、相似度算法的概念
許多人對于相似度算法以及檢索方法之間的聯(lián)系和區(qū)別認識有誤。相似算法與表現(xiàn)鏈接更為緊密,檢索更趨向于計算,兩者之間的本質(zhì)有所區(qū)別,但都是包含在相似算法之內(nèi)的。在這篇文章中,相似度算法就是代表了兩者的總稱,由于兩者間差別不大,在學術(shù)界一般也將兩者混在一起述說。
四、案例推理中的相似度算法
在案例推理系統(tǒng)中,相似度算法不僅僅應用于某個方面,而是貫穿整個系統(tǒng)。也就是說相似度算法在案例推理的很多方面均有所使用。
(1)案例推理系統(tǒng)和相似度算法的關(guān)系
相似度算法的基礎(chǔ)條件之一就是案例,在進行相似度計算的過程中,需要大量的案例來進行比對,面對不同類型的案例,需要采取不一樣的計算方法。
案例根據(jù)表示復雜程度的不同可以劃分成為兩個類別,即結(jié)構(gòu)化和簡單的表示。早進行案例推理計算的時候,系統(tǒng)會默認案例都是一種類別的,但是隨著該領(lǐng)域的逐步發(fā)展,這種計算方法咋一些較為復雜的情況下就不適用了,為了解決所面臨的的問題,就有人提出了新的相似度算法,這種新算法的出現(xiàn)也給整個案例推理系統(tǒng)帶來了巨大的影響。
(2)案例的分類和相似度算法間的關(guān)系
為了保障檢索的高效性,在計算的時候需要對案例進行分類。在進行相似度計算的時候,會根據(jù)案例的不同特點把它們進行分類,形成一個個的類別或者簇,當我們輸入想要研究的問題時,系統(tǒng)就會根據(jù)輸入的案例進行檢索找到它所屬于的類別,之后再在這個類別中去進行仔細的查找。使用這樣的計算方法,前提就是要對案例進行分類,所以可以說案例分類是相似度算法的基礎(chǔ)。
五、案例推理系統(tǒng)中相似度算法的應用情況
隨著近幾年來學術(shù)界對案例推理系統(tǒng)的不斷完善,在進行相似度運算的時候越來越快速靈活。系統(tǒng)會根據(jù)輸入案例的特征對安利進行自動的劃分,并根據(jù)案例的種類選取相適應的算法來進行運算。主要的研究成果有一下幾個方面。
第一,最鄰近算法。這種算法是整個案例推理系統(tǒng)中最常見也是最簡單的計算方法,它樂意通過加權(quán)運算將案例的全部屬性進行加權(quán)、綜合處理,到最后根據(jù)加權(quán)的得分找到案例所歸屬的類別,并對數(shù)據(jù)庫中的案例與之相似程度進行排序,最終找到最最貼近的案例作為例子,根據(jù)找到的案例的解決方法來解決當前輸入的問題。
第二,進行多維的檢索。一些結(jié)構(gòu)型的案例可以很清楚額表現(xiàn)出其屬性和相關(guān)的內(nèi)容,但是還有很多的表示型的案例不能被直接觀察到,它具有的屬性以各種各樣的方式組合在一起。這時候就需要對案例進行多維的檢索,形成多維的空間再在其中找尋臨近的點。目前的多維檢索主要是指降低維度的索引方法和空間的索引方法。
第三,以歸納方法為基礎(chǔ)的相似度算法。在商業(yè)范疇內(nèi),有許多的案例推理系統(tǒng)都運用到了歸納的方法,通過對原來的檢索進行匯總歸納,制造出決策的流程,通過原來處理案例的經(jīng)驗來對新的案例進行識別處理,自動的將案例根據(jù)屬性的不同劃分成簇,最后使得每個簇中的案例都有許多的相似之處,這就是歸納,對案例的歸納。這種以歸納作為運算基礎(chǔ)的算法比較適合于語義方面,面對一些描述不夠完整的案例,運用這種計算方法能夠很快又準確的進行。不過這種算法需要很高的知識和工程成本,而且這種算法必須借助互聯(lián)網(wǎng)進行運算傳播。
第四,以模糊邏輯為基礎(chǔ)的算法。有時候輸入案例和我們儲存的案例差異程度較大,這個時候就需要采取模糊邏輯來對案例進行處理。案例推理系統(tǒng)一般是通過講案例的結(jié)構(gòu)和屬性進行轉(zhuǎn)化,轉(zhuǎn)化成模糊的邏輯或者模糊的邏輯術(shù)語,從而使得匹配的過程得以簡化,同時也便于對案例的分類。運用這種算法還可以將多個案例結(jié)合在一起建成一個索引,這種方法運用起來十分靈活,在天氣預報方面的使用十分廣泛。
第五,以神經(jīng)網(wǎng)絡為基礎(chǔ)的算法。以神經(jīng)網(wǎng)絡作為基礎(chǔ)的相似度算法又可以根據(jù)連接結(jié)構(gòu)分為以原型為基礎(chǔ)的神經(jīng)網(wǎng)絡和以專家經(jīng)驗為基礎(chǔ)的子網(wǎng)絡。以原型為基礎(chǔ)的神經(jīng)網(wǎng)絡將案例庫分為了三層,第一層是輸入,輸入的案例的每個屬性作為一個神經(jīng)元來儲存,第二層則是代表了神經(jīng)元的原型,原型之中包含了案例的特征,第三層是輸出,輸出的內(nèi)容作為一個類別。除了整個輸入輸出的過程,整個系統(tǒng)還有儲存的空間來安放那些無法被識別和分類的內(nèi)容。專家經(jīng)驗的子網(wǎng)絡及時通過對每個輸入層內(nèi)容的屬性進行相似度進行分析,最終和歷史信息比對,一層一層的找出相似度最高的案例。
總結(jié):
案例推理系統(tǒng)是以相似度算法作為核心的一種研究方式,隨著近幾年來相關(guān)專業(yè)的不斷發(fā)展,人們對此耳朵重視程度也越來越高,相關(guān)專業(yè)的衍生技術(shù)也越來越多,案例推理系統(tǒng)也發(fā)展的越來越完善,可是相比較于其他專業(yè)的發(fā)展,相似度算法方面的研究還是過于淺顯,筆者認為在該方面還有很大的研究和發(fā)展空間。加強對相似度算法的研究,有助于推進案例推理系統(tǒng)的發(fā)展,同時也有助于拓寬專業(yè)的研究范圍,推進我國相關(guān)產(chǎn)業(yè)和技術(shù)的發(fā)展。希望相關(guān)方面的專家學者可以在現(xiàn)有的理論基礎(chǔ)上進一步對相似度算法進行研究,以挖掘其深層次的作用和意義。
參考文獻:
[1] Gentner D. Structure-mapping: A theoretical framework for analogy[J].Cognitive Science, 1983, 7 (2 ): 155一170.
[2] Gick M.,Holyoak K J. Analogical problem solving[J].Cognitive psychology,1980, 12:306-355.
[3]Tversky A. Feature of Similarity) JI .Psychological Review, 1977, 84 (4 ) : 327一352.
[4] Vosniadou S, Ortoxry A. Similarity and Analogical Reason-ingl MI·New York:Cambridge University Press, 1989.
[5] Bunke H, Messmer S T. Similarity measures for structuredrepresentation) CI //Proceedings First European Workshop on Case-Based Reasoning.}S. 1. I:}s. n. I,1993: 26一31.
作者簡介:王西妍,(2000.9.7-),女,漢族,河南省焦作市人,學生,鄭州中學。endprint