亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        實例檢索中基于關(guān)聯(lián)函數(shù)和D-HS索引的改進與融合

        2021-05-07 03:42:26趙燕偉任設東桂方志
        計算機集成制造系統(tǒng) 2021年4期
        關(guān)鍵詞:關(guān)聯(lián)方法

        趙燕偉,徐 晨,任設東,桂方志,朱 芬

        (1.浙江工業(yè)大學 機械工程學院,浙江 杭州 310014;2.浙江工業(yè)大學 計算機科學與技術(shù)學院,浙江 杭州 310023)

        0 引言

        實現(xiàn)國家現(xiàn)代化的基礎在于發(fā)展實體經(jīng)濟,制造業(yè)是其支柱和核心[1]。隨著德國工業(yè)4.0及中國制造2025等戰(zhàn)略的提出,智能制造已成為全球制造業(yè)發(fā)展的共同趨勢與目標[2],但在經(jīng)濟全球化的趨勢下,制造業(yè)市場的競爭日趨激烈,用戶對產(chǎn)品的個性化需求也越來越高[3]。在此背景下,產(chǎn)品設計周期變的越來越短,這給企業(yè)帶來了繁重的產(chǎn)品開發(fā)任務,設計人員面臨的壓力與日俱增[4-5]。產(chǎn)品設計者在分析3種產(chǎn)品設計類型(變型設計、適應性設計和創(chuàng)新設計)時發(fā)現(xiàn),變型設計和適應性設計占比較大,這意味著產(chǎn)品設計經(jīng)常以原有設計為基礎,適當進行修改。因此,根據(jù)用戶個性化需求,在產(chǎn)品實例庫中高效、準確地檢索來獲得相似實例是設計人員借助計算機輔助設計系統(tǒng)對現(xiàn)有實例進行修改和重用的關(guān)鍵[6-7]。

        實例推理(Case-based Reasoning, CBR)[8-9]是指利用過去解決同類問題的方案和經(jīng)驗來獲得當前問題解決辦法的一項在人工智能領域興起的技術(shù)。實例檢索是實例推理系統(tǒng)的中心環(huán)節(jié),其檢索速度及精度關(guān)系著整個系統(tǒng)的質(zhì)量[10]。因此,眾多專家學者對該環(huán)節(jié)展開了深入的研究,文獻[11-12]針對低碳設計中的實例檢索問題,提出一種基于多維關(guān)聯(lián)函數(shù)的多屬性相似實例檢索方法,并將其應用于螺桿空壓機的低碳屬性需求檢索中;朱芳來等[13]將基于混合屬性距離的相似性度量方法應用于實例檢索中,以閥門概念設計中實例檢索為例,驗證了該應用對提高CBR系統(tǒng)的有效性和可靠性的幫助;蔣占四等[14]針對最近鄰實例檢索中實例屬性相似度和權(quán)重的計算問題,提出了區(qū)間值屬性相似度的計算模型和基于相似度離差信息的客觀賦權(quán)方法;殷亮等[15]基于子空間法的實例分類,提出一種多級實例檢索方法,將檢索過程分為實例模板的檢索和模板內(nèi)的實例檢索,并采用最鄰近法計算實例相似度。

        綜合分析上述文獻不難得出,如何衡量實例間的距離是實例檢索的核心問題。關(guān)聯(lián)函數(shù)、混合屬性距、最近鄰法及其改進研究等相繼被提出,且在索引精度提升的基礎上成效斐然。但實例檢索是索引精度和索引速度這一對基本矛盾的有機結(jié)合,日趨復雜的計算方法在提高精度的同時帶來了龐大的計算量,導致索引速度下降。此外,索引速度不僅受索引精度的制約,還受實例庫內(nèi)實例數(shù)目的影響,在實例庫的構(gòu)建過程中,為使實例知識盡可能豐富,設計者往往會不斷地更新實例庫。因此,實例檢索中存在一部分影響索引速度且無益于索引精度的冗余計算,文獻[16]稱此為檢索效用問題。

        本文針對索引速度與索引精度間的矛盾問題,結(jié)合模糊數(shù)與關(guān)聯(lián)函數(shù),提出模糊關(guān)聯(lián)函數(shù)的概念,并推導出相應計算公式,同時摒棄面對多屬性產(chǎn)品時計算量龐大的全維關(guān)聯(lián)函數(shù)計算方法,結(jié)合層次分析法建立單維關(guān)聯(lián)函數(shù)組合相似性度量模型;此外,基于Sigmoid函數(shù)對D-HS索引進行改進,并融合改進后的D-HS索引和關(guān)聯(lián)函數(shù)度量模型,避免了實例檢索中的部分冗余計算,有效解決了檢索效用問題。

        1 相關(guān)知識

        1.1 關(guān)聯(lián)函數(shù)

        關(guān)聯(lián)函數(shù)[17-18]類比于模糊集理論中的隸屬度函數(shù),能夠定量刻畫事物屬于某區(qū)間或者擁有某性質(zhì)的程度,相較于傳統(tǒng)歐式幾何距方法、K最近鄰(K-Nearest Neighbor, KNN)分類檢索方法,將關(guān)聯(lián)函數(shù)應用于實例檢索能更為準確地反映產(chǎn)品間的相似程度[12]。關(guān)聯(lián)函數(shù)k(x)的表達式如式(1)所示:

        (1)

        式中ρ(x,x0,X)和ρ(x,x0,X0)表示側(cè)距,

        (2)

        式中:x,x0分別表示空間上某點及最優(yōu)點;X表示空間中的范圍約束;X1,X2分別表示點x與x0的連線與區(qū)間X邊界的交點,其中X1為離x0較近的點;Ext(x0X1)表示沿直線x0X1并以X1為起點的射線,Ext(x0X2)同理;x=x0表示點x和最優(yōu)點x0重合;-max{|x0M|}中M表示區(qū)間X各頂點,-max{|x0M|}意為取最優(yōu)點x0與區(qū)間各頂點距離最大值的負數(shù)。側(cè)距ρ(x,x0,X0)與側(cè)距ρ(x,x0,X)僅在區(qū)間約束上存在差異,計算方法相同(即將X1,X2替換為x1,x2),故此處略去其具體公式。D(x,X0,X)表示位值,

        D(x,X0,X)=ρ(x,x0,X)-ρ(x,x0,X0)。

        (3)

        由式(3)可知,位值D(x,X0,X)等于以X為區(qū)間的側(cè)距ρ(x,x0,X)與以X0為區(qū)間的側(cè)距ρ(x,x0,X0)的差值。

        1.2 D-HS索引

        最高離散化相似度(Discretized-Highest Similarity, D-HS)[19-20]索引方法的核心思想是對實例庫中實例的各屬性值進行離散化處理,劃定每個屬性對應的區(qū)間長度及數(shù)目,判斷實例庫實例與目標實例是否落入相同區(qū)間并計算屬性匹配度(計算方法如式(4)),提取出與目標實例存在共同區(qū)間的相似實例組成初步索引集SP,再對SP內(nèi)元素按照屬性匹配度的大小進行降序排序,最后剔除其中屬性匹配度較低的實例,形成最終索引集SE。

        (4)

        式中:SA(ci,T)表示實例庫實例ci與目標實例T的屬性匹配度;vj(ci)和vj(T)分別表示實例庫實例ci的第j個屬性對應的屬性值和目標實例T的第j個屬性對應的屬性值;當vj(ci)和vj(T)落入同一區(qū)間時Match(vj(ci),vj(T))取1,否則取0;M表示實例屬性總數(shù)。

        2 基于關(guān)聯(lián)函數(shù)的相似性度量

        由1.1節(jié)中關(guān)聯(lián)函數(shù)和側(cè)距的求解公式可知,直線xx0與約束X、X0間交點(即點x1、x2、X1、X2)的獲取是問題的核心,也是計算工作量的關(guān)鍵部分,而交點的獲取本質(zhì)上是對線性方程組的求解,由參考文獻[21]可知采用高斯消元法求解線性方程組的時間復雜度為O(n3),其中n指代方程的個數(shù)(高斯消元法求解線性方程組可以分為消去過程與回代過程兩個步驟,其中消去過程的計算工作量為[n(n+1)(2n+1)/6]-1,回代過程的計算工作量為n(n+1)/2,總計算工作量為n3+n2+2n/3-1,時間復雜度僅以最高次冪為代表,故記為O(n3)),即算法計算工作量與方程個數(shù)的立方成正比。因此傳統(tǒng)的關(guān)聯(lián)函數(shù)計算方法在面對高維檢索時計算工作量較大,導致索引速度較低。

        此外,線性方程組的求解僅為整個關(guān)聯(lián)函數(shù)求解過程中的一部分,即線性方程組是關(guān)聯(lián)函數(shù)的簡化模型,在面對高維檢索時,關(guān)聯(lián)函數(shù)的求解比線性方程組的求解更復雜,因為簡化模型略去了各方程的獲取步驟、直線與約束所產(chǎn)生的冗余交點(約束外交點)的取舍步驟(檢索維度越高,冗余交點越多)以及從交點到側(cè)距再到關(guān)聯(lián)函數(shù)的計算步驟等操作。

        綜合上述定量和定性分析,將關(guān)聯(lián)函數(shù)應用于高維檢索時存在效率低下的問題。針對該問題,已有部分學者展開了相關(guān)研究,文獻[6]提出了基于改進BP神經(jīng)網(wǎng)絡的產(chǎn)品實例分類方法,該方法確實在很大程度上提高了索引速度,但是鑒于訓練樣本的不足,犧牲了一定的索引精度;文獻[12]對此展開了關(guān)聯(lián)函數(shù)計算的降維研究,提出了降維規(guī)則,但當構(gòu)建的空間為超多面體時,降維規(guī)則仍需進一步完善。

        此外,關(guān)聯(lián)函數(shù)的計算為定量化計算,而產(chǎn)品屬性可能存在多種表現(xiàn)形式,具體可以分為確定數(shù)值型、確定區(qū)間型、模糊數(shù)值型、模糊區(qū)間型和模糊概念型。因此,關(guān)聯(lián)函數(shù)在面對模糊型參數(shù)時還缺乏有效的方法,導致索引精度不高。表1所示為某型號真空泵的部分屬性,表中包括多種屬性表現(xiàn)形式:抽氣速率與運行功率分別為確定區(qū)間型和確定數(shù)值型,噪聲為模糊數(shù)值型,環(huán)保性能為模糊概念型,故障率為模糊區(qū)間型。

        表1 某型號真空泵屬性(部分)

        針對上述問題,本文將模糊數(shù)和層次分析法分別與關(guān)聯(lián)函數(shù)相結(jié)合,提出模糊關(guān)聯(lián)函數(shù)的概念并建立單維關(guān)聯(lián)函數(shù)組合相似性度量模型,具體將在第2.2節(jié)和第2.3節(jié)中展開。

        2.1 確定型參數(shù)關(guān)聯(lián)函數(shù)度量

        當產(chǎn)品屬性為確定數(shù)值型時,該數(shù)值即關(guān)聯(lián)函數(shù)最優(yōu)點x0,根據(jù)用戶需求并結(jié)合設計標準,由最優(yōu)點x0形成理想?yún)^(qū)間X0,再借鑒可拓學中可拓域與經(jīng)典域的思想[17],由理想?yún)^(qū)間X0外擴形成可行區(qū)間X;當產(chǎn)品屬性為確定區(qū)間值型時,該區(qū)間即關(guān)聯(lián)函數(shù)理想?yún)^(qū)間X0,由理想?yún)^(qū)間可獲取最優(yōu)點x0和可行區(qū)間X。根據(jù)獲取的相關(guān)數(shù)據(jù),代入式(1)~式(3)即可計算各實例對應屬性的關(guān)聯(lián)函數(shù)值。

        2.2 模糊型參數(shù)關(guān)聯(lián)函數(shù)度量

        目前,關(guān)聯(lián)函數(shù)對模糊型參數(shù)的度量尚處空白階段,本文將模糊數(shù)的表達方式類比至關(guān)聯(lián)函數(shù)計算三要素(最優(yōu)點,理想?yún)^(qū)間,可行區(qū)間),提出了模糊關(guān)聯(lián)函數(shù)的概念和相關(guān)計算公式。

        X2],結(jié)合上述區(qū)間獲取最優(yōu)點x0。如圖1所示為基于模糊數(shù)的關(guān)聯(lián)函數(shù)計算圖示。

        (1)模糊數(shù)值型參數(shù)關(guān)聯(lián)函數(shù)度量

        根據(jù)圖1a三角模糊數(shù)—關(guān)聯(lián)函數(shù)的計算圖示,再結(jié)合1.1節(jié)中側(cè)距的計算公式,本文提出模糊數(shù)值型側(cè)距ρ(x,x0,X)表達式如下:

        (5)

        式中:S△Qxx0表示三角形Qxx0的面積;S表示梯形Qx0xM的面積(其余同理);-max{S△QX1x0,S△QX2x0}意為取三角形QX1x0面積與三角形QX2x0面積中的較大值,因本文規(guī)定X1為離x0較近點,故-max{S△QX1x0,S△QX2x0}=-S△QX2x0。如圖2所示為式(5)對應圖示。

        關(guān)聯(lián)函數(shù)需要分別計算可行區(qū)間X與理想?yún)^(qū)間X0的側(cè)距,在面對模糊數(shù)值型參數(shù)時兩者計算方法類似,即將可行區(qū)間X替換為理想?yún)^(qū)間X0,因此本文不再贅述側(cè)距ρ(x,x0,X0)的表達式和計算圖示。

        將側(cè)距ρ(x,x0,X)和側(cè)距ρ(x,x0,X0)的計算結(jié)果代入式(1)與式(3)即可求得模糊數(shù)值型參數(shù)對應的關(guān)聯(lián)函數(shù)值。

        (2)模糊區(qū)間型參數(shù)關(guān)聯(lián)函數(shù)度量

        根據(jù)圖1b梯形模糊數(shù)—關(guān)聯(lián)函數(shù)的計算圖示,再結(jié)合側(cè)距的計算公式,本文提出模糊區(qū)間型側(cè)距表達式如式(6)所示,圖3所示為式(6)對應圖示。

        (6)

        與模糊數(shù)值型參數(shù)不同,模糊區(qū)間型參數(shù)的兩側(cè)距計算方法并不相同,理想?yún)^(qū)間X0的側(cè)距ρ(x,x0,X0)的表達式如式(7)所示,圖4所示為式(7)對應圖示。

        (7)

        將側(cè)距ρ(x,x0,X)和側(cè)距ρ(x,x0,X0)的計算結(jié)果代入式(1)和式(3)即可求得模糊區(qū)間型參數(shù)對應的關(guān)聯(lián)函數(shù)值。

        (3)模糊概念型參數(shù)關(guān)聯(lián)函數(shù)度量

        針對模糊概念型參數(shù),本文引入模糊語義轉(zhuǎn)化表(如表2)對模糊語進行量化,再將量化后的值與模糊數(shù)值型參數(shù)相結(jié)合,即用三角模糊數(shù)進行表示,再根據(jù)對應公式即可求得關(guān)聯(lián)函數(shù)值。

        表2 模糊語義轉(zhuǎn)化表

        2.3 單維關(guān)聯(lián)函數(shù)組合相似性度量

        根據(jù)上文給出的式(5)~式(7),可以求得不同類型參數(shù)間的側(cè)距,然后將所得數(shù)值帶入式(1)及式(3)中,即可求得實例間各維屬性的關(guān)聯(lián)函數(shù)值,再結(jié)合由層次分析法得到的各屬性權(quán)重(層次分析法具體步驟可參考文獻[22])即可獲取目標實例與實例庫實例的組合關(guān)聯(lián)函數(shù),以此刻畫兩者相似度,計算公式如下:

        (8)

        式中:k(A*)表示組合關(guān)聯(lián)函數(shù);k(Ai)表示屬性i的關(guān)聯(lián)函數(shù),wi為對應權(quán)重。

        因各維屬性的關(guān)聯(lián)函數(shù)相互獨立且單獨計算,故從簡化模型的角度可得該算法的時間復雜度為O(n),即算法計算工作量與檢索維度成正比,如圖5所示為本文所提方法與原方法的時間復雜度對比圖。另外,單維關(guān)聯(lián)函數(shù)在方程獲取,其余計算步驟較全維關(guān)聯(lián)函數(shù)簡單,且無冗余交點出現(xiàn),因此該方法在面對高維檢索時能夠大幅提高索引速度。

        3 D-HS索引方法改進及與關(guān)聯(lián)函數(shù)融合

        第2章提出的模糊關(guān)聯(lián)函數(shù)解決了模糊型參數(shù)間的相似性度量問題,提高了的索引精度,同時結(jié)合層次分析法的單維關(guān)聯(lián)函數(shù)組合相似性度量方法提高了索引速度。但該方法在檢索時仍需遍歷全實例庫實例,即檢索效用問題仍然存在。鑒于此,本文對1.2節(jié)中介紹的D-HS索引進行了基于Sigmoid函數(shù)的改進研究,并對兩種方法進行了融合。如圖6所示為關(guān)聯(lián)函數(shù)與D-HS索引的改進與融合圖示。

        分析1.2節(jié)中D-HS索引原理可知,該方法是對實例庫實例進行分區(qū)間存取,無需進行相似度計算,且受實例庫實例數(shù)目影響較小,因此該方法不僅效率較高,還能有效避免檢索效用問題,但是存在準確率低下問題,具體體現(xiàn)為以下兩點:

        (1)D-HS索引采用的離散化方法僅適用于屬性值均勻或近似均勻分布的情況,當產(chǎn)品屬性值非均勻分布時,各區(qū)間內(nèi)實例數(shù)目會出現(xiàn)較大的差異,甚至會出現(xiàn)某區(qū)間內(nèi)無實例的情況,該情況下索引準確率會大幅下降。

        (2)屬性匹配度指代實例庫實例的屬性與目標實例屬性位于相同區(qū)間的個數(shù)。一般而言,實例間越相似,相同區(qū)間個數(shù)也會越多,因此屬性匹配度可以從整體上反映實例間的相似度,但考慮到存在屬性恰好位于區(qū)間邊緣等特殊情況,若將其作為檢索的唯一衡量指標,則存在嚴謹性不足問題,同樣影響準確率。

        3.1 基于Sigmoid函數(shù)的D-HS索引方法改進

        針對實例庫實例屬性值的非均勻分布現(xiàn)象導致的索引準確率低下問題,本文利用Sigmoid函數(shù)對屬性值進行非線性變換,該變換能夠在不改變數(shù)據(jù)整體分布及排列情況的前提下,對數(shù)據(jù)稠密及稀疏區(qū)域分別進行擴大和壓縮,提高數(shù)據(jù)的辨識性和劃分層級的能力[23-24]。Sigmoid函數(shù)表達式為:

        (9)

        式中:系數(shù)β為樣本數(shù)據(jù)的中位數(shù);系數(shù)α=ln9/t,其中參數(shù)t為樣本數(shù)據(jù)90%分位點及10%分位點到中位點的距離中的較小值。

        D-HS索引區(qū)別于關(guān)聯(lián)函數(shù)的定量化計算,因此當屬性為模糊型時可以將其視為確定型。此外,屬性為區(qū)間型時可以取區(qū)間中點代替對應區(qū)間進行非線性變換和屬性匹配度的計算。

        本文以真空泵關(guān)鍵屬性—抽氣速率為例,驗證上述方法對提高屬性值非均勻分布時D-HS索引準確率的優(yōu)勢。具體步驟如下:

        步驟1調(diào)取某真空泵實例庫中150種不同型號真空泵的抽氣速率為原始數(shù)據(jù)。

        步驟2對原始數(shù)據(jù)進行以自然對數(shù)e為底的對數(shù)處理,得到ln數(shù)據(jù),再對ln數(shù)據(jù)進行降序排列。

        步驟3根據(jù)ln數(shù)據(jù)計算式(9)中系數(shù)α與系數(shù)β的值,再將ln數(shù)據(jù)代入式(9)得Sigmoid數(shù)據(jù)。

        步驟4為統(tǒng)一量綱,將原始數(shù)據(jù)和ln數(shù)據(jù)分別進行歸一化,得到ln歸一化數(shù)據(jù)和原始歸一化數(shù)據(jù),并與Sigmoid數(shù)據(jù)對比。

        如圖7所示為各組數(shù)據(jù)對比圖,其中圖7a~圖7c分別代表原始歸一化數(shù)據(jù)、ln歸一化數(shù)據(jù)和Sigmoid數(shù)據(jù)的散點圖和直方圖。由上述對比可知,基于Sigmoid函數(shù)的非線性變換能夠細化數(shù)據(jù)稠密區(qū)間,整合數(shù)據(jù)稀疏區(qū)間,對非均勻分布的數(shù)據(jù)有較好的處理能力。

        3.2 D-HS索引與關(guān)聯(lián)函數(shù)的融合

        針對D-HS索引中將屬性匹配度作為實例檢索的唯一指標而帶來的嚴謹性不足、準確率低下問題,以及關(guān)聯(lián)函數(shù)在檢索時需遍歷全實例庫實例而造成的檢索效用問題,本文將3.1節(jié)中提出的改進D-HS索引方法和第2章建立的結(jié)合模糊數(shù)和層次分析法的單維關(guān)聯(lián)函數(shù)組合相似性度量模型相融合,如圖8所示為兩者融合示意圖。

        圖8中由實例庫至最終索引集SE的檢索過程共分為兩個步驟。步驟1為D-HS索引:根據(jù)目標實例計算實例庫實例的屬性匹配度SA,并分類形成各實例集(SA=0,SA=1,…,SA=n),再取屬性匹配度較高的實例集組成初步索引集SP(根據(jù)實例數(shù)目而定,一般剔除后60%~后80%,圖8中取SA≥x);步驟2為關(guān)聯(lián)函數(shù)索引:根據(jù)本文所提的關(guān)聯(lián)函數(shù)改進方法,計算SP內(nèi)實例的組合關(guān)聯(lián)函數(shù),以此獲取最終索引集SE。

        融合后的檢索方法無需計算實例庫中每個實例的關(guān)聯(lián)函數(shù),可以在一定程度上避免檢索效用問題,同時關(guān)聯(lián)函數(shù)的應用解決了傳統(tǒng)D-HS索引面臨的嚴謹性不足、準確率低下問題。

        相似實例經(jīng)檢索、重用和修改后可作為新實例重新入庫,故在此過程中實例庫實例各維屬性值的分布情況不斷變化,屬性值非線性變化后的分布情況亦隨之不斷變化,因此對應區(qū)間的劃分不是一成不變的,而對于區(qū)間的劃分操作可以在實例庫更新維護時完成,不必在每次檢索前進行。如圖9所示為實例檢索流程圖。

        4 實例驗證與對比分析

        4.1 實例驗證

        本文以面向用戶需求的真空泵檢索選型為例對所提方法進行了驗證,首先從用戶處獲取目標實例的相關(guān)屬性值,并結(jié)合層次分析法獲取對應權(quán)重;然后從實例庫中直接調(diào)取各型號真空泵的原始數(shù)據(jù)和非線性變換后的各區(qū)間劃分情況;最后計算實例庫中各實例相對于目標實例的屬性匹配度。

        表3列出了目標實例屬性值及對應權(quán)重,其中區(qū)間型參數(shù)的Sigmoid數(shù)據(jù)為區(qū)間中點對應值。

        表3 目標實例屬性值及對應權(quán)重

        圖10所示為真空泵關(guān)鍵屬性—抽氣速率、運行功率和噪聲對應的不同類型數(shù)據(jù)分布圖(限于篇幅,未將所有屬性全部列出);表4所示為屬性匹配度計算結(jié)果。

        根據(jù)表4中各實例的屬性匹配度分布情況,本文取SA≥4的相似實例組成初步索引集SP,并依照第2章提出的計算方法獲得SP內(nèi)實例各維屬性的關(guān)聯(lián)函數(shù),再與對應權(quán)重結(jié)合即可求得組合關(guān)聯(lián)函數(shù)。表5所示為SP內(nèi)各實例的單維關(guān)聯(lián)函數(shù)和組合關(guān)聯(lián)函數(shù)計算結(jié)果。

        表4 屬性匹配度計算結(jié)果

        表5 單維和組合關(guān)聯(lián)函數(shù)計算結(jié)果(初步索引集SP)

        比較表5中的組合關(guān)聯(lián)函數(shù)k(A*)可知,實例c39,c44與目標實例相似度最高,可優(yōu)先作為后續(xù)實例重用和修改的對象。

        4.2 對比分析

        (1)模糊關(guān)聯(lián)函數(shù)與關(guān)聯(lián)函數(shù)

        當產(chǎn)品的屬性為模糊型時,該屬性對應參數(shù)之間的差異往往較小,甚至會出現(xiàn)眾多實例間無差異的情況,同時參數(shù)的分布也會集中在一個區(qū)域內(nèi),如圖11所示為模糊關(guān)聯(lián)函數(shù)與關(guān)聯(lián)函數(shù)擬合圖示。對比圖11a與圖11b可知,模糊關(guān)聯(lián)函數(shù)的提出有助于擴大模糊數(shù)間的微小差異,即增加其區(qū)分度。

        盡管確定型參數(shù)也存在部分實例集中的現(xiàn)象,但確定型參數(shù)往往分布較廣,即參數(shù)上下限差距較大,導致可行區(qū)間X范圍過大,沒有實際意義,故無法用模糊關(guān)聯(lián)函數(shù)對確定型參數(shù)進行相似性度量。此外,關(guān)聯(lián)函數(shù)較傳統(tǒng)歐式幾何距方法、KNN分類檢索方法的優(yōu)勢在文獻[12]中已作詳細討論,本文不再贅述。

        (2)屬性匹配度與SP內(nèi)外組合關(guān)聯(lián)函數(shù)

        本文提出將D-HS索引中的屬性匹配度作為檢索的初級指標,以此獲取初步索引集SP,再計算其內(nèi)實例的組合關(guān)聯(lián)函數(shù)獲取最終索引集SE。為驗證該方法的優(yōu)勢,本文計算了全實例庫實例的組合關(guān)聯(lián)函數(shù),并與屬性匹配度結(jié)合做了相應的統(tǒng)計,統(tǒng)計結(jié)果如圖12所示。

        圖12中,曲線LAVG表示對應屬性匹配度的實例集中各實例組合關(guān)聯(lián)函數(shù)平均值的連線(擬合后)。由圖12可知:組合關(guān)聯(lián)函數(shù)的均值隨屬性匹配度的增加而增加,因此屬性匹配度可以從整體上反映實例間的相似度。

        此外,本文對初步索引集SP內(nèi)外組合關(guān)聯(lián)函數(shù)進行了對比,表6所示為SP外部分實例組合關(guān)聯(lián)函數(shù)計算結(jié)果。

        表6 SP外實例組合關(guān)聯(lián)函數(shù)計算結(jié)果(部分)

        對比表5與表6中數(shù)據(jù)不難發(fā)現(xiàn),SP外實例的組合關(guān)聯(lián)函數(shù)整體上小于SP內(nèi)實例的組合關(guān)聯(lián)函數(shù),盡管表6中存在少數(shù)實例的組合關(guān)聯(lián)函數(shù)大于表5中部分實例(如實例c35,c40),但并不影響最終索引集SE的獲取。綜合上述對比可知,融合關(guān)聯(lián)函數(shù)與D-HS索引的檢索方法能夠在保證索引精度的同時避免部分冗余計算,在一定程度上解決了檢索效用問題。

        5 結(jié)束語

        本文將模糊數(shù)與關(guān)聯(lián)函數(shù)相結(jié)合,提出了模糊關(guān)聯(lián)函數(shù)的概念,擴大了模糊數(shù)間的微小差異,增加了相似實例間的區(qū)分度,提高了索引精度;同時結(jié)合層次分析法建立單維關(guān)聯(lián)函數(shù)組合相似性度量模型,并從定量比較和定性分析的角度論證了所提方法在索引速度上的優(yōu)勢,相較于過去的全維關(guān)聯(lián)函數(shù)計算方法,結(jié)合模糊數(shù)和層次分析法的關(guān)聯(lián)函數(shù)在面對高維檢索時既保證了索引精度又提高了索引速度。

        利用Sigmoid函數(shù)對原始數(shù)據(jù)進行非線性變換,對數(shù)據(jù)稠密及稀疏區(qū)域分別進行擴大和壓縮,提高了數(shù)據(jù)的辨識性和劃分層級的能力,有效解決了傳統(tǒng)D-HS索引中因數(shù)據(jù)分布不均導致的索引準確率低下問題。

        融合關(guān)聯(lián)函數(shù)和D-HS索引,提出根據(jù)屬性匹配度獲取初步索引集SP,再計算SP內(nèi)組合關(guān)聯(lián)函數(shù)獲取最終索引集SE的檢索步驟,融合后的相似實例檢索方法提高了傳統(tǒng)D-HS索引的嚴謹性和準確性,且在確保不出現(xiàn)相似實例遺漏現(xiàn)象的同時避免了關(guān)聯(lián)函數(shù)需對全實例庫實例進行相似度計算的繁瑣,在一定程度上解決了檢索效用問題。在檢索到與目標最相近的相似實例后需要對該實例進行不同程度的變更,而在變更過程中勢必存在變更風險同時帶來變更矛盾。因此,后續(xù)將針對產(chǎn)品變更風險的預測以及產(chǎn)品變更矛盾的求解兩方面做具體展開,以實現(xiàn)產(chǎn)品對市場的快速響應。

        猜你喜歡
        關(guān)聯(lián)方法
        不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
        “苦”的關(guān)聯(lián)
        當代陜西(2021年17期)2021-11-06 03:21:36
        “一帶一路”遞進,關(guān)聯(lián)民生更緊
        當代陜西(2019年15期)2019-09-02 01:52:00
        學習方法
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        国产亚洲欧美精品永久| 久久HEZYO色综合| 高清成人在线视频播放| 国产自拍高清在线观看| 亚洲国产精品日韩av不卡在线| 精品十八禁免费观看| 日本视频一区二区二区| 新中文字幕一区二区三区| 国产中文字幕乱人伦在线观看| 国产高清无码在线| 蜜桃在线观看免费高清| 国产精品黑丝高跟在线粉嫩| 久久精品免费一区二区三区| 国产91福利在线精品剧情尤物| av一区二区三区高清在线看| 米奇欧美777四色影视在线| 国产精品久久久久久久久免费| 国产亚洲午夜精品| 日本在线免费不卡一区二区三区| 成人免费无码大片a毛片抽搐色欲| 成人小说亚洲一区二区三区| 亚洲AV无码国产精品色午夜软件| 免费人成网站在线视频| 国产成人喷潮在线观看| 欧美成aⅴ人高清免费| 日韩精品成人一区二区三区久久久| 日韩精品专区在线观看| 少妇无码一区二区三区免费| 国产av专区一区二区三区| 中文文精品字幕一区二区| 国99久9在线 | 免费| 久久青草伊人精品| 极品新娘高清在线观看| 肥老熟妇伦子伦456视频| 内射后入在线观看一区| 丰满少妇人妻无码超清 | 日韩三级一区二区三区| 幻女bbwxxxx在线视频| 亚洲国产一区二区三区最新| 日本免费大片一区二区三区| 娜娜麻豆国产电影|