亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合改進(jìn)FCM與PFS的知識供需匹配

        2023-01-31 03:55:50張建華劉藝琳郭啟迪楊俊曉徐佳璐
        關(guān)鍵詞:案例用戶

        張建華,劉藝琳,郭啟迪,楊俊曉,徐佳璐

        (鄭州大學(xué) 管理工程學(xué)院,河南 鄭州 450001)

        0 引 言

        作為隱性知識深度服務(wù)體系中的重要一環(huán),知識供需匹配是實(shí)現(xiàn)知識應(yīng)用價(jià)值的關(guān)鍵。其以用戶需求為出發(fā)點(diǎn),是緩解“知識迷向”問題的一種行之有效的方法,已被廣泛應(yīng)用于醫(yī)療[1]、農(nóng)業(yè)[2]、公共交通管理[3]等領(lǐng)域。目前關(guān)于知識供需匹配的研究,根據(jù)研究范圍界定的不同主要集中在以下兩個(gè)方面:①關(guān)于知識自身的供需匹配問題研究,主要聚焦于匹配方法、匹配效果等方面。Wan等采用信息熵描述軌跡的移動(dòng)頻率,并通過構(gòu)建LightGBM分類模型確定車輛與手機(jī)匹配度,提高了算法的有效性[4]。Deng等融合地理信息系統(tǒng)技術(shù)和遺傳算法,提出了針對空間案例的匹配模型,以此來彌補(bǔ)傳統(tǒng)CBR方法未考慮地質(zhì)環(huán)境因素的空間關(guān)系的不足,改善了匹配算法的精度與效度[5]。李佳敏等采用三元組深度哈希學(xué)習(xí)方法將司法案例轉(zhuǎn)化為二進(jìn)制編碼,提高了算法的匹配效率[6]。臧振春等從用戶需求出發(fā),采用Vague集語言分別表示用戶需求及產(chǎn)品屬性,同時(shí)兼顧用戶興趣,實(shí)現(xiàn)了高效精準(zhǔn)的知識需求匹配[7]。②關(guān)于知識應(yīng)用的供需匹配研究,側(cè)重于知識組織服務(wù),集中于知識需求和供給關(guān)聯(lián)體的匹配研究,即如何從眾多的知識服務(wù)中選擇與用戶需求最契合的服務(wù)。馬仁杰等考慮用戶需求與既有知識服務(wù)屬性的不確定性,設(shè)計(jì)了一套基于區(qū)間和灰色關(guān)聯(lián)度的知識服務(wù)匹配方法,以區(qū)間數(shù)表示其不確定性,同時(shí)兼顧用戶需求偏好,提高了匹配方法的查準(zhǔn)率與查全率[8]。關(guān)盟等充分考慮用戶及服務(wù)提供方的利益需求,基于改進(jìn)i-NSGA-Ⅱ-JG算法構(gòu)建了服務(wù)組合雙方互選模型,實(shí)現(xiàn)了對用戶需求服務(wù)的最優(yōu)選取[9]。鄭小雪等基于語言信息和區(qū)間數(shù)的雙邊匹配決策方法,有效解決了在跨境電商供應(yīng)鏈中對眾多服務(wù)方的尋優(yōu)問題[10]。沈明輝等采用醫(yī)學(xué)知識圖譜構(gòu)建交互式可視化知識服務(wù)系統(tǒng),有效提高了醫(yī)療就診的服務(wù)效率[11]。陳希等兼顧患者的需求差異,提出了E-HR算法,并構(gòu)建了考慮患者預(yù)約行為的兩階段供需匹配模型,優(yōu)化了醫(yī)療服務(wù)的供需匹配決策[12]。

        綜上所述,既有關(guān)于知識供需匹配的研究,在一定程度上改善了知識匹配算法的精度與效率;不過,其也存在如下不足:其一,在運(yùn)用聚類算法壓縮匹配空間時(shí),通過人為設(shè)定聚類數(shù)目導(dǎo)致算法容錯(cuò)性不高,聚類結(jié)果有失客觀性,進(jìn)而影響了匹配精度。其二,在計(jì)算相似度時(shí),未充分考慮知識自身的不確定性和模糊性,采用精確的離散化方法進(jìn)行相似度計(jì)算造成知識屬性值的信息損失;或者僅以模糊粗糙集為基礎(chǔ),使得相似度計(jì)算所蘊(yùn)含信息不充分,從而導(dǎo)致匹配精度低下。針對既有研究之不足,本文提出以下改進(jìn)思路:①知識匹配集的確定。首先基于DBSCAN算法確定FCM的最優(yōu)聚類數(shù)目,而后采用改進(jìn)的FCM算法尋找與用戶知識需求最相關(guān)的區(qū)域,并在該區(qū)域內(nèi)進(jìn)行相似度計(jì)算,以壓縮相似度計(jì)算空間,減少算法的時(shí)間開銷。②既有知識與用戶知識需求間相似度的測度。將畢達(dá)哥拉斯模糊集(pythagorean fuzzy sets, PFS)與Zadeh模糊算子相結(jié)合對相似度進(jìn)行改進(jìn),以確保視圖相似度計(jì)算結(jié)果的客觀性及可靠性;而后,以PFS相關(guān)系數(shù)測度兩者間的關(guān)聯(lián)度,并將兩者融合得到一種新的知識模糊關(guān)聯(lián)匹配度模型,以確定與用戶知識需求匹配度最佳的知識。

        1 預(yù)備知識

        1.1 FCM聚類算法

        傳統(tǒng)聚類算法均屬于“硬”劃分,即只判定一個(gè)對象是否歸屬于一個(gè)類別;然而,在實(shí)際應(yīng)用場景中,存在著許多難以界定的待測對象,無法將其嚴(yán)格劃分到某一類中。針對此不足,模糊C均值(fuzzy C-Means,F(xiàn)CM)聚類算法被提出,其基于目標(biāo)函數(shù)最優(yōu)化來實(shí)施聚類,聚類效果更加靈活[13]。FCM聚類算法通過引入模糊隸屬度可將一個(gè)對象劃分到多個(gè)類別中,這與實(shí)際應(yīng)用場景更為契合[14]。設(shè)C={c1,c2,…,cn} 為論域U上的一個(gè)隱性知識外顯案例知識集,若將知識集劃分為k類,則對應(yīng)有k個(gè)聚類中心,其中μij表示案例Ci屬于第k類的隸屬度。

        1.2 畢達(dá)哥拉斯模糊集

        2 知識供需匹配算法

        知識是以信息為原料,并對其進(jìn)行深加工而形成的系統(tǒng)化的信息本質(zhì)與內(nèi)容(表現(xiàn)為編碼后的顯性知識)及認(rèn)知主體技能(隱性知識),是數(shù)據(jù)和信息的更高層次。在人類的知識結(jié)構(gòu)中,隱性知識占據(jù)絕大部分,是實(shí)現(xiàn)知識傳播及價(jià)值創(chuàng)新的主要源泉。隱性知識存儲(chǔ)在人的大腦中,基于案例的知識表示方法通過結(jié)構(gòu)化描述知識實(shí)現(xiàn)對隱性知識的外顯化。該方法以結(jié)構(gòu)化屬性集(包括條件屬性集與決策屬性/集)的形式蘊(yùn)含表征隱性知識從條件到?jīng)Q策的映射關(guān)系,即案例知識 C=(條件屬性1,條件屬性2,…,條件屬性m,決策屬性), 并通過權(quán)重向量 (w=(w1,w2,w3,…,wm)) 表征各條件屬性影響決策屬性的程度。知識用戶面臨新問題或任務(wù)時(shí),向隱性知識外顯案例庫提交知識匹配需求以獲取所需知識,是實(shí)現(xiàn)非零基高效求解的有效途徑。知識供需匹配以用戶需求為導(dǎo)向,基于相似度衡量既有隱性知識外顯案例間與用戶知識需求的匹配程度;相似度越高,表明其與用戶需求匹配性越好。

        2.1 基于改進(jìn)FCM算法的知識匹配子集的確定

        在知識匹配過程中,知識匹配的效率很大程度上取決于系統(tǒng)知識庫的規(guī)模,其中包含眾多與用戶知識需求相似度較小或不相關(guān)的知識。傳統(tǒng)知識匹配方法大都需遍歷全知識庫以尋找與用戶需求匹配度最高的知識,導(dǎo)致知識匹配的時(shí)間成本大大增加。FCM是一種基于目標(biāo)函數(shù)最優(yōu)的聚類算法,利用微積分求最優(yōu)代價(jià)函數(shù),使得被劃分到同一簇的知識之間相似度最大,而不同簇之間的相似度最小,可用于確定與用戶知識需求最相關(guān)的知識子集,進(jìn)而提高匹配效率。然而,F(xiàn)CM算法需要預(yù)先設(shè)置聚類數(shù)目和初始聚類中心,初始值的設(shè)置會(huì)對聚類結(jié)果產(chǎn)生影響,且它往往需要使用者事先掌握數(shù)據(jù)的分布結(jié)構(gòu),才能確保設(shè)置的合理性,進(jìn)而消減聚類結(jié)果對初始值的敏感性。

        在實(shí)際應(yīng)用場景中,大多數(shù)使用者僅依據(jù)主觀經(jīng)驗(yàn)設(shè)置聚類數(shù)目,欠缺科學(xué)性與客觀性。DBSCAN(density-based spatial clustering of applications with noise)算法由密度可達(dá)關(guān)系導(dǎo)出最大密度相連的樣本集合,即通過樣本分布的緊密程度來判定樣本的聚類結(jié)果,具有依據(jù)對象的空間、非空間和時(shí)間值尋找聚類中心的能力[18]。本文引入DBSCAN算法計(jì)算待分類知識樣本的密度和距離,確定FCM算法的最優(yōu)的聚類數(shù)目,從而避免主觀決策的片面性、提升傳統(tǒng)FCM算法的聚類效果。

        (1)

        在此基礎(chǔ)上,采用DBSCAN算法確定FCM算法的最優(yōu)聚類數(shù)目。首先給定半徑鄰域ε以及該鄰域內(nèi)包含的最少樣本點(diǎn)數(shù)Minpts,而后對于案例知識集U={C1,C2,…,Cn}, 將其聚類中心表示為 {k1,k2,…,kn}, 則對于任意的案例知識Ci∈U, 可得到各條知識間的距離,如式(2)所示

        (2)

        式中:xij表示第i條知識在屬性j上的值,xkj表示聚類中心k所對應(yīng)的屬性值。

        進(jìn)而依據(jù)求得的各知識間距離,通過式(3)計(jì)算得到第i條知識Ci的密度

        (3)

        同時(shí),考慮到在運(yùn)用DBSCAN算法時(shí),所形成的簇中心相較于近鄰而言是一個(gè)高密度數(shù)據(jù)點(diǎn),且與其它簇中心距離較遠(yuǎn),故可進(jìn)一步地計(jì)算簇中各點(diǎn)的距離,則較大密度的最小距離可表示為

        (4)

        若其具有最大局部密度,則上式可轉(zhuǎn)變?yōu)?/p>

        (5)

        如此,基于上述公式可計(jì)算得到各條知識間的距離及密度,并通過合理設(shè)定閾值與參數(shù),得到FCM算法的聚類數(shù)目k。而后對所有知識實(shí)施聚類,將其劃分為k個(gè)區(qū)域,并保存區(qū)域中心及區(qū)域半徑作為初級分類器(Z,R)={(z1,r1),(z2,r2),…,(zk,rk)}, 其目標(biāo)函數(shù)可表示為

        (6)

        傳統(tǒng)FCM聚類算法僅采用歐式距離來衡量各條知識與聚類中心的距離,其應(yīng)用于球型結(jié)構(gòu)數(shù)據(jù)集時(shí)聚類效果較優(yōu);然而,由于案例知識的屬性類別多樣化且維度較高,僅采用歐式距離度量很難使數(shù)據(jù)達(dá)到全局一致性,導(dǎo)致聚類效果欠佳。相似度計(jì)算方法可有效表示高維度、不同類型的數(shù)據(jù)間的接近程度,余弦相似度對絕對數(shù)值不敏感,可進(jìn)一步從方向角度評估知識間的相似性,更適用于高維數(shù)據(jù)空間。不過,傳統(tǒng)余弦相似度無法區(qū)分各個(gè)維度取值成比例變化的兩個(gè)知識樣本。本文對其進(jìn)行改進(jìn),以增強(qiáng)相似度計(jì)算的可靠性,并采用改進(jìn)的余弦相似度來替代歐式距離,以提升FCM算法的聚類效果

        (7)

        式中:xej為第e條知識在條件屬性j上的屬性值。

        在此基礎(chǔ)上,進(jìn)一步得到新的FCM算法的目標(biāo)函數(shù),如式(8)所示

        (8)

        同時(shí),為使聚類效果更優(yōu),將聚類中心及半徑通過以下公式進(jìn)行更新

        (9)

        (10)

        式中:n表示案例知識數(shù),β為模糊加權(quán)指數(shù),zq為聚類中心。

        至此,依據(jù)前述計(jì)算得到的聚類數(shù)目k,設(shè)定模糊加權(quán)指數(shù)β,通過不斷迭代使得FCM算法的目標(biāo)函數(shù)達(dá)到最小值,從而實(shí)現(xiàn)對案例知識集的聚類劃分;進(jìn)而,分別測算用戶知識需求與聚類區(qū)域間的距離,并對其升序排列,其值最小的區(qū)域即為與用戶知識需求最相關(guān)的知識子集。

        基于改進(jìn)FCM的聚類算法為:

        輸入:案例知識集U={C1,C2,…,Cn}, 鄰域參數(shù)ε,Minpts。

        輸出:聚類中心矩陣和隸屬度矩陣。

        步驟1 根據(jù)式(2)和式(3)分別計(jì)算既有知識間的距離以及各條知識的密度。

        步驟2 通過距離和密度度量方式,確定知識xi的ε-鄰域子樣本集N∈(xi), 若子數(shù)據(jù)集樣本個(gè)數(shù)滿足 |N∈(xi)|≥Minpts, 則將知識xi納入核心對象樣本集合: Ω=Ω∪U{xi}。

        步驟3 隨機(jī)選取核心對象o,記為Ωcur={o}, 更新未訪問知識集合Γ=Γ-{o}, 若Ωcur為空集,形成聚類簇Ck,記為C={c1,c2,…,ck}, 更新核心對象集合Ω=Ω-Ck, 并轉(zhuǎn)步驟5;否則,轉(zhuǎn)步驟4。

        步驟4 在核心對象Ωcur中取出一個(gè)核心對象o,依據(jù)鄰域距離閾值ε確定ε-鄰域子樣本集N∈(o′), 令Δ=N∈(o′)∩Γ, 更新當(dāng)前簇樣本集合Ck=Ck∪Δ, 更新未訪問知識集合Γ=Γ-Δ, 更新Ωcur=Ωcur∪(Δ∩Ω)-o′, 執(zhí)行步驟3,直至生成聚類簇Ck。

        步驟5 依據(jù)生成的聚類數(shù)目k,設(shè)置加權(quán)指數(shù)m=2, 設(shè)置迭代門限次數(shù)η。

        步驟7 通過式(8)計(jì)算價(jià)值函數(shù)。若其小于某個(gè)確定的閥值或相對上次價(jià)值函數(shù)值的改變量小于某個(gè)閥值,則算法停止。

        步驟8 根據(jù)式(10)計(jì)算新的隸屬矩陣,并返回步驟6,直到算法迭代結(jié)束。

        綜上,通過改進(jìn)FCM算法對案例知識集實(shí)施聚類,橫向壓縮算法的遍歷空間,以簡化后續(xù)相似度的計(jì)算過程,提升匹配算法的效率。

        2.2 知識視圖相似度的計(jì)算

        實(shí)際應(yīng)用場景中存在著大量不確定性、不完備性的知識,使其精準(zhǔn)地服務(wù)于用戶需求是實(shí)現(xiàn)知識有效配置的關(guān)鍵所在。視圖相似度的計(jì)算是實(shí)施知識供需匹配的重要環(huán)節(jié),其值越趨近于1,表明該知識越接近于用戶的知識需求。傳統(tǒng)的視圖相似度算法大多采用精確的離散化方法來表示具有不確定性、模糊性的知識間的相似程度,會(huì)導(dǎo)致知識屬性的信息缺失;此外,亦有采用以模糊粗糙集為理論基礎(chǔ)的Zadeh模糊貼近度來衡量既有知識與用戶需求兩個(gè)模糊集之間的相似度,其以隸屬度表示“是”與“否”兩方面的信息,卻欠缺語義的包容性。畢達(dá)哥拉斯模糊集兼顧隸屬度、非隸屬度及猶豫度三方面信息,更符合模糊決策規(guī)律;并且,相較于直覺模糊集,PFS既能解釋隸屬度與非隸屬度之和不大于1的情況,又能描述隸屬度與非隸屬度之和大于1的現(xiàn)象,其蘊(yùn)含的特征信息較多,適用范圍更廣。

        在知識匹配過程中往往會(huì)出現(xiàn)許多知識屬性值的隸屬度與非隸屬度之和大于1的現(xiàn)象,若僅采用傳統(tǒng)相似度計(jì)算方法,會(huì)導(dǎo)致相似度結(jié)果失真,進(jìn)而影響匹配算法的準(zhǔn)確性。因此,本文利用PFS在處理不確定性知識時(shí)的優(yōu)勢,將其與Zadeh模糊算子相結(jié)合,衡量用戶知識需求與既有知識之間的相似性,以此彌補(bǔ)傳統(tǒng)模糊集與直覺模糊集表達(dá)范圍受限的不足。在此基礎(chǔ)上,兼顧知識屬性成分對匹配結(jié)果的影響,引入知識屬性權(quán)重向量,得到用戶需求與既有知識間的視圖相似度,提高計(jì)算結(jié)果的準(zhǔn)確性與客觀性,進(jìn)而提升匹配算法的精度。

        (1)基于Zadeh-PFS模糊算子的相似度計(jì)算

        (11)

        (12)

        采用熵權(quán)法計(jì)算知識的條件屬性權(quán)重,其計(jì)算公式如式(13)和式(14)所示。在此基礎(chǔ)上,得到用戶知識需求與既有知識間的視圖相似度Sim(Cq,Ci)

        (13)

        (14)

        (15)

        (2)知識相關(guān)度計(jì)算

        基于視圖相似度可定位與用戶知識需求相似的知識,然而在實(shí)際應(yīng)用場景中,不完全相似但存在一定相關(guān)度的知識才更有利于用戶進(jìn)行知識創(chuàng)新。簡言之,與用戶知識需求既相似又相關(guān)的知識可更有效地滿足用戶的需求,進(jìn)而最大程度地實(shí)現(xiàn)知識的應(yīng)用價(jià)值。故本文采用PFS相關(guān)系數(shù)來測度用戶知識需求與既有知識間的相關(guān)度,計(jì)算公式如下

        (16)

        式中: E(Cq) 表示Cq的信息量, Corr(Cq,Ci) 為用戶知識需求與既有知識間的相關(guān)指標(biāo), ρ(Cq,Ci) 表示兩者間的相關(guān)系數(shù)。

        在此基礎(chǔ)上,本文將基于Zadeh-PFS模糊算子的視圖相似度與兩者之間的關(guān)聯(lián)度相融合,構(gòu)建知識模糊關(guān)聯(lián)匹配度模型,得到既有知識與用戶需求間的匹配度

        S(Cq,Ci)=γSim(Cq,Ci)+(1-γ)ρ(Cq,Ci)

        (17)

        其中, S(Cq,Ci) 為匹配度, Sim(Cq,Ci) 為基于Zadeh-PFS模糊算子的相似度, ρ(Cq,Ci) 為相關(guān)度,γ為調(diào)節(jié)因子, γ∈[0,1]。

        綜上,本文在既有研究的基礎(chǔ)上,設(shè)計(jì)了一套知識供需匹配方法,以期提高知識匹配的效率與精度,進(jìn)而提高知識用戶滿意度。該方法的具體過程如下:①首先基于案例知識表示法實(shí)現(xiàn)隱性知識外顯化,并構(gòu)建知識表達(dá)系統(tǒng)。②采用DBSCAN算法計(jì)算既有知識間的距離及密度以確定FCM算法的最佳聚類數(shù)目,而后運(yùn)用改進(jìn)FCM聚類算法對知識全庫實(shí)施區(qū)域劃分,尋找與用戶知識需求最相關(guān)的聚類區(qū)域,得到與用戶知識需求相匹配的知識子集。③采用PFS模糊數(shù)表征知識的各屬性值,并將PFS與Zadeh模糊算子相融合改進(jìn)屬性相似度計(jì)算;而后,引入熵權(quán)法計(jì)算屬性權(quán)重,得到用戶需求與知識間的視圖相似度;在此基礎(chǔ)上,以PFS相關(guān)系數(shù)測度兩者間的關(guān)聯(lián)度,并將其與前述視圖相似度相融合得到既有知識與用戶需求間的匹配度。④將計(jì)算得到的匹配度與預(yù)設(shè)匹配閾值相比較,若匹配度為1,則將該條知識直接提交給用戶;若匹配度小于1但大于匹配閾值,則對其進(jìn)行降序排列,將與用戶需求匹配度最高的知識提交給用戶,同時(shí)輔助推薦高于匹配閾值的其它知識,以支撐用戶后續(xù)的多案例誘導(dǎo)型適配(已另文探討);若所有匹配度均小于匹配閾值,則匹配失敗。

        3 實(shí)證分析

        本文實(shí)驗(yàn)數(shù)據(jù)來源于加州大學(xué)歐文分校創(chuàng)建的UCI數(shù)據(jù)庫,目前共包含488個(gè)數(shù)據(jù)集,它是一個(gè)標(biāo)準(zhǔn)測試數(shù)據(jù)庫。本文選用“wine”數(shù)據(jù)集(含13個(gè)條件屬性、1個(gè)決策屬性),共178條紅酒的樣本數(shù)據(jù),實(shí)驗(yàn)環(huán)境為Intel core i5處理器、8 GB內(nèi)存,windows10(64 bit)操作系統(tǒng),利用MATLAB R2014a軟件測試本文所提知識供需匹配算法的效果。

        首先,采用基于案例的知識表示方法實(shí)現(xiàn)隱性知識外顯化,將wine數(shù)據(jù)集的每一行視為一個(gè)外顯案例,并將其轉(zhuǎn)化到m維向量空間中,則該案例庫可轉(zhuǎn)化為n×m階矩陣。其中,案例知識Ci的屬性值向量為Ci={xi1,xi2,…,xij,…,xim}。 假設(shè)知識用戶面臨待解問題(發(fā)出一條知識需求), Cq=(0.74,0.18,0.66,0.34,0.26,0.51,0.56,0.17,0.59,0.37,0.62,0.77,0.70,dq)。 通過應(yīng)用本文的知識供需匹配方法,尋找與用戶知識需求最接近的案例知識,從而實(shí)現(xiàn)對待解問題的求解(確定dq)。

        在確定知識匹配子集的過程中,分別設(shè)置鄰域參數(shù)ε=0.15、0.25、0.5,Minpts=3、4、5,并依據(jù)式(2)~式(6)計(jì)算既有知識間的距離及密度,同時(shí)分別在不同的鄰域參數(shù)下確定鄰域核心對象,不斷訪問知識集,并進(jìn)行迭代更新,直至生成穩(wěn)定的聚類簇?cái)?shù)目,而后對聚類結(jié)果進(jìn)行比較,最終得到FCM算法的較優(yōu)聚類數(shù)目,結(jié)果如圖1所示。

        圖1 聚類結(jié)果對比

        由圖1可知,當(dāng)ε=0.5,Minpts=3時(shí),噪音點(diǎn)個(gè)數(shù)最少,此時(shí)案例知識集被分為3類,效果達(dá)到最優(yōu)。因此設(shè)置該數(shù)據(jù)集的聚類數(shù)k=3,模糊加權(quán)指數(shù)β=2(由文獻(xiàn)[19]可知,當(dāng)β=2時(shí)聚類效果最佳),而后采用改進(jìn)的FCM算法對知識全庫實(shí)施聚類,得到各區(qū)域的聚類中心,并分別計(jì)算用戶知識需求與各聚類區(qū)域中心的距離(結(jié)果見表1),以確定與用戶知識需求最相近的區(qū)域。

        表1 用戶知識需求與各聚類區(qū)域間的距離

        可以看出,用戶知識需求與聚類區(qū)域1間的距離最短。如此在后續(xù)的相似度計(jì)算過程中,僅需計(jì)算該區(qū)域內(nèi)的各條知識(共61條,部分?jǐn)?shù)據(jù)見表2)與用戶需求間的匹配度,即可確定與用戶需求匹配度最高的知識。顯然,對比傳統(tǒng)算法的全庫遍歷,實(shí)施聚類區(qū)域劃分壓縮了計(jì)算空間,簡化了后續(xù)計(jì)算過程,降低了匹配算法的時(shí)間成本。

        表2 聚類區(qū)域1知識子集(部分)

        采用熵權(quán)法計(jì)算知識視圖中各個(gè)條件屬性的權(quán)重,最終得到權(quán)重向量為wj=(0.003,0.153,0.01,0.022,0.014,0.056,0.193,0.086,0.095,0.146,0.043,0.057,0.124)。 而后采用PFS模糊數(shù)表征用戶知識需求及既有知識的特征值,其中用戶的知識需求矩陣轉(zhuǎn)化為: Cq={<0.263,0.737>,<0.820,0.180>,<0.337,0.663>,<0.660,0.340>,<0.739,0.261>,<0.493,0.507>,<0.441,0.559>,<0.830,0.170>,<0.407,0.593>,<0.631,0.369>,<0.382,0.618>,<0.231,0.769>,<0.296,0.704>}。

        繼而,依據(jù)本文所提出的Zadeh-PFS模糊相似度算法,計(jì)算既有知識與用戶知識需求間的屬性相似度,并將其與對應(yīng)權(quán)重相乘,得到兩者間視圖相似度。限于篇幅僅列出對視圖相似度降序排列后的前12條知識,結(jié)果見表3。

        表3 用戶知識需求與既有知識間的視圖相似度(TOP12)

        根據(jù)式(16)分別計(jì)算用戶各知識需求與既有知識間的相關(guān)度(僅列出對相關(guān)度降序排列后的前12條知識),結(jié)果見表4。

        表4 用戶知識需求與既有知識間的相關(guān)度(TOP12)

        兼顧用戶知識需求與既有知識間的相似度與相關(guān)度,設(shè)定調(diào)節(jié)因子γ=0.5, 依據(jù)式(17)得到融合的匹配度,并對其進(jìn)行降序排列。在實(shí)踐應(yīng)用中,很難從系統(tǒng)知識庫中匹配出完全滿足用戶需求的知識(也即S(Cq,Ci)=1)。 故本文通過設(shè)置匹配閾值為0.87,尋找與用戶知識需求匹配程度足夠高的知識,將匹配度最高且大于匹配閾值的知識提交給用戶,其它滿足匹配閾值的知識推薦給用戶,以支撐用戶實(shí)施后續(xù)的多案例誘導(dǎo)適配,計(jì)算結(jié)果見表5。

        表5 用戶知識需求與既有知識間的匹配度(TOP12)

        為驗(yàn)證本文所提知識供需匹配算法的有效性,將其與基于Zadeh-PFS的相似度算法、基于Zadeh算子的相似度算法及基于歐氏距離的知識匹配算法進(jìn)行對比驗(yàn)證。其中,基于Zadeh-PFS的相似度算法未考慮用戶知識需求與既有知識間的相關(guān)度(未計(jì)算PFS相關(guān)系數(shù)),基于Zadeh算子的匹配算法僅采用Zadeh算子計(jì)算相似度且未進(jìn)行相關(guān)度的測度(僅采用隸屬度來衡量相似度,未將非隸屬度與猶豫度納入計(jì)算),基于歐式距離(僅通過計(jì)算各屬性與用戶知識需求在特征值方面上的距離遠(yuǎn)近)的匹配算法未考慮知識系統(tǒng)的非完備性,直接對知識屬性值進(jìn)行離散化處理,其計(jì)算結(jié)果見表6。

        表6 3種傳統(tǒng)方法下的視圖相似度

        從上述實(shí)驗(yàn)分析結(jié)果可知,本文算法的知識匹配度明顯大于前述3種算法,匹配效果較優(yōu)。究其原因,對比Zadeh-PFS的相似度算法與Zadeh算子的相似度算法,本文兼顧用戶知識需求與既有知識間的相似度與相關(guān)度,從而使匹配度計(jì)算結(jié)果蘊(yùn)含的特征信息更加完備,區(qū)分度更優(yōu)。相較于傳統(tǒng)算法,本文利用PFS在描述不確定知識時(shí)具有的優(yōu)勢,采用PFS模糊數(shù)表征知識屬性值,彌補(bǔ)了Zadeh模糊算子表達(dá)范圍受限的不足,從而使匹配度計(jì)算結(jié)果更加準(zhǔn)確、客觀。

        綜上可知,相較于既有算法,本文所提的融合改進(jìn)FCM與Zadeh-PFS的知識供需匹配算法,具有一定的有效性與進(jìn)步性,其比較優(yōu)勢如下:

        (1)傳統(tǒng)知識供需匹配算法需遍歷知識全庫以確定與用戶需求匹配度最高的知識,效率相對低下;或者通過人為設(shè)定聚類算法的聚類數(shù)目來進(jìn)行區(qū)域劃分,導(dǎo)致聚類效果欠佳,從而使得匹配結(jié)果有失客觀性。本文首先采用基于密度的DBSCAN算法,并依據(jù)既有知識間的距離及密度,確定了較為客觀合理的聚類數(shù)目,而后采用改進(jìn)的余弦相似度代替?zhèn)鹘y(tǒng)FCM算法中的歐式距離,彌補(bǔ)了傳統(tǒng)算法中僅采用歐式距離計(jì)算的不足,優(yōu)化了聚類效果。

        (2)相較傳統(tǒng)的相似度計(jì)算方法,本文首先考慮知識表達(dá)系統(tǒng)的不完備及不確定性,為減少離散化處理所造成的信息損失,采用PFS模糊數(shù)表征知識屬性特征值,并將其與Zadeh模糊算子相結(jié)合,提升了視圖相似度的區(qū)分度;而后兼顧相似度與相關(guān)度測度,使匹配度計(jì)算結(jié)果蘊(yùn)含的特征信息更加完備,從而確保計(jì)算結(jié)果的可靠性、準(zhǔn)確性,提高了知識供需匹配算法的精度。本文算法的匹配結(jié)果與其它算法的匹配結(jié)果對比如圖2所示,可見本文算法的匹配精度均高于其它3種算法,表明其區(qū)分度更優(yōu),能夠更好地滿足知識用戶需求。

        圖2 匹配結(jié)果對比

        4 結(jié)束語

        得益于信息技術(shù)的發(fā)展,知識體量不斷增加,知識供需匹配問題也日漸顯現(xiàn)。本文設(shè)計(jì)了一套知識供需匹配算法,以提高知識獲取及重用的效益。為提高知識匹配算法的效率及其容錯(cuò)性,首先基于DBSCAN算法確定FCM算法的聚類數(shù)目,而后采用改進(jìn)的FCM聚類算法實(shí)施區(qū)域劃分,橫向壓縮匹配空間,以降低算法的時(shí)間成本,提升算法的有效性;為確保知識視圖相似度具有更好的區(qū)分度,首先將知識屬性值轉(zhuǎn)化為PFS模糊數(shù),有效地避免了離散化處理所造成的信息損失,之后將其與Zadeh模糊算子融合對視圖相似度進(jìn)行改進(jìn),同時(shí)兼顧用戶需求與知識間的相關(guān)度,構(gòu)建模糊關(guān)聯(lián)匹配度模型,以提升匹配算法的精確度。不過,本文在計(jì)算視圖相似度時(shí),僅采用單一的知識屬性賦權(quán)方式,在后續(xù)的研究中可通過多種賦權(quán)方法相結(jié)合以進(jìn)一步確保賦權(quán)結(jié)果的客觀性。

        猜你喜歡
        案例用戶
        案例4 奔跑吧,少年!
        隨機(jī)變量分布及統(tǒng)計(jì)案例拔高卷
        發(fā)生在你我身邊的那些治超案例
        中國公路(2017年7期)2017-07-24 13:56:38
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        隨機(jī)變量分布及統(tǒng)計(jì)案例拔高卷
        一個(gè)模擬案例引發(fā)的多重思考
        Camera360:拍出5億用戶
        100萬用戶
        国产又黄又湿又爽的免费视频| 精品不卡久久久久久无码人妻 | 亚洲熟妇大图综合色区| 一本一本久久a久久精品综合| 亚洲熟女一区二区三区不卡 | 免费在线观看一区二区| 一本色道久久综合狠狠躁中文| 亚洲av色香蕉第一区二区三区| 青青草是针对华人绿色超碰| 国产精品一区二区三区av在线| 一区二区无码精油按摩| 久久婷婷夜色精品国产| 中文字幕av高清人妻| 亚洲av永久无码精品一福利 | 国产特级毛片aaaaaa高清| 中文字字幕在线精品乱码| 亚洲色自偷自拍另类小说| 香蕉视频毛片| 久久亚洲第一视频黄色| 国内精品熟女一区二区| 青青久久精品一本一区人人| 中文字幕成人乱码熟女精品国50 | 丰满少妇棚拍无码视频| 毛片色片av色在线观看| 久久久熟女一区二区三区| 无套内谢孕妇毛片免费看| 婷婷五月婷婷五月| 国产伦精品一区二区三区免费| 草草影院国产| 在线看亚洲一区二区三区| 久久婷婷五月综合色欧美| 熟妇丰满多毛的大隂户| 亚洲依依成人综合在线网址| 久久尤物av天堂日日综合| 国产一区二区三区小向美奈子| 又黄又爽又无遮挡免费的网站| 久久免费看少妇高潮v片特黄| 久久久精品电影| 丝袜美腿在线观看视频| 精品成在人线av无码免费看| 国产做a爱片久久毛片a片 |