李春梅,陳秀明,劉文文,周永芹
(安徽新華學(xué)院信息工程學(xué)院,安徽合肥 230088)
基于熵權(quán)的區(qū)間猶豫模糊集用戶聚類方法研究
李春梅,陳秀明,劉文文,周永芹
(安徽新華學(xué)院信息工程學(xué)院,安徽合肥 230088)
本文針對(duì)群體中用戶采用區(qū)間猶豫模糊信息表達(dá)興趣偏好的情況,在推薦過(guò)程中對(duì)于區(qū)間猶豫模糊集用戶聚類的方法進(jìn)行研究??紤]到屬性權(quán)重未知的情況,提出熵權(quán)模型來(lái)確定屬性權(quán)重;基于相關(guān)性和最小距離思想,利用傳遞閉包算法和凝集型層次聚類算法對(duì)用戶聚類,在此基礎(chǔ)上研究群推薦方法,建立科學(xué)合理的群推薦模型。
區(qū)間猶豫模糊集;相關(guān)系數(shù);熵測(cè)度;屬性權(quán)重;用戶聚類
在現(xiàn)實(shí)世界中,數(shù)據(jù)用于聚類可能是不確定的和模糊的,處理各種類型的模糊數(shù)據(jù),大量的聚類算法對(duì)應(yīng)不同的模糊環(huán)境.作為模糊集的擴(kuò)展,區(qū)間猶豫模糊集能夠表達(dá)決策者在決策過(guò)程中區(qū)間性、猶豫性的模糊問(wèn)題.通過(guò)距離和相似性計(jì)算,進(jìn)行用戶聚類,能夠?yàn)橛脩艉侠淼赝扑].在以往的聚類問(wèn)題中,用戶評(píng)價(jià)信息多為語(yǔ)言評(píng)價(jià)信息和語(yǔ)言算子;對(duì)于用戶聚類的研究,主要從用戶訪問(wèn)行為和訪問(wèn)內(nèi)容兩個(gè)方面對(duì)訪問(wèn)數(shù)據(jù)進(jìn)行研究;但是,對(duì)于區(qū)間猶豫模糊集用戶聚類方法的研究還比較少.本文著重研究了區(qū)間猶豫模糊集用戶聚類問(wèn)題,在文獻(xiàn)[1]的基礎(chǔ)上,考慮了屬性權(quán)重已知和完全未知的情況,并在文獻(xiàn)[2]的基礎(chǔ)上,提出了熵權(quán)重模型用以確定屬性權(quán)重,最后利用傳遞閉包算法和凝集型層次聚類算法對(duì)用戶進(jìn)行聚類.
1.1 相關(guān)概念
基于區(qū)間猶豫模糊集的性質(zhì)和運(yùn)算,給出區(qū)間猶豫模糊集的算術(shù)加權(quán)平均算子和幾何加權(quán)平均算子.
(1)區(qū)間猶豫模糊集的加權(quán)算術(shù)算子.
(2)區(qū)間猶豫模糊集的幾何加權(quán)平均算子.
1.2 區(qū)間猶豫模糊集的相關(guān)系數(shù)
在區(qū)間模糊集相關(guān)系數(shù)的基礎(chǔ)上,給出區(qū)間猶豫模糊集的相關(guān)系數(shù)定義[1,3-4].
當(dāng)考慮到該元素xi∈X的權(quán)重時(shí),進(jìn)一步得到:
1.3 一種區(qū)間猶豫模糊熵公式的構(gòu)造
在具體的決策中,不同的決策者的重要程度通常是有區(qū)別的,所以在處理區(qū)間猶豫模糊熵時(shí),要依據(jù)決策者的重要性賦予決策者的信息不同的權(quán)重ωj(ωj>0).為此,在猶豫模糊集的熵和對(duì)偶猶豫模糊集的熵的基礎(chǔ)上,給出區(qū)間猶豫模糊集的熵的公式[5-6,8-9].
證明 由于
聚類是指一個(gè)過(guò)程,使一組對(duì)象(可選方案、人、事件等)進(jìn)入有數(shù)據(jù)特點(diǎn)和對(duì)象的集群,比不同的集群具有更高的相似性集群.在模糊聚類分析中,聚類的方法有很多,目前典型的聚類算法有傳遞閉包算法、K-Means、迭代自組織數(shù)據(jù)分析方法等.本文采用傳遞閉包算法和凝集型層次聚類算法進(jìn)行用戶聚類.
2.1 Algorithm-IVHFSC算法
基于直覺(jué)模糊聚類算法[10],本文提出一種新的區(qū)間猶豫模糊凝聚型層次聚類算法,通過(guò)最小距離對(duì)用戶進(jìn)行聚類。
定理4 設(shè)C是一個(gè)相關(guān)矩陣.那么對(duì)于任意非負(fù)整數(shù)m1和m2,衍生矩陣Cm1+m2來(lái)源于Cm1+m2=Cm1°Cm2仍然是一個(gè)相關(guān)矩陣.
定理5 設(shè)C=(ρij)m×m是相關(guān)矩陣,然后組成的有限次數(shù)C→C2→C4→…→C2k→…,必然存在一個(gè)正整數(shù)k,使得C2k=22k+1,C2k也是一個(gè)等價(jià)的相關(guān)矩陣.
定義9 設(shè)C=(ρij)m×m是等價(jià)的相關(guān)矩陣,稱Cλ=(λρij)m×m為C的切割矩陣,其中,
2.2 屬性權(quán)重未知的用戶聚類
在決策過(guò)程中,屬性權(quán)重有時(shí)是已知的,有時(shí)是全部未知或者部分未知的,在區(qū)間猶豫模糊多屬性決策條件下,如何依據(jù)決策矩陣以及屬性權(quán)重信息獲取屬性權(quán)重已成為現(xiàn)階段研究的熱點(diǎn)問(wèn)題之一.下面著重解決屬性權(quán)重已知和權(quán)重完全未知的區(qū)間猶豫模環(huán)境下的用戶聚類問(wèn)題.
屬性權(quán)重完全未知的多屬性決策問(wèn)題是專家權(quán)重和屬性權(quán)重完全未知,根據(jù)區(qū)間猶豫模糊熵和熵權(quán)重模型[8]求解屬性權(quán)重,并基于備選方案與理想方案間的相關(guān)系數(shù),提出一種用戶聚類的算法.
基于區(qū)間猶豫模糊相關(guān)系數(shù)和傳遞閉包技術(shù)對(duì)用戶進(jìn)行聚類:
步驟1 依據(jù)用戶提供的區(qū)間猶豫模糊信息構(gòu)建決策矩陣M=(αij)m×n;
步驟2 依據(jù)區(qū)間猶豫模糊熵的權(quán)重模型,計(jì)算屬性的權(quán)重ω=(ω1,ω2,…,ωn)T;
步驟3 基于區(qū)間猶豫模糊集的相關(guān)系數(shù)計(jì)算,構(gòu)造相關(guān)矩陣;
步驟4 利用傳遞閉包技術(shù)進(jìn)行用戶聚類.
步驟1 依據(jù)用戶提供的區(qū)間猶豫模糊信息構(gòu)建決策矩陣M=(αij)m×n;
步驟2 依據(jù)區(qū)間猶豫模糊熵的權(quán)重模型,計(jì)算出屬性的權(quán)重ω=(0.2026,0.3856,0.0980,0.3137)T;
步驟3 基于區(qū)間猶豫模糊集的相關(guān)系數(shù)計(jì)算公式,得到相關(guān)系數(shù)矩陣(表1).
表1 用戶對(duì)六種渠道的區(qū)間猶豫模糊集綜合決策矩陣M=(αij)6×4
顯然,C8=C4,這表明C4是一個(gè)等價(jià)的相關(guān)矩陣.
表2 聚類結(jié)果
本文以用戶聚類分析問(wèn)題為研究重點(diǎn),在不同區(qū)間猶豫模糊集的信息環(huán)境下,結(jié)合相關(guān)系數(shù)、熵測(cè)度模型和距離相似性公式,構(gòu)造了區(qū)間猶豫模糊熵模型和權(quán)重確定模型,討論了屬性權(quán)重完全已知和完全未知的情況,并進(jìn)行用戶聚類.
針對(duì)區(qū)間猶豫模糊環(huán)境下用戶聚類方法的研究,可以運(yùn)用到群決策、群推薦系統(tǒng)中,對(duì)電子商務(wù)、投資決策和人才選拔等都有一定的幫助.但是,針對(duì)聚類方法中的凝聚型層次聚類算法和傳遞閉包技術(shù)聚類算法,每次只合并兩個(gè)類,具有迭代次數(shù)高、時(shí)間復(fù)雜度高的缺陷,有待進(jìn)一步的研究.
[1]Chen N,Xu Z,Xia M.Interval-valued hesitant preference relations and their applications to group decision making[J].Knowledge-Based Systems,2013,37(2):528-540.
[2]Zhang Z M,Wang C,Tian D,et al.Induced generalized hesitant fuzzy operators and their application to multiple attribute group decision making[J].Computers & Industrial Engineering,2014,67(1):116-138.
[3]W L Huang,A note on entropy of intuition fuzzy sets[J].Internation Journal of Uncertainty,Fuzziness and Knowledge-Based Systems,2003,11(5):627-633.
[4]吳婉瑩.猶豫模糊信息的相關(guān)系數(shù)和熵測(cè)度及其在群決策中的應(yīng)用[D].合肥:安徽大學(xué),2014.
[5]王培,魏翠萍.一種區(qū)間直覺(jué)模糊熵的構(gòu)造方法[J].計(jì)算機(jī)工程與應(yīng)用,2011(2):43-45.
[6]李香英.區(qū)間猶豫模糊熵和區(qū)間猶豫模糊相似度[J].計(jì)算機(jī)工程與應(yīng)用,2014(19):227-231.
[7]魏翠萍,高志海,郭婷婷.一個(gè)基于三角函數(shù)的直覺(jué)模糊熵公式[J].控制與決策,2012(4):571-574.
[8]金飛飛,裴利丹,陳華友,等.區(qū)間猶豫模糊三角相似度及其多屬性群決策[J].計(jì)算機(jī)工程與應(yīng)用,2015(4):41-45.
[9]王毅,雷英杰.一種直覺(jué)模糊熵的構(gòu)造方法[J].控制與決策,2007(12):1390-1394.
[10]Z S Xu,J Chen,J J Wu.Clustering algorithm for intuitionistic fuzzy sets[J].Inform. Sci.,2008,178(19): 3775-3790.
Clustering Analysis of Interval-valued Hesitant Fuzzy Sets Based on Entropy Weights
LI Chun-mei,CHEN Xiu-ming,LIU Wen-wen,ZHOU Yong-qin
(School of Information Engineering, Anhui Xinhua University, Hefei Anhui 230088, China)
Methods of clustering analysis of interval-valued hesitant fuzzy sets have been proposed, considering the weight of the properties is unknown, we use the entropy measures to calculate the attribute weights. Based on the minimum distance, we use the transitive closure algorithms and hierarchical clustering algorithm. The example verifies the effectiveness of the proposed method.
interval-valued hesitant fuzzy sets; correlation coefficient; entropy measures; attribute weights; clustering analysis
2017-04-12
安徽省教育廳自然科學(xué)基金重點(diǎn)項(xiàng)目“猶豫模糊語(yǔ)言環(huán)境下的群推薦方法研究”(KJ2015A300);安徽省教育廳自然科學(xué)基金重點(diǎn)項(xiàng)目“指紋IRLRD特征加密技術(shù)在手機(jī)支付中的研究與應(yīng)用”(KJ2015A309);安徽省教育廳自然科學(xué)基金重點(diǎn)項(xiàng)目“基于鏈路預(yù)測(cè)的關(guān)系推薦研究”(KJ2016A304);國(guó)家級(jí)大學(xué)生創(chuàng)新性訓(xùn)練計(jì)劃項(xiàng)目“基于社團(tuán)發(fā)現(xiàn)的個(gè)性化推薦系統(tǒng)研究”(201212216035);國(guó)家級(jí)大學(xué)生創(chuàng)新性訓(xùn)練計(jì)劃項(xiàng)目“群推薦中偏好信息集結(jié)方法研究”(201312216006);國(guó)家級(jí)大學(xué)生創(chuàng)新性訓(xùn)練計(jì)劃項(xiàng)目“基于模糊語(yǔ)言的群興趣偏好集結(jié)方法研究”(201412216026);國(guó)家級(jí)大學(xué)生創(chuàng)新性訓(xùn)練計(jì)劃項(xiàng)目“猶豫模糊語(yǔ)言集在大學(xué)生素質(zhì)評(píng)價(jià)中的應(yīng)用”(201512216009)。
李春梅(1978- ),女,講師,碩士,從事數(shù)據(jù)挖掘研究。
陳秀明(1972- ),男,副教授,博士,從事智能決策研究。
C934
A
2095-7602(2017)08-0040-07