亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于行為曲線的用戶協(xié)同過濾控制推薦

        2023-01-15 11:25:54樊其鋒黑繼偉呂闖龐敏尚喆夏云龍邢志鋼
        家電科技 2022年6期
        關鍵詞:類別準確率聚類

        樊其鋒 黑繼偉 呂闖 龐敏 尚喆 夏云龍 邢志鋼

        廣東美的制冷設備有限公司 廣東佛山 528000

        0 引言

        近幾年,隨著物聯(lián)網(wǎng)[1]和智能化的發(fā)展,各家電廠商逐步從傳統(tǒng)的制造技術(shù)向基于物聯(lián)網(wǎng)的智能家居[2]轉(zhuǎn)型。行業(yè)競爭日益明顯,為了提升競爭力,需要不斷探索新的領域。基于用戶行為進行算法建模,為用戶提供精確的空調(diào)控制推薦服務至關重要。但是,用戶行為習慣方面具有一定的差異性,例如:冷熱喜好、節(jié)能需求、睡眠場景等,也會很大程度上影響推薦的準確性。本文研究基于行為曲線的用戶協(xié)同過濾推薦算法,該算法可以充分反映人群在不同場景和習慣上的差異性,推薦的操作更加準確和舒適,提升用戶體驗和黏性,促進空調(diào)行業(yè)的智能化發(fā)展。

        1 相關工作

        空調(diào)行為推薦具有非常重要的意義:對用戶而言,可以讓空調(diào)使用更加便捷;對空調(diào)廠商而言,可以增強用戶黏性,提升用戶使用體驗,最終提升銷量。目前,主要分為用戶研究和智能推薦。用戶研究以問卷法、入戶訪談等方法為主。近幾年,互聯(lián)網(wǎng)行業(yè)得到飛速發(fā)展,大數(shù)據(jù)和人工智能更是炙手可熱[3],推薦方法不僅僅局限于傳統(tǒng)的統(tǒng)計,而是升級到了基于算法與大數(shù)據(jù)的智能推薦。智能推薦主要包括基于分類回歸、協(xié)同過濾等[9]。

        基于分類回歸的推薦算法包括貝葉斯、KNN等算法[4]。貝葉斯分類是通過給出的待分類項,求解在此項出現(xiàn)的條件下各類別出現(xiàn)的概率,概率最大的分類項,則被認為此項所屬的類別;K近鄰是通過找出訓練集中與該實例相似度最大的K個實例,并根據(jù)這K個實例的類別確定該實例的類別。

        協(xié)同過濾(CF)算法,分為User-based和Item-based兩類[7]。Userbased協(xié)同過濾算法[6]是找出一個用戶的相似偏好集合,根據(jù)相似用戶的偏好預測該用戶的行為;Item-based協(xié)同過濾算法[5]則通過計算用戶對不同內(nèi)容的偏好程度,從而預測用戶的行為。

        此外,智能推薦還可提供個性化的推薦服務[8]。其中,基于用戶行為的自學習推薦[10,11,15],也具有較好的運用。

        本文采用了基于行為曲線的用戶協(xié)同過濾控制推薦算法:UBCbased CF,根據(jù)用戶行為曲線相似度,找到相似行為用戶,從而根據(jù)相似用戶的空調(diào)操作進行推薦。該算法反映了人群在不同場景和習慣上的差異性,推薦的操作更加準確和舒適。

        2 UBC-based CF推薦控制

        本章詳細介紹空調(diào)行為推薦的流程??傮w架構(gòu)如圖1所示。首先,提取用戶的歷史操作行為曲線,以表示該用戶;然后,通過計算行為曲線的相似度,來評估每個用戶與該用戶的相似度;接著,查找距離該用戶最近的K個鄰居,通過協(xié)同過濾算法獲取推薦值,實現(xiàn)空調(diào)的智能化控制。

        圖1 協(xié)同過濾推薦流程圖

        接下來,將分別從用戶表示、計算行為曲線相似度、計算用戶行為相似度、協(xié)同過濾推薦這幾個部分進行闡述。

        2.1 用戶表示

        從物聯(lián)網(wǎng)空調(diào)上收集用戶操作行為數(shù)據(jù),主要包括操作時間(開關機、調(diào)節(jié)溫度、調(diào)節(jié)風速等發(fā)生的時間)、開關機、設置模式、設置溫度等數(shù)據(jù)。本文以操作行為來表示用戶。

        經(jīng)過歷史行為統(tǒng)計發(fā)現(xiàn):用戶對空調(diào)的操作60%會出現(xiàn)在開機10分鐘內(nèi),80%出現(xiàn)在30分鐘內(nèi),90%出現(xiàn)在2小時內(nèi)。因此,用戶操作的時間序列對行為分析具有很大的影響。

        本文通過提取空調(diào)運行過程中的時間階段特征,以時間為X值,用戶設置溫度、風速、開關機等分別為Y值,建立行為曲線。下面以設置溫度為例對用戶行為曲線(設置溫度)的生成過程進行詳細闡述。

        (1)生成行為曲線:以時間序列為X軸,以設置溫度為Y軸,建立二維空間坐標系。

        (2)行為曲線歸一化:由于受到氣候環(huán)境的影響,用戶的使用時長不同;而且,較短的使用記錄,并不能反映空調(diào)從開機到達溫再到穩(wěn)定的過程。因此,首先把使用時長小于2小時的行為作為“噪聲”剔除,然后以用戶使用時間100%對用戶行為曲線進行拉升或壓縮,使得其在相同的時間范圍內(nèi),以完成歸一化。如圖2所示。

        圖2 用戶行為曲線

        因此,用戶可表示為L={L1,L2,L3,……,Ln},包含了用戶的設置溫度、風速、開關機等空調(diào)操作行為信息。其中L1可表示設置溫度行為曲線,L2可表示設置風速行為曲線,L3可表示開關機行為曲線……

        2.2 計算行為曲線相似度

        行為曲線相似度能夠表示兩個用戶空調(diào)某個操作使用行為的一致性,對于尋找高度相似的鄰居,提升算法推薦準確率至關重要。

        本節(jié)主要介紹行為曲線相似度的計算方法。首先,通過積分公式計算兩條曲線面積的交集和并集;然后,以此計算曲線面積的Jaccard系數(shù)作為這兩條行為曲線的相似度。其中相同的用戶每次使用均為一條獨立的行為曲線。

        假設有2個用戶行為a和b,設置溫度曲線分別為La和Lb,如圖3所示。

        圖3 行為曲線相似度

        把曲線的時間軸劃分成正無窮個時間間隔;

        對于任何一個間隔i,行為a和b的設置溫度分別為Ti,a和Ti,b,計算該間隔的最大設置溫度Ti,max和最小設置溫度Ti,min:

        根據(jù)積分和Jaccard公式,計算行為曲線的相似度sim_ba,b,具體公式如下:

        其中,Sa和Sb分別表示曲線La和Lb與X軸的面積,sim_ba,b為行為曲線a和b的相似度。

        2.3 計算用戶行為相似度

        用戶行為相似度能夠反映兩個用戶空調(diào)使用行為的一致性。本文通過行為曲線相似度來計算用戶之間的相似度。首先,針對特定用戶u,對該用戶的空調(diào)使用歷史行為曲線L={L1,L2,L3,……,Ln}進行層次聚類,整合為M個類別;然后,針對其他用戶k,計算該用戶每條歷史行為曲線距離用戶u最近的行為曲線Li(∈L),并以此劃分為Li所在的類別m(∈M);接著,計算用戶k與u在每個類別的相似度,并以所有類別的平均相似度,作為用戶k與u的空調(diào)使用行為相似度。

        具體算法如下:

        接下來,本節(jié)將從用戶行為曲線聚類、曲線類別相似度計算、用戶行為相似度計算這幾個部分進行詳細闡述。

        (1)用戶行為曲線聚類:針對特定用戶u,根據(jù)相似度閾值S,對該用戶的所有歷史行為曲線進行層次聚類。

        層次聚類是一種基于相似度的聚類方法,分為自下而上和自上而下兩種方法,圖4為層次聚類的合并方法。

        圖4 層次聚類的合并方法[14]

        下面介紹一個案例:假設用戶u有3條行為曲線,相似度閾值S為0.9,則最終合并為2個類別,如圖5所示。

        圖5 用戶行為曲線聚類

        閾值S的選取,對行為曲線聚類具有明顯的影響,對推薦效果也具有較大的影響。S設置越小,區(qū)分度越小,曲線越容易聚成同一個類別,選取的鄰居行為相似性越弱;S設置越大,區(qū)分度越大,曲線越不容易聚成同一個類別,選取的鄰居行為容易過擬合,推薦效果反而變差。在第3章實驗部分,將對該部分進行參數(shù)優(yōu)化。

        (2)曲線類別相似度計算:針對用戶k,計算該用戶每條歷史行為曲線距離用戶u最近的行為曲線Li(∈L),并以此劃分為Li所在的類別m(∈M);然后計算每個類別的平均相似度。計算公式如下:

        其中,n表示用戶k劃分為類別c的行為曲線數(shù)量,ui表示類別c中第i條用戶u所屬行為曲線;ki表示類別c中第i條用戶k所屬的行為曲線;sim_bui,ki表示類別c中第i條用戶行為曲線相似度,sim_cc即為類別c的行為相似度。案例如圖6所示。

        圖6 行為類別相似度計算

        類別1的平均相似度:

        類別2的平均相似度:

        用戶行為相似度計算[12]:計算M個類別的平均相似度,作為用戶u和k的相似度。計算公式如下:

        其中,n表示類別的數(shù)量,sim_cc表示第c個類別的行為相似度,sim_uu,k即為用戶u和k的平均行為相似度。如圖6所示案例:

        通過該方法,計算出每兩個用戶之間的空調(diào)使用行為相似度。

        2.4 協(xié)同過濾推薦

        本文的推薦包含了群體默認推薦值和協(xié)同過濾推薦。針對無歷史使用行為的新用戶,采用群體推薦默認值,當用戶使用了一段時間(7天)后,則采用協(xié)調(diào)過濾推薦。

        本節(jié)主要介紹協(xié)同過濾推薦算法[13]。首先,針對特定用戶,獲取該用戶與其他用戶的相似度;然后,查找距離該用戶最近的K個近鄰;最后,根據(jù)K個鄰居的當前空調(diào)控制參數(shù)(包括不限于設置溫度,當前控制參數(shù)無需區(qū)分智能推薦或用戶自主調(diào)控),生成推薦值,作為最終的控制參數(shù)。

        (1)獲取與其他用戶的相似度;

        (2)查詢該用戶的K近鄰;

        (3)推薦控制參數(shù)。

        獲取K個鄰居的當前設置參數(shù),計算平均值,作為最終的推薦參數(shù)。

        其中,u表示該用戶,k表示K個鄰居中的第k個用戶,Tk表示用戶k的當前設置溫度,sim_uu,k表示用戶u和k的用戶行為相似度。CFR(u)即為最終的推薦參數(shù)。

        每間隔時間T,通過本文的算法,可以實時獲取該用戶的推薦參數(shù)值,從而實現(xiàn)智能化控制。

        3 實驗與分析

        本節(jié)首先介紹實驗的數(shù)據(jù)集以及評估指標;然后,介紹調(diào)參和抽樣,最后對比多種推薦方法的效果,從而得出實驗結(jié)論。

        3.1 數(shù)據(jù)集與評估方法

        本文所用數(shù)據(jù)為:用戶信息、用戶使用行為。抽取了2019年的部分數(shù)據(jù),作為訓練集和測試集,具體如表1所示。

        表1 數(shù)據(jù)集

        本文主要包括設置溫度和風速的實時推薦(以溫度為例)。

        當用戶實際設置溫度與算法推薦溫度高度一致的時候,則代表用戶滿意算法推薦的溫度值,即算法推薦溫度可以為用戶帶來較強的熱舒適性體驗,因此本文采用如下的準確率公式來對推薦效果進行判定。

        實驗中,通過對比算法推薦溫度與用戶設置溫度,計算準確率P,以此評估該算法的效果。準確率計算公式如下:其中,TCu表示推薦溫度,Ts表示用戶設置溫度;14為[17,30]溫度范圍區(qū)間,以1℃為間隔,共14個值。

        3.2 結(jié)果與分析

        (1)參數(shù)調(diào)優(yōu)

        本算法中,閾值S(用戶行為相似度)的選取,對行為曲線聚類具有明顯的影響,對推薦效果也具有較大的影響,因此,本文針對S取值進行調(diào)優(yōu),選取不同的S值進行聚類,然后進行參數(shù)推薦,最后采用3.1節(jié)的公式進行準確率計算,得出不同閾值S下的準確率如圖7所示。

        圖7 相似度閾值 參數(shù)調(diào)優(yōu)

        從圖7中可以看出,當S≤0.85時,準確率較低且隨著S值變化不明顯,S=0.95時準確率最高,當S=1時,平均準確率又明顯下降。因此,本算法中S值參數(shù)選取為0.95。

        (2)各城市/季節(jié)效果對比

        為驗證本算法在各個城市及季節(jié)的有效性,本項目在全國典型城市進行抽樣,選取了北京、重慶、武漢等城市用戶的制冷和制熱模式的使用數(shù)據(jù),進行參數(shù)推薦,最后采用3.1節(jié)的公式進行準確率計算,對推薦算法的效果進行實驗論證,具體的準確率如表2所示。

        表2 不同城市/季節(jié)效果對比

        從表2中可以看出,在夏季制冷模式下,本項目算法推薦均有較好的效果,都在91%以上,其中北京、深圳最好,達到94.6%以上。冬季制熱模式下,由于用戶制熱差異較大,推薦效果差于夏季,且北方城市效果好于南方城市。

        (3)各算法效果對比

        為驗證本算法整理準確率,本項目對比了各算法的實際效果:用本實驗對測試集,分別運行KNN算法、基于用戶的協(xié)同過濾CF算法、UBC-based CF算法,計算準確率對推薦結(jié)果進行評估。如圖8所示。

        圖8 多算法推薦準確率效果對比

        可以看出,本項目UBC-based CF算法的準確率為91.43%,KNN算法的準確率為86.26%,基于用戶的協(xié)同過濾user-based CF算法準確率為87.19%,本項目算法準確率提升了5%,取得了較好的效果。

        4 應用效果

        本文研究的算法準確率高達91.43%。在用戶空調(diào)使用過程中:100次推薦值,約有91次推薦值可滿足用戶需求,用戶無需進行調(diào)節(jié)。而針對推薦值不滿足用戶需求的部分,若用戶產(chǎn)生調(diào)節(jié)行為,算法將會重新學習調(diào)整,越用越智能。

        本文研究的算法能夠最大限度地貼合用戶的實際使用需求,用戶無需動手。不僅能夠給用戶帶來空調(diào)智能化的便捷,同時也能夠更好地給用戶提供舒適性體驗。

        5 總結(jié)與展望

        本文研究基于行為曲線的用戶協(xié)同過濾控制推薦,提出了UBCbased CF算法:使用更細粒度的行為曲線來表示用戶,通過行為曲線相似度來計算用戶之前的行為相似度,從而基于用戶的協(xié)同過濾算法能夠獲得精準度更高的空調(diào)控制推薦服務。該算法解決了人群在不同場景和習慣上的差異性問題,推薦的操作更加準確和舒適。本文通過實驗分析,對模型參數(shù)進行調(diào)優(yōu),并驗證了在不同城市/季節(jié)下的推薦效果;另外,通過對比分析發(fā)現(xiàn),本算法的準確率比其他算法高出4%以上,具有很好的推薦效果。

        接下來,我們將進一步研究濕度、潔凈度、新鮮度等其他指標的推薦模型,以實現(xiàn)多維空氣的智能化控制。

        猜你喜歡
        類別準確率聚類
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
        高速公路車牌識別標識站準確率驗證法
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        服務類別
        新校長(2016年8期)2016-01-10 06:43:59
        基于改進的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應的聚類方法研究
        論類別股東會
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        91久久国产香蕉熟女线看| 人妻无码中文专区久久综合| 亚洲免费毛片网| 国产免费人成视频在线观看 | 精品人妻码一区二区三区剧情| av网站不卡的av在线| 精品露脸国产偷人在视频| 一本久久a久久精品vr综合| 男女一边摸一边做爽爽的免费阅读 | 日韩毛片基地一区二区三区| 大肥婆老熟女一区二区精品| 亚洲最新精品一区二区| 中文无码一区二区不卡av| 国产女在线| 国产精品成人黄色大片| 日本一区二区在线播放视频| 99e99精选视频在线观看| 国产免费人成视频在线观看| 成年女人毛片免费观看97| 狠狠色欧美亚洲综合色黑a| 日本视频一区二区三区观看| 怡红院av一区二区三区 | 日韩在线看片| 蜜臀一区二区av天堂| 国产成人无码精品久久久免费 | 欧美深夜福利网站在线观看| 亚洲天堂一区二区精品| 欧美日本精品一区二区三区| 国内精品久久久久久中文字幕| 成人精品国产亚洲欧洲| 97精品熟女少妇一区二区三区| 亚洲av无码一区二区三区天堂古代| 激情婷婷六月| 少妇又紧又色又爽又刺| 亚洲国产精品综合久久网络| 亚洲欧洲中文日韩久久av乱码| 丝袜美女污污免费观看的网站| 日韩人妻大奶子生活片| 欧洲熟妇色xxxx欧美老妇性| 中文在线а√天堂官网| 亚洲美女主播一区二区|