周磊 朱超群 駱釗 高澤勇
摘 要:隨著市場(chǎng)競(jìng)爭(zhēng)的日趨激烈和電力產(chǎn)業(yè)的不斷升級(jí),綜合能源服務(wù)正成為未來(lái)電力發(fā)展的新趨勢(shì)。綜合能源線上電商化服務(wù)是未來(lái)電網(wǎng)智能能源的關(guān)鍵組成部分,也是從電網(wǎng)能源集成服務(wù)向多能源服務(wù)提供商競(jìng)爭(zhēng)供應(yīng)戰(zhàn)略轉(zhuǎn)型的重要途徑,一種有效的綜合能源服務(wù)推薦方法對(duì)綜合能源公司在能源競(jìng)爭(zhēng)中占據(jù)有利地位具有重要作用。鑒于此,根據(jù)用戶的興趣特點(diǎn)和用戶在系統(tǒng)中的行為數(shù)據(jù)來(lái)挖掘用戶的興趣偏好,選取部分?jǐn)?shù)據(jù)建立用戶興趣圖譜并進(jìn)行譜聚類(lèi),將聚類(lèi)后的數(shù)據(jù)導(dǎo)入隨機(jī)森林模型進(jìn)行評(píng)分預(yù)測(cè)訓(xùn)練,剩余數(shù)據(jù)提取用戶屬性信息導(dǎo)入模型獲取預(yù)測(cè)評(píng)分,并與原始評(píng)分進(jìn)行對(duì)比,以驗(yàn)證模型的有效性。
關(guān)鍵詞:綜合能源服務(wù);推薦算法;興趣圖譜;譜聚類(lèi);隨機(jī)森林
0? ? 引言
隨著國(guó)家對(duì)電力體制改革的不斷推進(jìn)、售電側(cè)市場(chǎng)的開(kāi)放以及新型能源大量接入傳統(tǒng)電網(wǎng),綜合能源服務(wù)將逐漸成為電網(wǎng)公司的運(yùn)營(yíng)重點(diǎn)。目前,我國(guó)電力企業(yè)發(fā)展正處于轉(zhuǎn)型的關(guān)鍵時(shí)期[1-6]。綜合能源服務(wù)是一種新型的能源服務(wù)模式,可以滿足客戶多樣化的能源生產(chǎn)和消費(fèi)需求,涉及能源規(guī)劃設(shè)計(jì)、設(shè)施投資建設(shè)、多能源運(yùn)行服務(wù)、融資服務(wù)等。同時(shí),綜合能源服務(wù)融合了物聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算等關(guān)鍵技術(shù),以提高能源利用率,降低能源使用成本。目前,已有很多學(xué)者針對(duì)綜合能源服務(wù)進(jìn)行了深入的研究,同時(shí),推薦系統(tǒng)在生活中也有諸多應(yīng)用,并給人們帶來(lái)了極大的便利,但關(guān)于綜合能源服務(wù)推薦的相關(guān)文獻(xiàn)還很少。
綜合能源服務(wù)推薦在未來(lái)將成為綜合能源服務(wù)的重要組成模塊,鑒于此,本文提出一種集成學(xué)習(xí)的隨機(jī)森林推薦算法,結(jié)合綜合能源用戶興趣圖譜,幫助用戶在大量綜合能源服務(wù)類(lèi)型信息中以最快的速度獲取感興趣及有用的服務(wù)類(lèi)別。
本文首先介紹綜合能源線上服務(wù)目錄;然后對(duì)獲取的綜合能源用戶評(píng)分?jǐn)?shù)據(jù)進(jìn)行興趣圖譜譜聚類(lèi),再將聚類(lèi)數(shù)據(jù)導(dǎo)入隨機(jī)森林回歸模型訓(xùn)練;最后進(jìn)行簡(jiǎn)單的案例研究,驗(yàn)證推薦算法的正確性,并對(duì)本文研究進(jìn)行總結(jié)。
1? ? 綜合能源線上服務(wù)目錄
本文提出的綜合能源服務(wù)目錄包括6個(gè)菜單:新零售、智能硬件、企業(yè)代維、能效提升、移動(dòng)儲(chǔ)能和電力設(shè)備租賃。
2? ? 綜合能源服務(wù)推薦模型的建立及訓(xùn)練
本節(jié)將建立基于隨機(jī)森林的綜合能源服務(wù)推薦模型。首先對(duì)獲取的用戶數(shù)據(jù)進(jìn)行用戶興趣圖譜畫(huà)像,取出80%的數(shù)據(jù)作為訓(xùn)練集,剩余20%的數(shù)據(jù)作為測(cè)試集,再將訓(xùn)練集數(shù)據(jù)根據(jù)其屬性及用戶之間的內(nèi)在因子進(jìn)行聚類(lèi),聚類(lèi)完成后的每一簇?cái)?shù)據(jù)導(dǎo)入隨機(jī)森林模型進(jìn)行訓(xùn)練。
2.1? ? 基于譜聚類(lèi)的興趣圖譜
本文數(shù)據(jù)來(lái)源于電網(wǎng)公司,收集了10 000名綜合能源用戶對(duì)24項(xiàng)服務(wù)類(lèi)型的評(píng)分以及用戶屬性(電壓等級(jí)、歷史用電量、年產(chǎn)值、占地面積以及電費(fèi)占比等)。
2.1.1? ? 構(gòu)建用戶興趣圖譜
對(duì)收集到的結(jié)構(gòu)化用戶信息進(jìn)行屬性、關(guān)系、實(shí)體提取,通過(guò)指代消解、實(shí)體消歧、實(shí)體鏈接等關(guān)鍵技術(shù),將零散的信息進(jìn)行知識(shí)融合后得到一系列知識(shí)的表達(dá),再經(jīng)質(zhì)量評(píng)估得到用戶興趣圖譜。
2.1.2? ? 譜聚類(lèi)
將構(gòu)建好的結(jié)構(gòu)化的用戶興趣圖譜與能源服務(wù)產(chǎn)品之間建立聯(lián)系,進(jìn)行用戶偏好聚類(lèi)。將用戶屬性與能源服務(wù)產(chǎn)品進(jìn)行關(guān)聯(lián),將評(píng)分相近的用戶聚類(lèi),為后續(xù)屬性相同的新用戶提供評(píng)分預(yù)估基礎(chǔ)。針對(duì)一個(gè)新用戶,暫時(shí)不參考其訪問(wèn)和評(píng)價(jià)標(biāo)簽,先根據(jù)用戶標(biāo)簽,考慮其業(yè)務(wù)方面的特點(diǎn)進(jìn)行推薦。
2.2? ? 隨機(jī)森林回歸模型
隨機(jī)森林回歸模型由多棵CART(Classification and Regression Tree)[7]回歸樹(shù)構(gòu)成,回歸樹(shù)對(duì)應(yīng)著輸入空間(特征空間)的一個(gè)劃分以及在劃分單元上的輸出值,可用集合來(lái)表示,即:{h(X,Ψk)|k=1,2,…,N},X表示輸入向量矩陣,Ψk表示生成k棵子回歸樹(shù),其集合中生長(zhǎng)的子回歸樹(shù)都是基于Bootstrap方法抽取的獨(dú)立樣本,且具有相同的分布[4],最后統(tǒng)計(jì)得出最終推薦結(jié)果。
Step1:假定劃分的訓(xùn)練集數(shù)據(jù)樣本為N,則從中采用Bootstrap抽樣方法抽取容量相同的樣本,形成訓(xùn)練子集。
Step2:假設(shè)訓(xùn)練子集有M個(gè)特征,則從中隨機(jī)抽取m個(gè)作為分裂特征子集(m≤M),后續(xù)采用CART回歸算法分裂而不剪枝。
Step3:重復(fù)n次Step1~Step2,從而生成相應(yīng)數(shù)量的子回歸樹(shù)(Ψ1,Ψ2,…,Ψn)并進(jìn)行結(jié)果預(yù)測(cè),構(gòu)成RF回歸預(yù)測(cè)推薦模型。
Step4:利用劃分的測(cè)試集驗(yàn)證該模型的可靠性,以n棵子回歸樹(shù)的輸出平均值獲得最終推薦結(jié)果。
本文采用Forest-RI形式,若訓(xùn)練集有M維,隨機(jī)選擇F(F≤M)個(gè)特征向量進(jìn)行訓(xùn)練,如果F取得足夠小,則子樹(shù)間的相關(guān)性趨于減弱;同時(shí),子樹(shù)集成的效果又隨著F的增大而提高。綜合考慮,通常需要按照經(jīng)驗(yàn)公式(1)[6]確定F值。
F=1+log2M? ? ? ? ? ? ? ? ? ? (1)
2.3? ? 基于譜聚類(lèi)的隨機(jī)森林推薦模型訓(xùn)練
基于譜聚類(lèi)與隨機(jī)森林算法模型內(nèi)容以及綜合能源用戶的真實(shí)評(píng)分?jǐn)?shù)據(jù),構(gòu)建個(gè)性化推薦系統(tǒng)。選取80%的用戶原始數(shù)據(jù)進(jìn)行處理,構(gòu)建用戶興趣圖譜,圖譜導(dǎo)入譜聚類(lèi)模型進(jìn)行分割,聚類(lèi)為Nc(Nc=6)簇,將Nc簇?cái)?shù)據(jù)歸一化處理后導(dǎo)入隨機(jī)森林回歸模型,使用經(jīng)驗(yàn)公式獲得模型超參數(shù),F(xiàn)R模型訓(xùn)練結(jié)束后,獲得各子序列分量的預(yù)測(cè)值并進(jìn)行反歸一化處理,通過(guò)疊加所有子序列的預(yù)測(cè)值得到最終的預(yù)測(cè)結(jié)果。
3? ? 案例分析
將剩余20%作為測(cè)試集的數(shù)據(jù)導(dǎo)入訓(xùn)練完成的基于譜聚類(lèi)的隨機(jī)森林推薦模型中,得到的推薦結(jié)果如圖1所示。
提取測(cè)試集中用戶屬性數(shù)據(jù)導(dǎo)入上述推薦模型中,經(jīng)模型計(jì)算后得出綜合能源用戶對(duì)24項(xiàng)服務(wù)類(lèi)型的預(yù)測(cè)評(píng)分,將每一用戶對(duì)服務(wù)類(lèi)別的預(yù)測(cè)評(píng)分和測(cè)試集原始評(píng)分由高到低進(jìn)行排序,再將排序后的預(yù)測(cè)評(píng)分和測(cè)試集原始評(píng)分取前十的每一項(xiàng)進(jìn)行“與”運(yùn)算。若項(xiàng)目類(lèi)別及評(píng)分相同,則在對(duì)比結(jié)果中顯示項(xiàng)目服務(wù)類(lèi)別;若項(xiàng)目類(lèi)別及評(píng)分不相同,則在對(duì)比結(jié)果中顯示“nan”。
由圖1推薦結(jié)果可以看出,該推薦模型經(jīng)過(guò)訓(xùn)練后,導(dǎo)入用戶屬性數(shù)據(jù),得到的服務(wù)類(lèi)別預(yù)測(cè)評(píng)分與實(shí)際評(píng)分重合度較高,推薦準(zhǔn)確率達(dá)到60%,說(shuō)明該推薦模型是有效的。
4? ? 結(jié)語(yǔ)
基于綜合能源服務(wù)類(lèi)型包含的6個(gè)一級(jí)目錄,即新零售、智能硬件、企業(yè)代維、能效提升、移動(dòng)儲(chǔ)能和電力設(shè)備租賃,本文提出了一種針對(duì)綜合能源服務(wù)的推薦方法,該基于譜聚類(lèi)的隨機(jī)森林推薦算法適用于綜合能源服務(wù)推薦,可以作為功能模塊集成在未來(lái)的綜合能源服務(wù)平臺(tái)中。最后,本文通過(guò)一個(gè)簡(jiǎn)單的案例證明了所提出的類(lèi)別和服務(wù)推薦方法的有效性。
[參考文獻(xiàn)]
[1] 李揚(yáng),宋天立,王子健.基于用戶數(shù)據(jù)深度挖掘的綜合能源服務(wù)關(guān)鍵問(wèn)題探析[J].電力需求側(cè)管理,2018,20(3):1-5.
[2] JAIN N,ALLEYNE A G.A Framework for the Optimization of Integrated Energy Systems[J].Applied Thermal Engineering,2012,48:495-505.
[3] 王靜雯,李華強(qiáng),李旭翔,等.綜合能源服務(wù)效用模型及用戶需求評(píng)估[J].中國(guó)電機(jī)工程學(xué)報(bào),2020,40(2):411-425.
[4] MIKOLOV T,SUTSKEVER I,CHEN K,et al.Distributed Representations of Words and Phrases and their Compositionality[C]// Proceedings of the 26th
International conference on Neural Information Processing Systems,2013:3111-3119.
[5] CHEN T Q,ZHANG W N,LU Q X,et al.SVDFeature:A Toolkit for Feature-based Collaborative Filtering[J].Journal of Machine Learning Research,2012,13(116):3619-3622.
[6] GOLDBERG D,NICHOLS D,OKI B M,et al.Using Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70.
[7] LESKOVEC J,RAJARAMAN A,ULLMAN J D.Mining of Massive Datasets[M].3rd ED.Cambridge:Cambridge University Press,2020.
收稿日期:2021-02-03
作者簡(jiǎn)介:周磊(1989—),男,山西臨汾人,博士,工程師,研究方向:營(yíng)業(yè)業(yè)務(wù)管理、電能替代和綜合能源技術(shù)。
朱超群(1992—),男,山東菏澤人,碩士,工程師,研究方向:電能替代和綜合能源技術(shù)。
通信作者:駱釗(1986—),男,云南鎮(zhèn)雄人,博士,副教授,研究方向:微電網(wǎng)優(yōu)化、電力系統(tǒng)運(yùn)行與控制、信息技術(shù)在電力系統(tǒng)中的應(yīng)用。