周磊 朱超群 駱釗 高澤勇
摘 要:隨著市場競爭的日趨激烈和電力產(chǎn)業(yè)的不斷升級,綜合能源服務正成為未來電力發(fā)展的新趨勢。綜合能源線上電商化服務是未來電網(wǎng)智能能源的關鍵組成部分,也是從電網(wǎng)能源集成服務向多能源服務提供商競爭供應戰(zhàn)略轉(zhuǎn)型的重要途徑,一種有效的綜合能源服務推薦方法對綜合能源公司在能源競爭中占據(jù)有利地位具有重要作用。鑒于此,根據(jù)用戶的興趣特點和用戶在系統(tǒng)中的行為數(shù)據(jù)來挖掘用戶的興趣偏好,選取部分數(shù)據(jù)建立用戶興趣圖譜并進行譜聚類,將聚類后的數(shù)據(jù)導入隨機森林模型進行評分預測訓練,剩余數(shù)據(jù)提取用戶屬性信息導入模型獲取預測評分,并與原始評分進行對比,以驗證模型的有效性。
關鍵詞:綜合能源服務;推薦算法;興趣圖譜;譜聚類;隨機森林
0? ? 引言
隨著國家對電力體制改革的不斷推進、售電側(cè)市場的開放以及新型能源大量接入傳統(tǒng)電網(wǎng),綜合能源服務將逐漸成為電網(wǎng)公司的運營重點。目前,我國電力企業(yè)發(fā)展正處于轉(zhuǎn)型的關鍵時期[1-6]。綜合能源服務是一種新型的能源服務模式,可以滿足客戶多樣化的能源生產(chǎn)和消費需求,涉及能源規(guī)劃設計、設施投資建設、多能源運行服務、融資服務等。同時,綜合能源服務融合了物聯(lián)網(wǎng)、大數(shù)據(jù)和云計算等關鍵技術,以提高能源利用率,降低能源使用成本。目前,已有很多學者針對綜合能源服務進行了深入的研究,同時,推薦系統(tǒng)在生活中也有諸多應用,并給人們帶來了極大的便利,但關于綜合能源服務推薦的相關文獻還很少。
綜合能源服務推薦在未來將成為綜合能源服務的重要組成模塊,鑒于此,本文提出一種集成學習的隨機森林推薦算法,結(jié)合綜合能源用戶興趣圖譜,幫助用戶在大量綜合能源服務類型信息中以最快的速度獲取感興趣及有用的服務類別。
本文首先介紹綜合能源線上服務目錄;然后對獲取的綜合能源用戶評分數(shù)據(jù)進行興趣圖譜譜聚類,再將聚類數(shù)據(jù)導入隨機森林回歸模型訓練;最后進行簡單的案例研究,驗證推薦算法的正確性,并對本文研究進行總結(jié)。
1? ? 綜合能源線上服務目錄
本文提出的綜合能源服務目錄包括6個菜單:新零售、智能硬件、企業(yè)代維、能效提升、移動儲能和電力設備租賃。
2? ? 綜合能源服務推薦模型的建立及訓練
本節(jié)將建立基于隨機森林的綜合能源服務推薦模型。首先對獲取的用戶數(shù)據(jù)進行用戶興趣圖譜畫像,取出80%的數(shù)據(jù)作為訓練集,剩余20%的數(shù)據(jù)作為測試集,再將訓練集數(shù)據(jù)根據(jù)其屬性及用戶之間的內(nèi)在因子進行聚類,聚類完成后的每一簇數(shù)據(jù)導入隨機森林模型進行訓練。
2.1? ? 基于譜聚類的興趣圖譜
本文數(shù)據(jù)來源于電網(wǎng)公司,收集了10 000名綜合能源用戶對24項服務類型的評分以及用戶屬性(電壓等級、歷史用電量、年產(chǎn)值、占地面積以及電費占比等)。
2.1.1? ? 構建用戶興趣圖譜
對收集到的結(jié)構化用戶信息進行屬性、關系、實體提取,通過指代消解、實體消歧、實體鏈接等關鍵技術,將零散的信息進行知識融合后得到一系列知識的表達,再經(jīng)質(zhì)量評估得到用戶興趣圖譜。
2.1.2? ? 譜聚類
將構建好的結(jié)構化的用戶興趣圖譜與能源服務產(chǎn)品之間建立聯(lián)系,進行用戶偏好聚類。將用戶屬性與能源服務產(chǎn)品進行關聯(lián),將評分相近的用戶聚類,為后續(xù)屬性相同的新用戶提供評分預估基礎。針對一個新用戶,暫時不參考其訪問和評價標簽,先根據(jù)用戶標簽,考慮其業(yè)務方面的特點進行推薦。
2.2? ? 隨機森林回歸模型
隨機森林回歸模型由多棵CART(Classification and Regression Tree)[7]回歸樹構成,回歸樹對應著輸入空間(特征空間)的一個劃分以及在劃分單元上的輸出值,可用集合來表示,即:{h(X,Ψk)|k=1,2,…,N},X表示輸入向量矩陣,Ψk表示生成k棵子回歸樹,其集合中生長的子回歸樹都是基于Bootstrap方法抽取的獨立樣本,且具有相同的分布[4],最后統(tǒng)計得出最終推薦結(jié)果。
Step1:假定劃分的訓練集數(shù)據(jù)樣本為N,則從中采用Bootstrap抽樣方法抽取容量相同的樣本,形成訓練子集。
Step2:假設訓練子集有M個特征,則從中隨機抽取m個作為分裂特征子集(m≤M),后續(xù)采用CART回歸算法分裂而不剪枝。
Step3:重復n次Step1~Step2,從而生成相應數(shù)量的子回歸樹(Ψ1,Ψ2,…,Ψn)并進行結(jié)果預測,構成RF回歸預測推薦模型。
Step4:利用劃分的測試集驗證該模型的可靠性,以n棵子回歸樹的輸出平均值獲得最終推薦結(jié)果。
本文采用Forest-RI形式,若訓練集有M維,隨機選擇F(F≤M)個特征向量進行訓練,如果F取得足夠小,則子樹間的相關性趨于減弱;同時,子樹集成的效果又隨著F的增大而提高。綜合考慮,通常需要按照經(jīng)驗公式(1)[6]確定F值。
F=1+log2M? ? ? ? ? ? ? ? ? ? (1)
2.3? ? 基于譜聚類的隨機森林推薦模型訓練
基于譜聚類與隨機森林算法模型內(nèi)容以及綜合能源用戶的真實評分數(shù)據(jù),構建個性化推薦系統(tǒng)。選取80%的用戶原始數(shù)據(jù)進行處理,構建用戶興趣圖譜,圖譜導入譜聚類模型進行分割,聚類為Nc(Nc=6)簇,將Nc簇數(shù)據(jù)歸一化處理后導入隨機森林回歸模型,使用經(jīng)驗公式獲得模型超參數(shù),F(xiàn)R模型訓練結(jié)束后,獲得各子序列分量的預測值并進行反歸一化處理,通過疊加所有子序列的預測值得到最終的預測結(jié)果。
3? ? 案例分析
將剩余20%作為測試集的數(shù)據(jù)導入訓練完成的基于譜聚類的隨機森林推薦模型中,得到的推薦結(jié)果如圖1所示。
提取測試集中用戶屬性數(shù)據(jù)導入上述推薦模型中,經(jīng)模型計算后得出綜合能源用戶對24項服務類型的預測評分,將每一用戶對服務類別的預測評分和測試集原始評分由高到低進行排序,再將排序后的預測評分和測試集原始評分取前十的每一項進行“與”運算。若項目類別及評分相同,則在對比結(jié)果中顯示項目服務類別;若項目類別及評分不相同,則在對比結(jié)果中顯示“nan”。
由圖1推薦結(jié)果可以看出,該推薦模型經(jīng)過訓練后,導入用戶屬性數(shù)據(jù),得到的服務類別預測評分與實際評分重合度較高,推薦準確率達到60%,說明該推薦模型是有效的。
4? ? 結(jié)語
基于綜合能源服務類型包含的6個一級目錄,即新零售、智能硬件、企業(yè)代維、能效提升、移動儲能和電力設備租賃,本文提出了一種針對綜合能源服務的推薦方法,該基于譜聚類的隨機森林推薦算法適用于綜合能源服務推薦,可以作為功能模塊集成在未來的綜合能源服務平臺中。最后,本文通過一個簡單的案例證明了所提出的類別和服務推薦方法的有效性。
[參考文獻]
[1] 李揚,宋天立,王子健.基于用戶數(shù)據(jù)深度挖掘的綜合能源服務關鍵問題探析[J].電力需求側(cè)管理,2018,20(3):1-5.
[2] JAIN N,ALLEYNE A G.A Framework for the Optimization of Integrated Energy Systems[J].Applied Thermal Engineering,2012,48:495-505.
[3] 王靜雯,李華強,李旭翔,等.綜合能源服務效用模型及用戶需求評估[J].中國電機工程學報,2020,40(2):411-425.
[4] MIKOLOV T,SUTSKEVER I,CHEN K,et al.Distributed Representations of Words and Phrases and their Compositionality[C]// Proceedings of the 26th
International conference on Neural Information Processing Systems,2013:3111-3119.
[5] CHEN T Q,ZHANG W N,LU Q X,et al.SVDFeature:A Toolkit for Feature-based Collaborative Filtering[J].Journal of Machine Learning Research,2012,13(116):3619-3622.
[6] GOLDBERG D,NICHOLS D,OKI B M,et al.Using Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70.
[7] LESKOVEC J,RAJARAMAN A,ULLMAN J D.Mining of Massive Datasets[M].3rd ED.Cambridge:Cambridge University Press,2020.
收稿日期:2021-02-03
作者簡介:周磊(1989—),男,山西臨汾人,博士,工程師,研究方向:營業(yè)業(yè)務管理、電能替代和綜合能源技術。
朱超群(1992—),男,山東菏澤人,碩士,工程師,研究方向:電能替代和綜合能源技術。
通信作者:駱釗(1986—),男,云南鎮(zhèn)雄人,博士,副教授,研究方向:微電網(wǎng)優(yōu)化、電力系統(tǒng)運行與控制、信息技術在電力系統(tǒng)中的應用。