吳松澤,陳澤涵
(海南電網有限責任公司??诠╇娋?,海南,???570102)
電力市場受市場經濟影響,使電力的多種業(yè)務的融合度越來越高,目前提升電力營銷服務行為效率是電力企業(yè)轉型的最優(yōu)途徑[1],面對當前電力企業(yè)營銷觀念陳舊、服務意識重視程度不夠、無健全的營銷措施等情況為電力企業(yè)發(fā)展增加了一定阻力[2]。為此提升電力營銷服務行為效率十分關鍵。
針對電力企業(yè)發(fā)展現狀,方正云等[3]提出基于時間序列建模的電力營銷客戶交易行為分析優(yōu)化技術,該技術利用云模型獲取電力企業(yè)營銷數據并加以分析,但其在精準度方面存在欠缺,導致優(yōu)化效果不佳,彭文昊等[4]提出計及用戶參與不確定性的需求響應策略優(yōu)化技術,該技術通過構建目標函數,對目標展開優(yōu)化,當用戶目標無響應時,該技術無法及時展開優(yōu)化,因此具有較大缺陷。在江恩時間窗理論中[5],時間是影響市場趨勢重要因素之一,其原因在于時間可超過價位平衡且當到達特定時間時,其成交量可決定價位漲跌。
因此結合電力市場需求,研究基于時間窗序列的電力營銷服務行為效率優(yōu)化技術,為電力市場發(fā)展提供夯實基礎。
電力營銷服務行為效率話題是指在較短時間內被用戶關注度較大的話題,本文的候選字符串選擇具有重復特征的有意義串,通過計算數據相鄰類別重復串滿足電力服務行為的多樣性[6],獲取意義串,將該意義串作為初步突發(fā)特征。由于電力營銷服務行為效率數據的意義串具有時間與空間的局部性特征,假設T為觀察時間窗口,并將該窗口內的信息流作為優(yōu)化數據集合,由D={D1,D2,…}表示,提取優(yōu)化數據集合內有意義串組成窗口內信息特征空間,該空間由S表示,特征空間隨著時間窗口的變化而變化[7],特征空間變化示意圖如圖1所示。
圖1 特征空間變化示意圖
1.1.1 定義動量模型屬性
測試當前電力營銷服務行為話題狀態(tài)是否為突發(fā)性需定義該動量模型,通過計算話題的一階、二階序列判斷該話題是否為突發(fā)狀態(tài),其中一階序列和二階序列分別衡量話題突發(fā)程度指標與話題序列發(fā)展趨勢[8]。
識別話題突發(fā)特征是檢測話題突發(fā)性的關鍵步驟,基于信息特征空間S內的有意義串,使用動力學原理構建模型,定義其基本屬性,依據話題在發(fā)展過程中的能量大小和變化趨勢,判斷該話題是否具有突發(fā)性[9],定義特征屬性步驟如下。
第一步 假設q表示特征的質量,代表特征在數據流內的重要程度,且在較長時間內該質量值不變,則特征i的質量計算公式如下:
(1)
式中,t為時間。
第二步 特征i在某一時間內隨著時間動態(tài)變化的熱度為位移[10],由x表示,則值時間為t時,特征i的位移可通過下式計算:
x(t,i)=r·ft(t,i)+b·fd(t,i)+c·fu(t,i)
(2)
式中,調節(jié)參數為r、b、c,特征i在時間為t時出現的次數、含有特征i的電力營銷服務行為話題出現的次數、當前電力營銷服務用戶數量,分別由ft(t,i)、fd(t,i)、fu(t,i)表示。
特征i在時間為t時的速度、動量和加速度可依據基本屬性獲取,則計算公式如下:
σ=Δx/Δt
(3)
p=m*v
(4)
α=Δv/Δt
(5)
式中,σ、p、α分別表示特征i在時間為t時的速度、動量和加速度。利用速率檢測話題是否為突發(fā)信號,動量則表示該特征在某時間段內的能力大小和變化趨勢,加速度為x的二階序列表示該序列的變化趨勢。
1.1.2 獲取突發(fā)行為話題
對于類簇中心的動態(tài)調整,本文使用k-means聚類算法,利用該算法的簡便、易計算的特點對突發(fā)話題特征集合展開歸類并形成突發(fā)話題,并將電力營銷服務行為話題進行特征詞合并。
假設數據量為k,依據原始序列數據的最大數值和最小數值間的隨機數值確定其初始化方式,對數據量進行初始化并將該數據作為簇類中心點,突發(fā)特征序列數據進行標記后,以迭代的方式獲取數據量中心點,其計算步驟如下。
第一步 使用1和0標記所有點分配到k個類的系數r,屬于第k個類和不屬于第k個類分別標記為1和0,則aik∈{0,1},其中1≤i≤N,1≤k≤K。
第二步 通過上一步,獲取第k個類的數據樣本數量,其計算公式如下:
(6)
第三步 計算最小化損失函數的目標,其計算公式如下:
(7)
第四步 利用每個點到中心點的距離計算r的系數,計算公式如下:
(8)
第五步 重新計算每個聚類中性點,計算公式如下:
(9)
重復第四步與第五步,當每個類的中心點偏離值趨近收斂后,此時的簇類即為電力營銷服務行為的突發(fā)話題[11]。
將待處理數據投影到一組余弦正交基上的變換方法稱為離散余弦變換,將電力營銷服務行為的突發(fā)話題作為待處理數據,可有效將隨著時間變化的用戶數據成分分量和偶然數據分離[12-13],變化后的數據集中程度得到大大增加,且可充分展示該數據特點。
假設用戶行為采樣數據X由表示,其對應的離散余弦變換矩陣由B表示,該矩陣為Y*Y的變化矩陣,其公式如下:
(10)
式中,i=j=Y。
依據式(10)可知:
(11)
L=BX
(12)
其中,變換向量L=(l1,l2,…,ln),則有:
(13)
本文利用反向傳播神經網絡算法對電力營銷服務行為效率展開優(yōu)化,利用其建立目標函數,獲取實際輸出值與期望輸出值的誤差均方值,依據誤差均方值最小原則建立目標函數的凹解集合,通過梯度下降方法計算極小值點[14]。假設反向傳播神經網絡的隱單元為Vj(j=1,2,…,j0),與其相連的前向輸入單元和后向輸出單元分別由ξk(k=1,2,…,K)、Oi(i=1,2,…,I0)表示,輸入單元到隱單元的配置權重系數由wjk表示,從隱單元到輸出單元的配置權重系數由Wij表示,則權重系數矩陣為ω={W,w},輸入類型使用上角標τ,τ=1,2,…,P區(qū)分,g1、g2則表示激活函數,該函數可實現不同隱含層之間的連續(xù)過渡。
當確定輸入模式為μ時,隱單元j的輸入計算公式如下:
(14)
后向輸出計算公式如下:
(15)
單元i的前向輸入計算公式如下:
(16)
將激活函數整合后可得:
(17)
則單個單元目標的誤差函數計算公式如下:
(18)
單元i的總誤差均方計算公式如下:
(19)
式中,梯度的負方向為優(yōu)化迭代權重調整方向,則從隱單元到輸出單元的梯度變化計算公式如下:
(20)
(21)
ωnew=ωold+Δω
(22)
通過上述計算流程,綜合考慮實際建模難度與運算代價[15],使用2個隱含層結構進行實際配置,利用反向傳播神經網絡的神經元上層和下層的全連接方式建立其映射路徑,從而獲取最終電力營銷服務行為效率優(yōu)化結果。
將某電力企業(yè)2015~2020年電力營銷服務行為數據共8 000條數據作為研究樣本,測試本文技術實際使用性能。以符合度作為衡量數據預處理能力指標,分別使用本文技術、文獻[3]技術和文獻[4]技術對8 000條數據展開預處理,繪制電力營銷服務行為話題序列,結果如圖2所示。其中,文獻[3]技術代表基于時間序列建模的電力營銷客戶交易行為分析優(yōu)化技術,文獻[4]技術代表計及用戶參與不確定性的需求響應策略優(yōu)化技術。
圖2 3種技術數據預處理能力
分析圖2可知,隨著數據量的增加,數據預處理的符合度也隨之下降,其中本文技術的數據預處理符合度從數據量為1 000條開始,其符合度始終保持在0.98左右,隨著數據量的增加其符合度下降幅度微乎其微,而文獻[3]與文獻[4]技術數據預處理的符合度隨著數據量的增加下降幅度較大,且符合度曲線均出現不同程度的波動,表示文獻[3]與文獻[4]技術數據預處理能力較脆弱,綜合分析可知,本文技術具有優(yōu)越的數據預處理能力。
取8 000條數據樣本,分析分別使用3種技術對數據樣本進行余弦變換后的波動特征,以隨機二折交叉的方法抽取每次訓練樣本數據的一半作為訓練數據集,剩余的數據作為測試數據集,對比3種技術處理的訓練數據集合和測試數據集的精確度、虛警比例和漏檢比率。
表1 訓練數據集與測試數據集對比結果
分析表1可知,本文技術在分析訓練數據集與測試數據集時,其平均精確度、虛警比例和漏檢比率分別為96.12%、0.68%、0.72%,較文獻[3]技術和文獻[4]技術均較高,因此,本文技術具有較高分析電力營銷服務行為能力。
分別使用3種技術對8 000組數據實施優(yōu)化,對比3種技術優(yōu)化消耗時間,結果如圖3所示。
分析圖3可知,隨著數據量的增加,優(yōu)化消耗時間也隨之增加,其中文獻[4]技術在數據量為1 000~2 000時,優(yōu)化耗時低于本文技術與文獻[3]技術,當數據量超過2 000個后,其優(yōu)化耗時曲線超過本文技術并呈現迅速上升趨勢,文獻[3]技術優(yōu)化耗時始終較高,而本文技術的優(yōu)化耗時曲線上升趨勢較平緩,當數據量為8 000個時,本文技術優(yōu)化耗時最低僅為3.8 min,由此可知,本文技術在優(yōu)化耗時方面具有較高優(yōu)勢。
圖3 3種技術優(yōu)化消耗時間對比
以銷售變現時間和人均業(yè)務量為指標,測試3種技術優(yōu)化能力,結果如圖4所示。
(a) 銷售變現時間對比
分析圖4(a)可知,使用本文技術優(yōu)化后,該企業(yè)的銷售變現實際明顯降低,在優(yōu)化后的第60個月時,與實際銷售變現天數相差65 d,且相較文獻[3]技術和文獻[4]技術優(yōu)化后的銷售變現天數分別降低58 d和43 d;分析圖4(b)可知,使用本文技術優(yōu)化后,在60個月內該企業(yè)的人均業(yè)務量平均值始終保持在19個左右,而文獻[3]技術與文獻[4]技術優(yōu)化后的人均業(yè)務量分別為16個和13個,遠低于本文技術優(yōu)化后的人均業(yè)務量,綜合分析可知,使用本文技術對該企業(yè)電力營銷服務行為效率進行優(yōu)化后,其銷售變現時間明顯變短,人均業(yè)務量更高,該技術具有較強優(yōu)化能力。
本文將時間窗序列引入到優(yōu)化電力營銷服務行為效率中,研究基于時間窗序列的電力營銷服務行為效率優(yōu)化技術,為推動電力行業(yè)發(fā)展提供有力支撐。實驗結果表明:本文技術的數據預處理能力,從數據量為1 000條開始,其符合度始終保持在0.98左右,數據預處理能力較強;對比訓練數據集合測試數據集,其平均精確度為96.12%,漏檢率為0.72%,數據分析能力強;優(yōu)化后的銷售變現時間較短且人均業(yè)務量較高,優(yōu)化能力卓越。