郭珊珊,張 立,崔 威,王志紅,趙貝貝
(1.國(guó)網(wǎng)河南省電力公司,河南 鄭州 450000;2.華北電力大學(xué)(北京),北京 102206)
采購(gòu)環(huán)節(jié)是提高企業(yè)效益的源頭,為了適應(yīng)新形勢(shì)下的發(fā)展,電網(wǎng)企業(yè)對(duì)采購(gòu)管理提出了更高、更嚴(yán)的標(biāo)準(zhǔn)。由于電網(wǎng)企業(yè)服務(wù)類采購(gòu)對(duì)象種類多、數(shù)量大,合理地采購(gòu)方法可以顯著提高工作效率,減少采購(gòu)費(fèi)用的支出,所以對(duì)每類需求選取適合地采購(gòu)組織方式具有重要的戰(zhàn)略意義。
在快速聚類與系統(tǒng)聚類模型方面,國(guó)內(nèi)外學(xué)者在不同方面進(jìn)行了應(yīng)用。在混合聚類運(yùn)用方面,將快速聚類與系統(tǒng)聚類相結(jié)合的混合聚類方法對(duì)交通數(shù)據(jù)進(jìn)行分析,并以經(jīng)典的silhouette評(píng)價(jià)指標(biāo)作為聚類終止條件制定了相應(yīng)時(shí)段的控制方案[1]。在快速聚類運(yùn)用方面,使用K-means聚類和商業(yè)自動(dòng)數(shù)據(jù)挖掘工具KXEN提出了江蘇常州電信客戶細(xì)分的解決方案[2]。計(jì)算Web服務(wù)的相似性,并使用該數(shù)據(jù)生成K均值聚類算法的集群[3]。采用兩階段K均值聚類來(lái)識(shí)別第一階段的不可信度指數(shù),根據(jù)第二階段的索引對(duì)用戶進(jìn)行聚類,得到可靠的聚類信息[4]。從數(shù)據(jù)挖掘技術(shù),客戶的供電可靠性要求、客戶價(jià)值和客戶行為三個(gè)維度,建立細(xì)分指標(biāo)體系,利用K-means聚類法建立客戶細(xì)分模型[5]。在K-means算法改進(jìn)方面,應(yīng)用改進(jìn)的K-means算法進(jìn)行客戶聚類,將該方法與經(jīng)典K均值和分層方法的其他聚類算法進(jìn)行比較[6]。在系統(tǒng)聚類運(yùn)用方面,加權(quán)的系統(tǒng)聚類方法通過(guò)對(duì)不同的客戶特征賦予不同的權(quán)重,達(dá)到對(duì)客戶的聚類結(jié)果更符合企業(yè)經(jīng)營(yíng)目標(biāo)的目的[7]。應(yīng)用系統(tǒng)聚類建立圖書(shū)館讀者細(xì)分模型,進(jìn)而提出了四種不同的細(xì)分方式[8]。通過(guò)文獻(xiàn)綜述可知,國(guó)內(nèi)外學(xué)者對(duì)聚類模型的應(yīng)用都偏向于一種方法的使用,本文將快速聚類與系統(tǒng)聚類進(jìn)行綜合應(yīng)用,使得服務(wù)類項(xiàng)目的分類更加準(zhǔn)確,從而有效提高服務(wù)類采購(gòu)質(zhì)量,保證采購(gòu)高效性。
(1)系統(tǒng)聚類的基本思想為:對(duì)于位置類別的樣本或變量,依據(jù)相應(yīng)的定義把他們分為若干類,分類過(guò)程是一個(gè)逐步減小類別的過(guò)程,在每一個(gè)聚類層次,必須滿足“類內(nèi)差異小、類間差異大”的原則,直至歸為一類。評(píng)價(jià)聚類效果指標(biāo)一般是方差,距離小的樣品所組成的類方差較小。樣本距離計(jì)算方法較多,本文用歐氏距離計(jì)算方法:
系統(tǒng)聚類過(guò)程操作步驟如下:
①設(shè)初始模式樣本共有N個(gè),每個(gè)樣本自成一類,即建立N類,計(jì)算各類之間的距離(初始時(shí)即為各樣本間的距離),得到一個(gè)N*N維的距離矩陣D(0)。這里,標(biāo)號(hào)(0)表示聚類開(kāi)始運(yùn)算前的狀態(tài)。
②假設(shè)前一步聚類運(yùn)算中已求得距離矩陣D(n),n為逐次聚類合并的次數(shù),則求D(n)中的最小元素。如果它是)和)兩類之間的距離,則將)和)兩類合并為一類由此建立新的分類:
④返回第二步,重復(fù)計(jì)算及合并,直到得到滿意的分類結(jié)果(如:達(dá)到所需的聚類數(shù)目,或D(n)中的最小分量超過(guò)給定閾值D等)。
(2)快速聚類的基本思想為將給定的樣本劃分為K類,K預(yù)先指定?;谑咕垲愋阅苤笜?biāo)最小化,所用的聚類準(zhǔn)則函數(shù)是聚類集中每一個(gè)樣本點(diǎn)到該類中心的距離平方之和,并使其最小化。
聚類過(guò)程操作步驟如下:
①為每個(gè)聚類確定一個(gè)初始聚類中心,這樣,就有K個(gè)初始聚類中心。
②將樣本集中的樣本Xi按照最小距離原則分配到最鄰近聚類Zj。
通過(guò)上述實(shí)驗(yàn)結(jié)果分析,芪桂通痹湯治療糖尿病周圍神經(jīng)病變,能明顯改善疼痛麻木情況,且對(duì)神疲怠乏,自汗畏風(fēng),面色蒼白,心悸納呆等征象改善較對(duì)照組明顯,治療總有效率明顯高于對(duì)照組。經(jīng)觀察應(yīng)用芪桂通痹湯的病人未發(fā)現(xiàn)任何毒副作用。
③使用每個(gè)聚類中的樣本均值作為新的聚類中心。重復(fù)步驟②直到聚類中心不再變。
電網(wǎng)企業(yè)服務(wù)類采購(gòu)組織方式包括框架協(xié)議采購(gòu)、定點(diǎn)采購(gòu)、集中批次采購(gòu)、授權(quán)采購(gòu)四種類別。國(guó)網(wǎng)公司為了優(yōu)化服務(wù)類集約化管理體系,深化標(biāo)準(zhǔn)化、信息化手段的應(yīng)用,推進(jìn)服務(wù)類管理創(chuàng)新,提升服務(wù)類集約管理水平,主要采取框架協(xié)議采購(gòu)、定點(diǎn)采購(gòu)、集中批次采購(gòu)的組織方式,包含了服務(wù)類的絕大部分。授權(quán)采購(gòu)不屬于依法必須招標(biāo)且未納入總部集中采購(gòu)目錄范圍的采購(gòu)需求,所以本文服務(wù)類聚類圍繞授權(quán)之外的三種方式展開(kāi)。本文將快速聚類收斂快的特點(diǎn)與系統(tǒng)聚類精度高的特點(diǎn)有機(jī)結(jié)合,形成混合聚類模型。指標(biāo)數(shù)據(jù)應(yīng)用SPSS19.0統(tǒng)計(jì)軟件進(jìn)行聚類分析。首先利用系統(tǒng)聚類精度高的優(yōu)點(diǎn),提供的類別距離譜系圖確定最優(yōu)分類數(shù),然后用快速聚類得到最終分類并根據(jù)方差分析輸出表判斷類與類中心差異是否顯著,依據(jù)分析之后的聚類成員表確定各類項(xiàng)目組成員,對(duì)每大類的項(xiàng)目成員總體進(jìn)行歸納總結(jié)項(xiàng)目特點(diǎn),并分析適用的采購(gòu)組織方式。
以國(guó)網(wǎng)河南省電力公司2014~2016年服務(wù)類需求計(jì)劃數(shù)據(jù)為例展開(kāi)分析,通過(guò)對(duì)服務(wù)類項(xiàng)目總體的特征分析,主要選取四個(gè)參與分析的變量,分別為:①金額,②采購(gòu)頻次,③服務(wù)商數(shù)量,④需求部門數(shù)量。按照2014~2016年國(guó)網(wǎng)河南省上報(bào)的服務(wù)類需求計(jì)劃統(tǒng)計(jì)表,采購(gòu)金額數(shù)據(jù)選取項(xiàng)目平均值,采購(gòu)頻次選取2014~2016年需求采購(gòu)上報(bào)的總計(jì)次數(shù),供應(yīng)商數(shù)量根據(jù)供應(yīng)商資質(zhì)、位置等條件統(tǒng)計(jì),需求部門選取項(xiàng)目平均個(gè)數(shù)。數(shù)據(jù)統(tǒng)計(jì)如表1所示。
(1)系統(tǒng)聚類過(guò)程操作
①在SPSS變量視圖中先定義好變量(如圖1所示)。
②將采集好的數(shù)據(jù)輸入數(shù)據(jù)視圖(如圖2所示)。
③將輸入的數(shù)據(jù)進(jìn)行系統(tǒng)聚類分析(如圖3所示)。
④結(jié)果分析。由系統(tǒng)聚類得到圖4所示的樹(shù)狀圖,樹(shù)狀圖各變量分類均勻且明顯,可知收集數(shù)據(jù)指標(biāo)可以用來(lái)做分類依據(jù)。
(2)快速聚類用SPSS軟件進(jìn)行具體操作
①首先指定分類數(shù)為三類,在右側(cè)選項(xiàng)卡中選擇所要輸出的表格,選擇“初始類中心”、“ANOVA表”和“每個(gè)個(gè)案聚類信息”(如圖5所示)。
②結(jié)果分析。為了檢驗(yàn)快速聚類采購(gòu)金額、采購(gòu)頻次、供應(yīng)商數(shù)量這三個(gè)類中心之間的差異是否顯著,進(jìn)行方差分析,由表2“方差分析表”輸出表可知精確p值均小于0.05,可知所分類各類中心差異顯著,分類效果較好。
F檢驗(yàn)應(yīng)僅用于描述性目的,因?yàn)檫x中的聚類將被用來(lái)最大化不同聚類中的案例間的差別。觀測(cè)到的顯著性水平并未據(jù)此進(jìn)行更正,因此無(wú)法將其解釋為是對(duì)聚類均值相等這一假設(shè)的檢驗(yàn)。
由表3輸出表“每個(gè)聚類中的案例數(shù)”可知分類大致情況,第一類包含12個(gè)個(gè)案,第二類包含9個(gè)個(gè)案,第三類包含6個(gè)個(gè)案,并沒(méi)有缺失的服務(wù)類個(gè)案。
表1 國(guó)網(wǎng)河南省2014~2016年服務(wù)類需求計(jì)劃表
圖1 定義變量視圖
(1)聚類1組分析結(jié)果。由快速聚類得出聚類1組包括電網(wǎng)項(xiàng)目前期可研、勘察設(shè)計(jì)、非生產(chǎn)性技改(10KV以下)、大修項(xiàng)目設(shè)計(jì)(10KV以下)、技改大修項(xiàng)目監(jiān)理(10KV以下)、工程造價(jià)咨詢、前期核準(zhǔn)評(píng)價(jià)、大件運(yùn)輸、變電一、二次設(shè)備運(yùn)維檢修、輸電、配電設(shè)備運(yùn)維檢修、直流設(shè)備運(yùn)維檢修、在線監(jiān)測(cè)裝置、儀器儀表維護(hù)12等個(gè)服務(wù)。 經(jīng)過(guò)對(duì)聚類1組成員整體特征分析可得該組具有以下特點(diǎn):①及時(shí)性要求高;②采購(gòu)頻次高;③價(jià)格敏感度高;④執(zhí)行調(diào)整多;⑤全生命周期服務(wù)要求高。
由聚類第1組成員的整體特點(diǎn)結(jié)合框架協(xié)議采購(gòu)的適用情況可知,聚類1組適合采用框架協(xié)議方法??蚣懿少?gòu)更適合采購(gòu)頻次高、數(shù)量大、服務(wù)穩(wěn)定可靠度高的項(xiàng)目,項(xiàng)目?jī)r(jià)格的可調(diào)整性較大。
(2)聚類2組分析結(jié)果。聚類2組包括生產(chǎn)輔助設(shè)施、生產(chǎn)標(biāo)識(shí)牌、環(huán)境檢測(cè)維護(hù)、消防設(shè)施、安防、技防設(shè)施維護(hù)、設(shè)備返廠大修維護(hù)、保險(xiǎn)、信息技術(shù)的開(kāi)發(fā)設(shè)計(jì)及維修、物業(yè)服務(wù)、車輛維修、公務(wù)印刷、出版和會(huì)展、視頻制作等9類服務(wù)。經(jīng)過(guò)對(duì)聚類2組成員整體特征分析可得該組具有以下特點(diǎn):①價(jià)格相對(duì)確定;②區(qū)域性強(qiáng);③工作量輕;④技術(shù)、經(jīng)濟(jì)標(biāo)準(zhǔn)明確;⑤一次性方式。
圖2 定義數(shù)據(jù)視圖
圖3 系統(tǒng)聚類分析圖
圖4 使用平均連接組間樹(shù)狀圖
由聚類2組的整體特點(diǎn)結(jié)合定點(diǎn)采購(gòu)的適用情況,可得聚類2組成員更適合采用定點(diǎn)采購(gòu)方式,采購(gòu)工作量較輕,價(jià)格相對(duì)波動(dòng)性小的項(xiàng)目。
(3)聚類3組分析結(jié)果。聚類3組包括設(shè)備監(jiān)造、科技研發(fā)和咨詢、管理咨詢、車輛租賃、培訓(xùn)和會(huì)議等6類服務(wù),對(duì)聚類3組成員整體特征分析可得該組具有以下特點(diǎn):①通用性強(qiáng);②價(jià)格敏感度高;③供應(yīng)商數(shù)量多;④采購(gòu)頻次高;⑤專業(yè)性強(qiáng)。
由聚類3組的整體特點(diǎn)結(jié)合集中批次采購(gòu)的適用情況,可得聚類3組成員更適用于集中批次采購(gòu),適用于供應(yīng)商數(shù)量多,價(jià)格相對(duì)波動(dòng)較大的情況。
圖5 K均值聚類分析圖
表2 方差分析表
從電網(wǎng)企業(yè)服務(wù)類采購(gòu)現(xiàn)狀進(jìn)行分析,首先建立了采購(gòu)金額、采購(gòu)頻次、供應(yīng)商數(shù)量的三個(gè)維度的指標(biāo)體系,其次運(yùn)用系統(tǒng)聚類進(jìn)行分析,分析分類效果和指標(biāo)選取效果,最后運(yùn)用快速聚類將服務(wù)類分為三個(gè)類別?;旌暇垲愒诜N類繁多的電網(wǎng)企業(yè)服務(wù)類需求采購(gòu)分類中的應(yīng)用,使服務(wù)類采購(gòu)組織方式精準(zhǔn)性增加、系統(tǒng)工作效率提高、時(shí)間成本得到節(jié)約,對(duì)國(guó)網(wǎng)公司服務(wù)類采購(gòu)具有重要的現(xiàn)實(shí)意義。
表3 快速聚類案例數(shù)輸出表每個(gè)聚類中的案例數(shù)
[1]姚佼,徐潔瓊.基于混合聚類的城市道路多時(shí)段控制研究[J].計(jì)算機(jī)應(yīng)用研究,2016,33(11):3274-3278.
[2]Luo Y,Cai Q,Xi H,et al.Customer Segmentation for Telecom with the k-means Clustering Method[J].Information Technology Journal,2013,12(3):409-413.
[3]Vijayan A S,Balasundaram S R.Effective Web-Service Discovery Using K-Means Clustering[C]//Distributed Computing and Internet Technology.Springer Berlin Heidelberg,2013:455-464.
[4]Wu C,Qiu W,Zheng Z,et al.QoS Prediction of Web Services Based on Two-Phase K-Means Clustering[C]//IEEE International Conference on Web Services,2015:161-168.
[5]張曉春,倪紅芳,李娜.基于數(shù)據(jù)挖掘的供電企業(yè)客戶細(xì)分方法及模型研究[J].科技與管理,2013,15(6):104-109.
[6]Kohan N M,Moghaddam M P,Bidaki S M,et al.Comparison of Modified K-means and hierarchical algorithms in customers load curves clustering for designing suitable tariffs in electricity market[C]//Universities Power Engineering Conference,2008:1-5.
[7]原忠虎,李佳,張博.一種加權(quán)的系統(tǒng)聚類方法及應(yīng)用[J].沈陽(yáng)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,26(3):201-207.
[8]聶珍.一種基于系統(tǒng)聚類的圖書(shū)館讀者細(xì)分模型[J].現(xiàn)代情報(bào),2009,29(9):158-161.