候小虎,高晉凱,馮雷,高瑜,于嘉,趙雪松
(國網山西省電力公司物資分公司(國網山西招標有限公司),山西 太原 030001)
當前,我國經濟正處在轉變發(fā)展方式、優(yōu)化經濟結構、轉換增長動能的攻堅期。黨的十九大報告提出,“必須堅持質量第一、效益優(yōu)先”。作為關系國家能源安全和國民經濟命脈的國有重點企業(yè),建設堅強智能電網、打造安全可控的新一代電力系統是國網公司發(fā)展的固本之要。設備質量是電網安全穩(wěn)定運行的物質基礎,“選好選優(yōu)”設備是實現質量強網、推動發(fā)展質量轉型的關鍵。
為進一步提升物資采購質量關的把控,提高采購效率效益,壓減供應商數量、優(yōu)化供應商群體結構,持續(xù)推動電網設備邁向中高端。國網公司組織開展聯合資格預審工作,此項工作為全國網系統首例,沒有實施模式及經驗可尋,且資格預審工作涉及標段、廠家眾多、供應商應答水平參差不齊,同時評審過程需要生成大量的工作表格,所有環(huán)節(jié)主要依靠人工操作,存在工作量大、工作效率低、追溯效率低、數據利用率低等問題,而且極易出錯,資格預審工作期待信息技術來輔助人工作業(yè),從而尋求一種更快捷、準確、高效、有跡可循的方法完成繁重而重要的資格預審工作。
圖1 目前難點Fig.1 Current dilemma
國家電網公司已在各個領域均采用信息化工具和手段來輔助工作,并且取得了突破性的進步和改善。為了進一步深化計算機輔助工具應用,充分發(fā)揮信息技術在資格預審工作中的支撐作用,提出了基于大數據智能分析技術[1]的全流程資格預審智能評審平臺,以提高招標采購工作效率,提升公司物力標準化、集約化管理水平。
挑戰(zhàn)一:招(投)標數據海量,物資信息高效甄別困難。
2017年配網設備協議庫存資格預審變壓器類共有24家省公司參加,資格預審申請人有500余家,共接收資格預審文件正本、副本、U盤文件各1200余份(按標段),資格預審文件光盤10087份(按網省),評審過程中,共形成2989條資格預審文件否決單,閱標記錄表一總體信息匯總表有69列5065行數據,閱標記錄表二型式試驗報告統計表21列11471行數據,96份合格名單,顯然以傳統方式,對海量的招(投)標數據進行收集、分類、編碼、挖掘,難以在一個相對較短的時間內有效完成。
挑戰(zhàn)二:評審標準規(guī)則復雜,評標專家精準畫像困難。
為保證評標過程的公正、公平、公開,資格預審評審中制定了詳細的評審規(guī)則,將國網標準化成果、反措要求、行標、國標等要求均細化應用具體工作中,并且將配網設備分級分類技術規(guī)范固化至系統中,評審標準涉及各類設備關鍵技術參數,這就要求專家有較高的業(yè)務水平和實際能力,如果評審標準評判尺度不一,就會導致評審結果有失公允。
挑戰(zhàn)三:參考準則多樣,供應商優(yōu)選科學決策困難。
借助數理統計分析模型實現評標定標過程的輔助決策是物資采購科學決策的主要方向。但電力物資采購招標,涉及技術、商務和價格,在物資供應商的選擇時,既包含一定的定量因素,同時還包括諸多定性因素。定性指標難以量化造成傳統基于優(yōu)化的決策方法不再適用,包含定性和定量指標的混合決策定標方法卻難以保證評標結果的一致性。
綜上可知,資格預審中招(投)標數據海量、評審標準規(guī)則復雜、定標準則多樣等問題給評審工作帶來了多方面、多層面的挑戰(zhàn)。衍生出的問題具有領域相關性,又有多學科交叉性。為此,需立足電力行業(yè)特點,借助智能數據處理領域最新研究成果,以全視的視角探索資格預審科學決策的新理論與新方法,推動資格預審工作的科學發(fā)展與應用。
大數據智能分析技術是預測分析、數據挖掘、統計分析、人工智能并行計算、數據存儲等技術的綜合運用,其能夠準確快速地處理海量數據信息,并能夠將大數據中隱藏的信息和知識挖掘出來[2],支持商業(yè)決策和事務決斷,是當前智能信息處理領域研究和工程應用的熱點。
1.2.1 利用大數據智能分析技術是電力物資采購
決策中的客觀需求
電力物資采購中,涉及計劃申報、計劃審批、招標采購、評標管理、專家管理、供應商評價等不同的業(yè)務環(huán)節(jié),每項關鍵業(yè)務環(huán)節(jié)都產生大量復雜數據,且具有以下3個明顯特點:(1)數據海量,數據處理時效性要求高,傳統的數據分析和處理技術難以滿足技術;(2)數據異構,數據格式類型眾多,傳統的數據分析和處理技術難以同時處理電力物資采購中產生的結構化、半結構化、非結構化數據;(3)電力物資采購涉及資產巨大,通過數據分析可提高電力物資采購效益,存在著較大的經濟前景。上述特征使電力物資采購中運用大數據分析與處理技術成為迫切需求。
1.2.2 利用大數據智能分析技術是電力物資采購
決策的必然選擇
大數據分析與處理技術為電力物資采購智能決策提供了參考手段,如通過招標分包策略分析和評標方法分析,可確定最優(yōu)的分包策略和評標方法;通過供應商投標行為分析,根據供應商投標歷史行為判斷疑似違規(guī)現象,可為圍標、串標行為提供預警判斷[3];通過評標專家綜合評價,可為評標專家的抽取提供依據,等等。通過對電力物資采購各階段數據的挖掘、利用,可為電力物資采購科學決策提供輔助,進而提高物資招標采購質量和效益。
大數據分析與處理技術實現了對數據的高效處理和智能分析[4],鑒于資格預審評審工作面臨的海量數據處理、大量報表分析、規(guī)則設置復雜等問題,提出了以大數據智能分析技術為手段,輔助資格預審評審工作,對于提高資格預審工作質效,確?!斑x優(yōu)選好供應商”具有十分重要的意義。
圖2 業(yè)務功能架構Fig.2 Business function architecture
(1)平臺遵循JavaEE技術規(guī)范,采用組件化、動態(tài)化的軟件技術,利用一致的可共享的數據模型,以提高平臺的靈活性、可擴展性、安全性及并發(fā)處理能努力。
(2)平臺按照多層架構體系,將界面控制、業(yè)務邏輯和數據映射分離,實現平臺內部的松耦合,以快速、靈活地適應業(yè)務變化對平臺的需求。
(3)平臺層次結構總體上劃分為基礎支撐層、應用支撐層、數據層、業(yè)務層及服務層。通過各層次系統組件間服務的承載關系,實現平臺功能。
在物資采購招投標過程中勢必產生大量的過程數據,面對海量的各種來源的數據,如何對這些零散的數據進行有效的分析,是業(yè)務開展價值提升的關鍵。
大數據分析處理平臺就是整合當前主流的各種具有不同側重點的大數據處理分析框架和工具,實現對數據的挖掘和分析,一個大數據分析平臺涉及的組件眾多,如何將其有機地結合起來,完成海量數據的挖掘是一項復雜的工作。
本文采用的主流的Hadoop混搭架構。
圖3 Hadoop混搭架構Fig.3 Hadoop mixture architecture
通過Kafka開源流處理平臺作為統一采集平臺的消息管理層,靈活的對接、適配各種數據源采集(如數據庫表、合同資質等電子文檔、Excel表單、Word投標文件、html網站頁面),提供靈活、可配置的數據采集能力。
利用Spark和Hadoop技術,構建大數據平臺最為核心的基礎數據的存儲、處理能力中心,提供強大的數據處理能力,滿足數據的交互需求。同時通過Sparkstreaming,可以有效滿足項目實時數據的要求,構建企業(yè)發(fā)展的實時指標體系。
同時為了更好地滿足數據獲取需求,通過RDBMS,提供項目高度匯總的統計數據,滿足項目常規(guī)的統計報表需求,降低使用門檻。對大數據明細查詢需求,則通過構建HBase集群,提供大數據快速查詢能力,滿足對大數據的查詢獲取需求。
ETHINK數據智能分析平臺,包含大數據存儲與集成、大數據可視化、大數據自助分析、大數據挖掘、人工智能等核心技術,采用了分布式內存計算技術以及精心優(yōu)化的分布式數據挖掘算法。高性能計算引擎,是列存儲、分布式計算、內存計算引擎,具備處理TB級數據的快速查詢與計算能力[5]。
本文采用基于粗糙集理論的數據建模與決策分析方法解決實際評標定標過程中,一些指標不能在統一的框架下量化容易導致結果出現偏差的問題。
2.3.1 樂觀多粒度粗糙集
在多粒度決策過程中,本項目重點考慮兩種策略,一種是“求同存異”,一種是“求同排異”。求同存異的策略是指,每個決策者根據自己的??臻g進行決策,而不是反對其他決策者所給出的粒空間決策,是一種樂觀的決策策略?!扒笸女悺辈呗灾傅氖牵核袥Q策者使用共同滿意的方案進行決策,而存在分歧的方案則不能用于決策,是一種悲觀或者保守的決策策略?;凇扒笸娈悺辈呗越⒁环N相應的多粒度數據建模方法,稱為樂觀多粒度粗糙集,并且假設論域U是一個有限非空集合[6]。
2.3.2 Pawlak粗糙集理論
在信息系統中,假設U/A是一個由屬性集合A誘導的U的劃分,[x]p是包含x∈U的等價類。
在Pawlak粗糙集理論中,若x?U,則X的下近似分別定義為:
(1)
(2)
(3)
為了度量粗糙集的近似進度,Pawlak定義了一個比值:
(4)
稱該比值為由U/A近似表示X的精度。近似精度不僅依賴于X的下近似,而且依賴于X的下近似。
給定兩個屬性子集P和Q,Q關于P的近似質量(也稱為依賴度)定義為:
(5)
在粗糙數據分析中,關于條件屬性B?AT在決策屬性D的重要性度量定義為γ(AD,T)-γ(AT,D)。特別的,當B={a},γ(AT,D)-γ(ATD)表示α∈AT關于D的屬性重要度[7]。
設S=(U,AT,f)是一個完備信息系統,A,B?AT是兩個屬性子集,若X?U,則有
(A+B)0(X)?(A∪B)(X)
(A+B)0(X)?(A∪B)(X)
(6)
圖4給出了Pawlak粗糙集模型與多粒度粗糙集模型之間的不同之處示意圖。其中,斜線部分表示目標概念X由P∪Q構成的單個空間表示的下近似,這表示在商集U/P∪Q中包含在X的那些部分,陰影部分表示目標概念X在兩個??臻gP+Q下的樂觀近似,即由粒空間U/P和??臻gU/Q一起刻畫下的近似[8]。
圖4 單粒度粗糙集與多粒度粗糙集的對比示意圖Fig.4 Lower approximation under a granulation compared with Lower approximation under multi granulations
根據以上分析,我們推廣Pawlak粗糙集模型到多粒度粗糙集模型,其中目標概念的樂觀多粒度上,下近似通過多個等價的粒空間來表示[9]。
設S=(U,AT,f)是一個完備信息系統,X?U和A1,A2,L,Am,?AT。X關于A1,A2,L,Am的下、上近似定義如下:
(7)
為了能夠運用上述結論應用于資格預審問題中,這里給出了如何用多個等價??臻g計算集合X的下近似的算法[10-13]。
算法:
設S=(U,AT,f)是一個完備信息系統,X?U和P?2AT,其中P={A1,A2,L,Am}
該算法給出了由P表示X的下近似:
(8)
應用下面的指針:
i=1,2,…,m指向|U/Ai|
用P表示X下的近似計算過程,輸出集合L
由此可知,傳統的基于粗糙集的數據建模與基于多粒度粗糙集的數據建??梢曰檠a充,當信息系統中屬性之間不存在協調關系,??臻g之間相互獨立、或者需要高效計算時,多粒度粗糙集將顯示出它的優(yōu)越性,當??臻g之間可以進行相交運算時,傳統的粗糙集將占有主導地位。事實上,在一些實際醫(yī)用中以上兩種情形會同時發(fā)生,單粒度粗糙集分為分布式信息系統和多智能Agent環(huán)境下的數據分析提供了新方法。尤其是上述理論在電力物資采購評標過程中可有效地將不同類型的評價指標進行量化并約簡,進而實現評標過程中不同專家對定標結果形成的一致性結論。
利用智能招投標資格預審技術建立基于多準則約束下的預審決策模型,模型旨在為搭建標準化資格預審大數據管理體系,利用大數據研判分析技術為資格預審業(yè)務場景應用提供支持,同時通過可視化呈現手段,甄選大數據應用點,為物資決策提供輔助參考信息。
2.4.1 結合數據特征優(yōu)選算法構建模型
收集2017年資格預審形成的閱標記錄型式試驗報告數據,對其進行數據分析,探索各類技術參數與報告合格性及申請人合格性的內在關系,確立不同約束準則下的預審決策結果及模型。
綜合考慮關聯分析、回歸分析、分類分析等多種方法的內在屬性,找出其內在聯系,建立變量間適當的依賴關系,分析數據的內在規(guī)律,幫助管理者完成各種異常信息的發(fā)現、分析、識別、評價和預警等,從而得到更為合理準確的合格性結論[14]。
2.4.2 模型構建及訓練測試
選取2017年資格預審申請人試驗報告閱標記錄及資質能力核實證明函件中的相關數據,如某一型號變壓器的空載損耗、負載損耗、溫升試驗(高壓繞組)、溫升試驗(低壓繞組)、損耗水平等技術參數,對建立的基于多準則約束下的預審決策模型進行準確性測試[15],校驗是否可得出正確的合格性結論。
圖5 技術參數自動對比Fig.5 Technical parameters auto comparison
2.4.3 模型精準度評估
采用大數據智能分析技術研發(fā)的全流程資格預審智能評審平臺,全面應用于國家電網有限公司2018年度第一次及第二次配網變壓器協議庫存招標聯合資格預審中,從各省公司對預審結果的應用來看,智能招投標資格預審技術的模型精準度可達到98%以上。
開發(fā)全流程資格預審智能評審平臺,統一供應商申請文件結構格式,固化評審專家工作流程和過程記錄,有效避免了專家人工評審的差錯,主動幫助供應商提升申請文件編制質量,實現配變供應商資格預審集中評審標準統一,前置選優(yōu),深度評審,過程高效、結果可靠。
圖6 資格預審智能評審客戶端Fig.6 Pre-qulification intelligentaccreditation client
(1)供應商上報數據結構化,信息填寫標準化;
圖7 供應商投標文件結構化Fig.7 Structualization of bidders' tender documents
(2)項目經理工作方式信息化,評審專家評審過程智慧化;
圖8 專家、項目經理智慧評審Fig.8 Intelligentaccreditation for experts and project managers
(3)痕跡記錄:實現全流程行為痕跡記錄,確保風險、責任、數據的可追溯性,提高采購過程質量評價的信息共享和聯動應用;
(4)建設標準化數據管理體系,構建資格預審大數據管理體系[16],利用大數據研判分析技術為資格預審業(yè)務場景應用提供支持,同時通過可視化呈現手段,甄選大數據應用點,為物資決策提供輔助參考信息。
圖9 構建評標前后數據分析Fig.9 Data analysis before and after the bid evaluation
(5)資格預審結果動態(tài)追溯機制。
(1)全流程分階段模塊化設計,實現了不同階段數據的可靠性和可控性;
(2)基于系統內網的評審環(huán)境,保證評審過程資料不外泄,實現了評審過程的保密性。
3.3.1 經濟
與資格預審同期批次相比,項目經理工作量減少(5日×35人)-(2日×11人)=153個工作日·人,按照500元/日/人成本計算,減少投入7.65萬元;評標專家工作量減少(5日×87人)-(2日×71人)=293個工作日·人,按照1000元/日/人成本計算,減少投入29.3萬元;投標商減少了大量的紙質化文件,單個項目投標約減少成本約5000元,按照500家計算,供應商減少投入250萬元。項目經理工作量減少153個工作日·人,減少投入約7.65萬元,評標專家工作量減少293個工作日·人,減少投入約29.3萬元,申請人減少了大量的紙質化文件,單次申請人可減少投入250萬元。
3.3.2 時間
與資格預審同期批次相比,申請人等待時間從平均180分鐘下降到40分鐘,項目經理工作時間從55小時下降為15小時,評標專家評標時間從50小時下降為10小時。
3.3.3 人力
與資格預審同期批次相比,評標專家人數從87人下降到71人,項目經理人員從35人下降到11人。
圖10 平臺經濟性分析Fig.10 Economic analysis for the platform
針對資格預審評審過程中出現的工作量大、工作效率低、追溯效率低、數據利用率低等問題難點,本文提出了基于大數據智能分析技術的全流程資格預審智能評審平臺,平臺自開發(fā)以來,創(chuàng)造了配變資格預審數據、流程、表單及規(guī)格的標準化、格式化[17-20];增強了評審工作的科學性和準確性,開發(fā)了適應總部新要求的供應商《資格預審申請文件》格式化客戶端,搭建出標準統一、傳輸準確、判斷智能的智慧管理平臺,匯集和保存全過程各項數據,構建多種維度的數據庫,為企業(yè)招標采購分析決策提供充分依據,不斷提升公信力和服務質量,樹立良好的公司形象。