湯 駿 南通市公共資源交易中心,南通 226001
一些評標辦法對于主觀性指標(比如文明施工、節(jié)能環(huán)保要求)的評審項沒有具體的評審標準(一般給出一定幅度的分值范圍),在有限的評審時間內,評委只能依據自身的經驗和感性認識匆忙給出分值。在實踐中,就發(fā)現(xiàn)同一工程的不同標段,同一個投標企業(yè)得到的分數存在明顯偏差的不正?,F(xiàn)象,這是難以令投標人信服的結論,也常常引發(fā)質疑投訴。
評委的考核管理機制不健全也是導致評審亂象的原因之一。一些地方對于專家評委管理流于形式,長期不進行專業(yè)知識培訓和繼續(xù)教育,沒有科學健全的考核退出機制,導致部分專家評委專業(yè)能力下滑。評審實踐中,一些評委因不能透徹理解招標文件,不能知曉國家的招投標政策新政導致的誤評、錯判現(xiàn)象比比皆是。還有一些專家缺乏職業(yè)操守,甘于被圍獵,成為某些特定企業(yè)重點關照的對象,在評審時打出“人情分”“關系分”,評審結論缺乏公正性。
專家資源不足、分配不均衡也是困擾基層公共資源交易機構正常開展工作的重要因素,盡管一些地方采用“遠程異地評標”方式一定程度上彌補了一些短板,但是總的成效不明顯,尤其是一些稀缺專業(yè),專家評委人數過少,難以滿足隨機抽取的需要,招標人不得不“變通”采用相近專業(yè)的評委來代替,評審質量大打折扣。
獨立公正評審是確保評標工作有序開展的重要前提,然而事實上,外界干擾因素不在少數。一方面評委本身有其利害相關的利益訴求,另一方面,評審工作還可能受到招標人的明示或暗示,有關部門領導的委托和招呼,這些外來影響對于獨立開展評標工作都是不利因素。
智能合約是存儲在區(qū)塊鏈網絡(每個參與者的數據庫)中的一段代碼。它界定了各方使用合同的條件。當且僅當觸發(fā)合約條件,合同才能自動執(zhí)行。智能合約運行在以太坊的虛擬機EVM中,可以調用其他的智能合約,也就是具備“自治代理”的能力。它具有以下幾個特征:
(1)去中心化。智能合約在以太坊網絡的全部節(jié)點中被拷貝和分配,具備典型的“去中心化”特點。
(2)自動化。智能合約能夠自動實行各種任務,未達到智能合約的觸發(fā)條件,它將維持“休克”狀態(tài),不會實行任何操作。
(3)不可篡改。智能合約一經部署,就無法更改。除非預先設定了邊界條件,才可以實行“調整”操作。
(4)無需信任。合約協(xié)議各方能夠利用智能合約開展互動,而不用相互了解或取得信任。此外,區(qū)塊鏈技術可確保數據準確無誤。
表1 智能評審與人工評審評價指標對比表
相較于人工評審,智能合約技術應用到招投標評審中去有著人工評審無法比擬的優(yōu)勢,主要體現(xiàn)在以下四個方面:
(1)獨立、公正。智能合約的執(zhí)行過程完全依靠事先編譯好的計算機代碼,不受任何外界條件的干擾,能確保評標始終在獨立公正的條件下進行。
(2)精準、高效。智能合約不會出現(xiàn)人為差錯,也不存在評審質量不穩(wěn)定、不均衡的現(xiàn)象。評審效率極高,不可能出現(xiàn)因評委資源不足而延遲評標的情形。
(3)費用低廉。智能合約部署到區(qū)塊鏈中盡管要消耗少量的“資產”(以太幣),但是相比專家評委的勞務費不值一提,為招標人節(jié)約了大量的評審費用支出。
(4)公開、透明。由于智能合約依托于公有區(qū)塊鏈,因而其源代碼不僅不可篡改,而且對任何人都是透明的。因此,如果不涉及到商業(yè)秘密,智能合約評審的評分過程、判定依據甚至可以全方位向社會公開,這是當下人工評審所無法做到的。
表1列出了智能評審與人工評審兩種方式有關評審指標的比較情況。
招投標行業(yè)應用AI技術參與評審還處在初級階段,且未能向投標文件的“語義智能判斷”等高難度領域涉足,至多只能稱之為“機械評審”,離能夠模仿人類大腦思維的“智能評審”目標相去甚遠。智能合約實現(xiàn)無人評審的流程示意圖如圖所示。
智能合約實現(xiàn)無人評審的流程圖
以建設工程施工項目評審為例,投標文件中的客觀性評價指標(比如企業(yè)的資質等級、業(yè)績成果、注冊資金、年產值等),計算機很容易處理,一般只需要進行“關鍵字”對比就能完成評定工作,且誤報率極低。而智能評審面臨最大的障礙就是對投標文件中主觀內容(比如施工組織設計)的評價是否真的像專家評委那樣客觀公正,因此必須要結合深度學習、智能合約等多項新技術,才能實現(xiàn)上述目標。
3.1.1 基于深度神經網絡建模的評分模型訓練
深度神經網絡可以應對更復雜的數據集并利用其多層次結構來更好地概括出先前從未見過的數據,故此稱之為“深度”。多層次的結構使其相比線性模型能夠容納更多的數據。
深度學習模型訓練步驟主要有以下四步:
(1)數據預處理。應當在海量的投標文件樣本中進行分類,對人工專家評審意見進行標注,尤其是樣本集切分要合理,一般應當保持80%用于訓練,20%用于測試,要特別注意測試集合不要重采樣,防止訓練工作量太大。建設工程施工招標項目的樣本主要還是對“施工組織設計”方案文本的訓練,其他內容多為客觀性內容,無需參與訓練。
由于投標文件樣本質量不高、數量不充分、定標規(guī)則不合理等因素將直接導致模型訓練難以達到預期效果。因此,這一步是評分模型訓練的關鍵,也是整個智能評審工作成敗的關鍵。
(2)前向傳播(Forward Propagation)。將數據輸入神經網絡(神經元先加權累加再輸入激活函數輸出值)正向傳播,得到得分,再將“得分”輸入誤差函數loss function(正則化懲罰函數,防止過度擬合),與期望值比較得到誤差,通過誤差判斷識別訓練的魯棒性。
(3)反向傳播(Backward Propagation)。反向傳播就是求梯度。目的是用梯度下降法來對參數進行更新,而更新就需要梯度。這樣就通過梯度向量來調整權值,使“得分”誤差趨于極小值。
需要強調的是,參數選取一方面要參考招標文件中的評分標準,另一方面還要充分考慮建設工程項目的具體特點,以能夠全面、客觀反映投標企業(yè)的綜合能力為原則,組成定標集合數據集并合理配置權重。
表2列出了建設工程投標文件中“施工組織設計方案”訓練文本參數集合建議,大致可以將這些指標分為控制性、評價性和參考性指標,這樣做的好處是便于在參數調整過程取舍適當,既防止“欠擬合”,也避免“過擬合”。
目前,對于施工組織設計方案文本宜采用半監(jiān)督學習的方法實現(xiàn)專家語料標注和深度學習訓練,主要步驟如下:
表2 建設工程投標文件施工組織設計方案樣本訓練參數集
(a)先對經挑選的“優(yōu)異”文件施工組織設計方案文本的語料進行專家的人工標注;
(b)使用機器學習訓練模型如SVM、LR對已經標注的語料訓練,把未標注的語料作為測試集;
和順縣的輻射水源井主要是遠離河流集取地下水型,以小泉小水為水源的農村飲水安全工程,可通過實施水平輻射把漏失的泉水和未開發(fā)的散泉集中起來,增水效果十分明顯,比如橫嶺鎮(zhèn)的龍旺村、陽照村等,尤其適宜厚度較薄的含水層以及不易用滲渠開采的厚度薄、埋深大的含水層。主要優(yōu)點:(1)山區(qū)輻射井水源工程多為引水工程,管理方便,運行成本較低。(2)集水范圍大,含水層厚時可多層設置集水孔,此水水質優(yōu)良且水量穩(wěn)定,受季節(jié)影響較小。
(c)為測試集樣本產生標簽及置信度(即標簽的準確性的概率值);
(d)通過觀察為置信度設定一個閾值(須反復調整),當樣本中的每個分詞都滿足這個閾值時,把這個自動標注好的測試樣本加入到訓練集中,在測試樣本中取出這個樣本;
(e)重復2~4步,直到剩余的測試樣本中沒有完全滿足閾值的樣本;
(f)輸出剩余的測試樣本。經過這樣的訓練過程,計算機基本具備智能評審文件的語義條件。
(4)重復上述過程,直到設定次數(損失誤差)的平均值不再下降(最小值)。
深度學習的關鍵是數據標注前,標簽體系設定要合理、用于標注的數據集需要無偏、全面、盡可能均衡。目前制約智能評審的一個重要因素是投標文件有效數據集太小,深度學習容易產生過擬合。另外,數據集沒有局部相關特性也是一個影響因素。從提高訓練泛化能力的需求來看,公共資源交易機構只有跨區(qū)域、跨部門合作,形成豐富、充足的樣本庫才能有效地解決訓練集不均衡的問題,這也從另一個側面反映了只有打破數據壁壘,走區(qū)域合作之路才能發(fā)揮科技對于公共資源交易的巨大推動作用。
3.1.2 智能合約協(xié)議代碼的部署、編譯和運行
以太坊社區(qū)開發(fā)并開源了在線Solidity集成開發(fā)環(huán)境Remix,可以方便地在Remix中編寫、部署、測試智能合約,Remix具有自動完成,語法高亮,實時編譯檢查錯誤等功能。
(2)賬戶準備、創(chuàng)建和轉賬。以太坊是有賬戶的,每個用戶都可以開設賬戶,賬戶余額是擁有的以太幣或其他基于ERC20標準的通證。以太坊有兩種賬戶一是外部賬戶(externally owned accounts),由密鑰控制,二是合約賬戶(contract accounts),由智能合約的代碼控制。
以太坊的區(qū)塊中存儲的實質上是一種交易(transaction)行為,因此部署智能合約至少需要一個外部賬戶(可用于招投標雙方費用結算)和一個合約賬戶(用于部署智能合約)。外部賬戶可以觸發(fā)交易,而合約賬戶不能主動發(fā)起交易,只能在被觸發(fā)后按預先編寫的智能合約代碼執(zhí)行。創(chuàng)建外部賬戶不需要花費,但是創(chuàng)建合約賬戶需要支付一定的Gas,而且合約錢包中的任何操作都是需要支付Gas(Gas是以太坊智能合約執(zhí)行所需的“錢”。每執(zhí)行一個命令就會有一定的“錢”被消耗,這個“錢”用Gas作為單位,不同命令消耗的Gas數量不同),其原因在于執(zhí)行這些合約需要花費以太坊網絡中寶貴的計算時間和存儲資源。
賬戶創(chuàng)建完成以后要進行以太幣挖礦操作(否則無法完成交易),挖礦效率受到全網算力、收益分配模式、礦機能耗比、幣價等因素影響,可以通過專門工具進行挖礦,也可以通過線上交易直接購買以太幣。在以太坊中,還可以使用estimateGas方法來估算一個交易要消耗的gas消耗量,然后再根據需要購買。
(3)代碼編寫。智能合約代碼編輯器可以使用Visual studio code(下載Solidity插件),也可以選擇Ethereum官方開發(fā)的remix在線編程環(huán)境(URL:http://remix.ethereum.org/)。
3.1.3 智能評分
完成了深度學習和智能合約的部署上鏈,就可以嵌入現(xiàn)行的電子評標系統(tǒng)進行智能評分,評分過程的執(zhí)行效率主要依賴于智能合約本身的復雜程度,也就是區(qū)塊鏈環(huán)境里面可執(zhí)行的代碼集。還要注意,發(fā)布智能合約的時候需要消耗一定的通證(GAS),而消耗通證的數量是根據智能合約的難度來決定,就是說這個智能合約的處理邏輯越長、越多,那么消耗的通證就越多。從HUOBI(火幣)、OKEX.ME等主流交易平臺公布的實時價格(2020年7月30日上午9時)來看,單價為2221元/ETH(買一價),經過大致估算,一個普通的建設工程招投標智能合約從創(chuàng)建賬戶到部署合約直至完成評審,大約需要花費50~80的Gas(與合約的節(jié)點、存儲方式、算法、復雜程度都有關),按照1GAS=0.00900ETH=19.98元計算,一次評審大約需要花費1000~1600元(價格單因素評標辦法花銷會少一些)。
評分過程中,計算機可以給出具體的評判依據,如果不涉及到不適宜公開的商業(yè)秘密,那么可以將計算機的評分過程在中標公示階段向社會公開,這個實際上也是智能評審將評審過程予以公開,接受各方監(jiān)督的過程。
相比于人工評審,利用智能合約技術進行機器評審的成效主要體現(xiàn)在以下三個方面:
(1)解決了獨立評審的問題
智能合約技術最大的特點就是“去中心化、自動執(zhí)行”,它不存在人工評審尺度不一、人為疏漏和顯失公允、偏頗的問題,能確保實現(xiàn)真正意義上的獨立評審。
(2)解決了評委資源不足的問題
智能合約技術應用在評審工作中能顯著提升工作效率,專業(yè)也不受任何限制(樣本充足、訓練有效的前提下),評審質量均衡而穩(wěn)定,評審費用較低,實際就是同步解決了因評委資源不足帶來的多個“后遺癥”。
(3)解決了評標信息保密問題
智能合約技術的引入還能根治長期以來評標信息難以做到嚴格保密的“頑疾”。智能評審不存在提前抽取評委的過程,評標工作在開標過程完成以后立即開始,沒有提前量,也不存在回避情形,投標利害相關人根本無法干擾評審工作的正常進行,整個評審都在“無密可泄”的計算機代碼執(zhí)行環(huán)境中獨立運轉。
總之,智能合約技術在評審工作中的應用,實質上是用經樣本訓練過的計算機代碼來模仿人類大腦邏輯思維的過程,能夠克服“人性的弱點”。