鄭興遠(yuǎn)
(中國(guó)石油天然氣集團(tuán)公司招標(biāo)中心 北京 100724)
隨著現(xiàn)代企業(yè)對(duì)成本控制重視程度的提高,物資采購(gòu)越來(lái)越嚴(yán)格、規(guī)范,“招標(biāo)”這一目前高效、陽(yáng)光、可操作性強(qiáng)的現(xiàn)代化采購(gòu)方式被廣泛采用。根據(jù)企業(yè)發(fā)展和生產(chǎn)建設(shè)的實(shí)際需要,中國(guó)石油天然氣集團(tuán)公司于2012年專(zhuān)門(mén)成立了“中國(guó)石油招標(biāo)中心”,組織管理和從事招標(biāo)方面的工作。目前,集團(tuán)公司從事招標(biāo)管理和招標(biāo)業(yè)務(wù)的人員總計(jì)7000多人,其中50%為兼職。兼職人員既不可能在短時(shí)間內(nèi)成為專(zhuān)家,也因頻繁的工作流動(dòng)不具備成為專(zhuān)家的動(dòng)力和條件。如何提高從業(yè)人員的專(zhuān)業(yè)水平是目前面臨的一個(gè)非常實(shí)際的問(wèn)題。
為滿足招標(biāo)工作急需,提高招標(biāo)人員業(yè)務(wù)水平,企業(yè)普遍采取專(zhuān)門(mén)培訓(xùn)的辦法,但是傳統(tǒng)的集中式、講座式培訓(xùn)并不能完全適應(yīng)當(dāng)前招標(biāo)隊(duì)伍的人員構(gòu)成及實(shí)際需求。從培訓(xùn)內(nèi)容來(lái)看,由于各個(gè)案例的特殊性,準(zhǔn)備再充分的老師也無(wú)法在幾次培訓(xùn)中展示所有可能遇到的情況,不能預(yù)測(cè)到實(shí)際工作中所有可能遇到的問(wèn)題;從受訓(xùn)對(duì)象來(lái)看,填鴨式的機(jī)械學(xué)習(xí)方式對(duì)學(xué)員、特別是中年學(xué)員不適宜,還有可能因?yàn)樗鶎W(xué)的內(nèi)容并非是實(shí)際中急需掌握的而使其對(duì)培訓(xùn)內(nèi)容不敏感、無(wú)興趣。鑒于這種情況,就需要一個(gè)不受場(chǎng)地和時(shí)間限制,可隨時(shí)隨地提供指導(dǎo),內(nèi)容幾乎涵蓋所有可能遇到的問(wèn)題,且針對(duì)性強(qiáng)、答案準(zhǔn)確的“老師”——招標(biāo)知識(shí)庫(kù)。這位“老師”提供的不再是生硬的、由法律明文規(guī)定假設(shè)遇到的特定事件處理方式的教學(xué)方案,而是針對(duì)實(shí)際遇見(jiàn)事件的合乎法規(guī)的解決方法。換句話說(shuō),需要的是能夠提供“精確制導(dǎo)”式的具體解決方案的一個(gè)知識(shí)庫(kù),讓即使是非專(zhuān)業(yè)招標(biāo)人士也可以在其指導(dǎo)下規(guī)范、出色地完成招標(biāo)任務(wù)。
知識(shí)庫(kù)是知識(shí)工程中結(jié)構(gòu)化、易操作、易利用、全面有組織的知識(shí)集群,是針對(duì)某一(或某些)領(lǐng)域問(wèn)題求解的需要,采用某種(或若干)知識(shí)表示方式在計(jì)算機(jī)存儲(chǔ)器中存儲(chǔ)、組織、管理和使用的互相聯(lián)系的知識(shí)片集合。這些知識(shí)片包括與領(lǐng)域相關(guān)的理論知識(shí)、事實(shí)數(shù)據(jù),以及由專(zhuān)家經(jīng)驗(yàn)得到的啟發(fā)式知識(shí),如某領(lǐng)域內(nèi)有關(guān)的定義、定理和運(yùn)算法則及常識(shí)性知識(shí)等[1]。
招標(biāo)知識(shí)庫(kù),其知識(shí)構(gòu)成可以分為事實(shí)知識(shí)、規(guī)則知識(shí)和策略知識(shí):
(1)將已有的法律、法規(guī)、條例、文件、案例等集中統(tǒng)一保存,并為使用者提供方便、快捷、權(quán)威的檢索服務(wù),稱(chēng)為“事實(shí)知識(shí)”。
(2)提供具體事例在相關(guān)法律、法規(guī)、條例、文件規(guī)定下的操作方法,即各相關(guān)法律、法規(guī)、條例、文件規(guī)定在實(shí)際工作中的應(yīng)用,稱(chēng)為“規(guī)則知識(shí)”。
(3)相比規(guī)則知識(shí),策略知識(shí)不再是僅僅說(shuō)明具體事件的一種標(biāo)準(zhǔn)解決方式,因?yàn)楝F(xiàn)實(shí)的事件可能在合法合規(guī)的前提下,也符合多種操作執(zhí)行方式,這時(shí)企業(yè)需要的是能使利益最大化的規(guī)范操作方式。
其中,對(duì)于事實(shí)知識(shí)的檢索,知識(shí)庫(kù)只是起到一個(gè)規(guī)范檢索口徑、提高檢索效率的作用,不能較好地體現(xiàn)出它相比于傳統(tǒng)百科全書(shū)的方案解決優(yōu)勢(shì);而對(duì)于高效地解決實(shí)際工作問(wèn)題,就需要通過(guò)對(duì)規(guī)則知識(shí)和策略知識(shí)的檢索來(lái)實(shí)現(xiàn)。
對(duì)于事實(shí)知識(shí)的建設(shè),只需收集齊全,并提供快速精準(zhǔn)的檢索即可。這是工作中必須使用的,是建庫(kù)的基礎(chǔ),但所能提供的知識(shí)不具有不可替代性。
招標(biāo)知識(shí)庫(kù)的核心是建設(shè)規(guī)則和策略方面的檢索系統(tǒng)。在日常工作中,人們解決一些遇到的問(wèn)題的方法往往是“師傅帶徒弟”式的言傳身教,許多常見(jiàn)問(wèn)題在不同的時(shí)間、地點(diǎn)和事件中反復(fù)出現(xiàn),由于地理分隔、生活習(xí)慣、工作經(jīng)驗(yàn)、知識(shí)水平等原因,對(duì)于一些人來(lái)說(shuō)非常簡(jiǎn)單的問(wèn)題,對(duì)于另一些人來(lái)說(shuō)卻無(wú)法解決。而知識(shí)庫(kù)檢索正是提供一個(gè)交流和保存的平臺(tái),將大家遇到的問(wèn)題及解決方法保存下來(lái),使以后遇到相同或相似問(wèn)題的人可以通過(guò)對(duì)知識(shí)庫(kù)的檢索找到解決方法。
知識(shí)庫(kù)的建設(shè)思維在我國(guó)從古至今一直存在,現(xiàn)僅舉兩例說(shuō)明。
知識(shí)庫(kù)的建設(shè)思維在我國(guó)古已有之,其中最具有“知識(shí)庫(kù)”建設(shè)思維的非《論語(yǔ)》莫屬。眾所周知,《論語(yǔ)》是記錄孔子及其弟子言行的文集,通過(guò)問(wèn)答的形式,闡述、概括了包羅萬(wàn)象的社會(huì)問(wèn)題,為后人提供了豐富的知識(shí)源泉,具有極強(qiáng)的概括性。它通過(guò)眾人的眼睛來(lái)觀察世界,發(fā)現(xiàn)問(wèn)題,用提問(wèn)的方式來(lái)盡可能地?cái)U(kuò)大收集需要解決問(wèn)題的范圍——知識(shí)庫(kù)思維雛形。
可見(jiàn),即便是孔子這樣的大智大賢者,其思想的形成也離不開(kāi)豐富的問(wèn)題來(lái)源。有了問(wèn)題,才能再針對(duì)這些問(wèn)題進(jìn)行思考和解答。
目前,國(guó)內(nèi)較為成功的知識(shí)庫(kù)系統(tǒng)是百度公司的“知道”功能,其成功之處在于:開(kāi)放的問(wèn)題收集平臺(tái),并擁有大量的提問(wèn)人群,因而能擁有海量的覆蓋各個(gè)方面的待解決問(wèn)題;開(kāi)放的回答解決問(wèn)題平臺(tái),動(dòng)用最廣大的智慧來(lái)源解決問(wèn)題,使問(wèn)題能夠相對(duì)高效準(zhǔn)確地被解決;基于以上兩點(diǎn),使用者不用提問(wèn)等待解決方案,即能通過(guò)前人的問(wèn)答過(guò)程記錄解決自己的問(wèn)題;高效的人工智能搜索系統(tǒng),能準(zhǔn)確地將同類(lèi)相似問(wèn)題答案提供給使用者,且高效的聯(lián)想和猜想功能在使用者對(duì)提問(wèn)本身不清晰時(shí)輔助使用者明白自己到底想查的是什么;擁有龐大的使用人群,這是實(shí)現(xiàn)以上四點(diǎn)的前提和基礎(chǔ)。
通過(guò)以上這兩個(gè)例子可以看出,基于知識(shí)庫(kù)的建設(shè)目的是幫助解決問(wèn)題,解決問(wèn)題的方法是檢索和借鑒被保存記錄的以往遇到的相同或相似問(wèn)題的成功解決方法,即知識(shí)庫(kù)中的知識(shí)。知識(shí)庫(kù)的建設(shè),就是處理好這些知識(shí)的3個(gè)部分:知識(shí)收集、知識(shí)儲(chǔ)存、知識(shí)檢索。其中,“收集”要求盡可能全面的覆蓋問(wèn)題,且時(shí)時(shí)更新編輯;“儲(chǔ)存”要求后臺(tái)分類(lèi)合理,形成關(guān)聯(lián)知識(shí)片,利于檢索;“檢索”需要手段方便,終端易獲得,操作簡(jiǎn)單,且有高效的人工智能輔助。
知識(shí)庫(kù)是一個(gè)龐大而復(fù)雜的系統(tǒng),其內(nèi)涵包括:信息采集與存儲(chǔ)、知識(shí)提取、內(nèi)容檢索、結(jié)果呈現(xiàn)。建設(shè)好如此龐雜的系統(tǒng),不啻于乾隆皇帝編撰《四庫(kù)全書(shū)》,建設(shè)難度可想而知,絕不是簡(jiǎn)單的依靠搭建企業(yè)級(jí)數(shù)據(jù)庫(kù)、java開(kāi)發(fā)前端頁(yè)面就能實(shí)現(xiàn)的。如果把知識(shí)庫(kù)當(dāng)做一個(gè)企業(yè)級(jí)系統(tǒng)進(jìn)行開(kāi)發(fā),注定要承擔(dān)極大風(fēng)險(xiǎn),甚至失敗。
知識(shí)庫(kù)需要整合或重新開(kāi)發(fā)的模塊見(jiàn)圖1。
圖1 知識(shí)庫(kù)需要整合或重新開(kāi)發(fā)的模塊說(shuō)明
基于人力、物力條件所限,知識(shí)庫(kù)建設(shè)可分階段進(jìn)行。在目前條件下我們還只能實(shí)現(xiàn)知識(shí)庫(kù)概念階段。
(1)收集及挖掘。事實(shí)知識(shí)類(lèi)涵蓋國(guó)家及部委法律或規(guī)定、集團(tuán)公司各項(xiàng)招標(biāo)有關(guān)規(guī)定等文件,按集團(tuán)12個(gè)模板分類(lèi)的代表性案例、招標(biāo)標(biāo)準(zhǔn)流程圖及每步的標(biāo)準(zhǔn)執(zhí)行方法。規(guī)則和策略類(lèi)包括招標(biāo)中心員工遇到的問(wèn)題及最后的成功解決方案記錄。
(2)信息儲(chǔ)存。利用現(xiàn)有服務(wù)器及局域網(wǎng),將所有資料通過(guò)分類(lèi)存儲(chǔ)在服務(wù)器硬盤(pán)中。
(3)檢索及界面展現(xiàn)。各員工通過(guò)局域網(wǎng)登入服務(wù)器硬盤(pán)檢索所需信息。
通過(guò)以上工作,在概念上實(shí)現(xiàn)知識(shí)庫(kù)模式,但因條件所限還無(wú)法體現(xiàn)知識(shí)庫(kù)的優(yōu)勢(shì)。根據(jù)資金緊張的實(shí)際情況,建議集團(tuán)公司招標(biāo)知識(shí)庫(kù)的建設(shè)采用深度優(yōu)先的開(kāi)發(fā)方式,這種低成本、高效率的方式對(duì)項(xiàng)目的實(shí)施將會(huì)較為有利。
為此,從工程和財(cái)務(wù)的角度將系統(tǒng)的開(kāi)發(fā)分為如下幾個(gè)階段。
初級(jí)知識(shí)庫(kù)階段,需要以最低的經(jīng)濟(jì)成本和時(shí)間成本建設(shè)最初級(jí)的能形成使用閉環(huán)的系統(tǒng),使知識(shí)能以高質(zhì)量的信息形式得以收集、存儲(chǔ)、檢索。
(1)收集:僅需支持用戶手動(dòng)進(jìn)行知識(shí)的錄入,例如最常見(jiàn)的法律法規(guī)、招投標(biāo)案例、實(shí)際問(wèn)題及解決方法等;知識(shí)挖掘部分采用靜態(tài)知識(shí)目錄,而不必花費(fèi)巨大的時(shí)間成本實(shí)現(xiàn)智能挖掘系統(tǒng);但由于使用人群的擴(kuò)大,將涉及更多的問(wèn)題,需要將本公司各員工遇到的問(wèn)題及最后的成功解決方案記錄保存。最終知識(shí)庫(kù)內(nèi)容將涵蓋全公司涉及的招標(biāo)問(wèn)題,并設(shè)立統(tǒng)一解答口徑,有專(zhuān)人定期實(shí)時(shí)解答問(wèn)題。
(2)存儲(chǔ):采用最便宜且具強(qiáng)大擴(kuò)展能力的MYSQL,將所提及問(wèn)題整理后按分類(lèi)建立數(shù)據(jù)庫(kù)統(tǒng)一保存。
(3)檢索:采用成熟的前端展示Browser應(yīng)用展現(xiàn)信息,提供錄入界面??商峁╇娮踊阉饕媸降臋z索,實(shí)現(xiàn)分詞功能,提供檢索知識(shí)的服務(wù),搭建初級(jí)的招投標(biāo)知識(shí)搜索引擎(表1)。
表1 初級(jí)知識(shí)庫(kù)階段各模塊功能規(guī)劃說(shuō)明
實(shí)現(xiàn)以上功能,估計(jì)成本投入在30萬(wàn)元人民幣左右,在外觀上基本實(shí)現(xiàn)知識(shí)庫(kù)模式。但由于使用人數(shù)有限,收集規(guī)模效應(yīng)無(wú)法發(fā)揮,且成本投入有限,在保存方面無(wú)法建立先進(jìn)的數(shù)據(jù)庫(kù)模式,檢索無(wú)法智能匹配,只能做到關(guān)聯(lián)匹配式的非人工智能檢索。由于總信息量不大,能初步滿足當(dāng)前信息量的需要。
在第一階段的基礎(chǔ)上,對(duì)系統(tǒng)進(jìn)行升級(jí),對(duì)初級(jí)知識(shí)庫(kù)階段中的5個(gè)模塊進(jìn)行較為明顯的改進(jìn),尤其是實(shí)現(xiàn)云存儲(chǔ)和爬蟲(chóng)技術(shù),將獲取信息的觸角延伸到互聯(lián)網(wǎng)。
(1)收集:由于使用人群的進(jìn)一步擴(kuò)大,會(huì)涉及更多的問(wèn)題,將集團(tuán)各公司每個(gè)招標(biāo)工作員工遇到的問(wèn)題及最后的成功解決方案記錄保存,最終知識(shí)庫(kù)內(nèi)容將涵蓋全集團(tuán)涉及的招標(biāo)問(wèn)題。由于問(wèn)題面廣量大,可以開(kāi)放解答權(quán)限,設(shè)立統(tǒng)一確定口徑,有專(zhuān)人定期時(shí)時(shí)審閱各類(lèi)問(wèn)題和解決方法,將最準(zhǔn)確的答案確定發(fā)布。同時(shí)信息收集的重大改進(jìn)是使用C++語(yǔ)言開(kāi)發(fā)性能強(qiáng)勁的網(wǎng)頁(yè)爬蟲(chóng),從互聯(lián)網(wǎng)獲取海量信息,并將信息存儲(chǔ)在云存儲(chǔ)系統(tǒng)中。知識(shí)挖掘部分,對(duì)靜態(tài)知識(shí)目錄進(jìn)行升級(jí),支持在某些知識(shí)條目下增加對(duì)外部信息的交叉引用鏈接。
(2)保存:將所提及的問(wèn)題整理后按分類(lèi)建立數(shù)據(jù)庫(kù),統(tǒng)一保存。由于數(shù)據(jù)量增大,對(duì)數(shù)據(jù)庫(kù)算法及分類(lèi)方法提出考驗(yàn)和要求。存儲(chǔ)系統(tǒng)向云存儲(chǔ)系統(tǒng)升級(jí),從技術(shù)上來(lái)說(shuō),可選擇MYSQL Cluster或Redis、HBASE等產(chǎn)品升級(jí)空間無(wú)限的開(kāi)源產(chǎn)品。
表2 知識(shí)庫(kù)階段各模塊功能規(guī)劃說(shuō)明
(3)檢索:建立專(zhuān)業(yè)的提問(wèn)及檢索系統(tǒng),員工在網(wǎng)絡(luò)覆蓋的地方,使用包括電腦、手機(jī)、IPAD等各類(lèi)終端都可以登錄知識(shí)庫(kù)提問(wèn)檢索,可提供人工智能的電子化搜索引擎式的檢索。搜索系統(tǒng)升級(jí)為支持爬蟲(chóng)抓取的外部數(shù)據(jù)的檢索,從而改善針對(duì)關(guān)鍵詞匹配知識(shí)條目的準(zhǔn)確性。界面展現(xiàn)上需要針對(duì)前一版本用戶使用體驗(yàn)進(jìn)行改進(jìn)(表2)。
實(shí)現(xiàn)以上功能就達(dá)到了知識(shí)庫(kù)模式,估計(jì)成本投入為150萬(wàn)元人民幣左右。由于知識(shí)庫(kù)的核心是知識(shí)覆蓋面,所以必須保證有大量的用戶數(shù),收集規(guī)模效應(yīng)才能發(fā)揮,才真正具有檢索價(jià)值。同時(shí),由于總信息量的提高,保存數(shù)據(jù)庫(kù)的合理建立和算法也變得更為重要,這將最終影響檢索的效率。通過(guò)數(shù)據(jù)庫(kù)的合理保存和人工智能的算法檢索,使用者能夠獲得準(zhǔn)確的所需信息,既不會(huì)錯(cuò)過(guò)有用信息,也不會(huì)關(guān)聯(lián)出的信息量過(guò)大且多為無(wú)效信息。失去檢索效率,知識(shí)庫(kù)便失去使用價(jià)值。
本階段知識(shí)庫(kù)可將全社會(huì)從事招標(biāo)工作的人員納入使用人群。對(duì)于知識(shí)庫(kù)的使用原理此階段已經(jīng)完全實(shí)現(xiàn),在無(wú)需考慮用戶數(shù)量不足的情況下,知識(shí)庫(kù)的建設(shè)重點(diǎn)就轉(zhuǎn)變?yōu)榧兗夹g(shù)方面的數(shù)據(jù)庫(kù)保存和檢索算法問(wèn)題上。云存儲(chǔ)系統(tǒng)線上運(yùn)行一段時(shí)間之后必然會(huì)產(chǎn)生性能調(diào)優(yōu)的需求,在本階段可以將前一階段的數(shù)據(jù)量等重要信息作為依據(jù)進(jìn)行調(diào)優(yōu)。爬蟲(chóng)的爬取針對(duì)性和爬取效率經(jīng)過(guò)前一階段的實(shí)際運(yùn)行也有機(jī)會(huì)得到較大的提升。在前一階段積累的海量數(shù)據(jù)基礎(chǔ)上,采用神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)知識(shí)挖掘系統(tǒng),最終使用“知識(shí)圖譜”替代人工編撰的知識(shí)目錄作為組織知識(shí)的主要形式。檢索系統(tǒng)和界面展現(xiàn)系統(tǒng)均根據(jù)前一階段的使用情況進(jìn)行改進(jìn)。
要達(dá)到目前世界上最先進(jìn)的保存和算法水平,投入成本將達(dá)500萬(wàn)元以上。達(dá)到此規(guī)模的知識(shí)庫(kù),完全有能力通過(guò)增加模塊的方式增加集團(tuán)公司內(nèi)部任何行業(yè)的知識(shí)庫(kù),例如鉆井、采油、煉化等(表3)。
表3 先進(jìn)的知識(shí)庫(kù)階段各模塊功能規(guī)劃說(shuō)明
總的來(lái)說(shuō),一個(gè)知識(shí)庫(kù)的核心是收集盡可能全面的覆蓋問(wèn)題,且時(shí)時(shí)更新編輯解答;在實(shí)際工作中可能遇到的問(wèn)題不是通過(guò)設(shè)想就可以預(yù)見(jiàn)全面的,目前唯一可行的方法是通過(guò)大量的使用人群來(lái)發(fā)現(xiàn)問(wèn)題,用集體智慧來(lái)解決問(wèn)題,形成知識(shí)庫(kù)供其他人參考借鑒。至于保存和檢索方法,都是實(shí)現(xiàn)這個(gè)目標(biāo)的純技術(shù)手段,基本是通過(guò)資金投入來(lái)解決的。集團(tuán)公司建設(shè)知識(shí)庫(kù)要從實(shí)用出發(fā),從初級(jí)做起,首先解決兼職招標(biāo)人員應(yīng)急培訓(xùn)的燃眉之急,然后與培訓(xùn)業(yè)務(wù)相匹配,逐步升級(jí),最終建設(shè)成一個(gè)較為先進(jìn)的知識(shí)庫(kù)。
[1]林婷.基于ArcGIS的地圖輸出智能化技術(shù)研究[D].杭州:浙江大學(xué),2006.