程鐵信, 劉文濤, 王朝陽,王學海
(1.天津工業(yè)大學管理學院,天津 300387; 2.天津市水務工程建設交易管理中心,天津 300204)
工程招標中的圍標串標預警模型研究
程鐵信1, 劉文濤1, 王朝陽2,王學海2
(1.天津工業(yè)大學管理學院,天津 300387; 2.天津市水務工程建設交易管理中心,天津 300204)
工程招投標中的圍標串標具有復雜性、隱蔽性及欺騙性特點。模型針對工程投標文件中的結(jié)構(gòu)化數(shù)據(jù),采用灰色綜合關(guān)聯(lián)分析,計算不同商務投標書之間的相似度;依據(jù)投標文件中的非結(jié)構(gòu)化數(shù)據(jù),采用文本挖掘的方法,計算投標文件中技術(shù)方案等相似度,然后給出綜合相似度;并據(jù)此判斷投標人之間是否存在圍標串標行為。工程實例分析表明,該模型既發(fā)揮了灰色綜合關(guān)聯(lián)分析在小樣本數(shù)據(jù)分析中的優(yōu)勢,又利用了文本挖掘的方法分析投標文件非結(jié)構(gòu)化數(shù)據(jù)的優(yōu)勢,可以更好地對圍標串標行為做出事前判斷。
招投標; 圍標串標; 灰色綜合關(guān)聯(lián)分析; 文本挖掘
招投標一直是國外學者較為熱衷的研究領(lǐng)域,經(jīng)歷了多年的發(fā)展,研究的內(nèi)容逐步深化,無論從理論方面還是應用方面對治理圍標串標問題起到了積極的作用[1]。20世紀中期,招投標體制發(fā)展迅速,各界學者開始對招投標進行研究,F(xiàn)riedman使用運籌學方法分析招投標,在1956年Friedman將自己寫的第一篇關(guān)于招投標的文章發(fā)表在《Operations Research》上[2],這篇文章引發(fā)了學者對招投標進行更深層次研究,并將數(shù)學工具運用在圍標串標研究過程中。國際上主要從3個方面進行圍標串標研究:一是研究具體招投標方式與其防范圍標的效能,例如Robinson等人的相關(guān)研究結(jié)果顯示,在傳統(tǒng)的4個基本招投標制度中,相比于英國式招標方式,荷蘭式招標與其密封第一價格的招標方式的預防能力更強[3];二是探討和研究招投標中的招投標規(guī)則和程序,通過研究合理的招標程序,制定完整和科學的招標規(guī)范和科學流程,以預防圍標串標情形的發(fā)生,例如Patrick以不對稱投標人的第一價格密封拍賣招標采購模型為基礎,通過一定的計算分析,將競爭和串通這兩種不同情形進行對比,據(jù)此得出一種能夠檢測出虛假投標形成串通關(guān)系的方法[4];三是基于博弈論方法和機制設計理論進行研究,例如Kreps和Laffont通過博弈理論分析后發(fā)現(xiàn),只要降低圍標串標行為的預期收益就可以獲得不圍標的新的納什均衡并可以通過增加違法成本和違法收益降低圍標串標行為[5-6]。
我國引入招投標較晚,國內(nèi)學者的研究主要集中在投標階段的科學決策與理論應用。工程圍標研究的發(fā)展大致可分為3個階段:第一階段,從具體案例和實踐角度研究圍標行為,分析歷史案例中招投標參與者行為,制定預防圍標的策略,例如郭軍、賈艷艷、黃鵬等從招標人、招標代理人、投標人、評標專家分析招投標中存在圍標串標行為的問題,針對這些問題提出取消報名環(huán)節(jié)、采用網(wǎng)絡公開發(fā)布招標信息、改變資格審查和評標辦法等[7-9];第二階段,學者們主要對工程項目中的圍標串標行為進行博弈分析[10],例如任宏、崔建祝、李倩等建立招投標參與者之間的博弈模型,通過求解博弈模型,揭露出潛藏圍標串標聯(lián)盟,并打破其共同利益,從而遏制圍標串標行為發(fā)生[11-13];第三階段,主要研究不同預防圍標串標方法的操作性與實效性,例如景建萍、丁曉欣等從工程造價及資金管理入手,分析增加圍標成本等因素對遏制圍標串標行為的可操作性[14-15],再如鄭叢旭、郭起宏等從立法及政府監(jiān)管方面,對串通投標參與者加大法律處罰力度,有法律手段約束圍標串標現(xiàn)象發(fā)生[16-17]。
以投標文件中的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)為基礎,采用定量分析與定性分析研究圍標串標問題,借助灰色綜合關(guān)聯(lián)模型分析投標文件中的結(jié)構(gòu)化數(shù)據(jù),即對各投標人的工料機報價進行分析,計算灰色關(guān)聯(lián)度;采取文本挖掘模型分析投標文件中的非結(jié)構(gòu)化數(shù)據(jù),對各投標人的技術(shù)標書進行分析,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),計算出各技術(shù)標書之間的相似度;然后,采用綜合評價模型,將兩者的結(jié)果綜合起來,計算標書的綜合相似度,得到更具科學性、全面性的結(jié)果,對圍標串標做出判別。圍標串標相似度分析預警模型見圖1所示。
圖1 圍標串標相似度分析預警模型
圍標串標行為內(nèi)部關(guān)聯(lián)關(guān)系比較復雜隱蔽,其中某些關(guān)聯(lián)數(shù)據(jù)難以獲取,這符合灰色關(guān)聯(lián)系統(tǒng)所要解決的問題特征,因此,借用灰色關(guān)聯(lián)理論來分析和度量圍標串標行為。近年來,學者們主要根據(jù)鄧氏關(guān)聯(lián)分析模型[18],深入研究并發(fā)展了多種灰色關(guān)聯(lián)分析模型,并出現(xiàn)了眾多改進模型,現(xiàn)有的部分灰色關(guān)聯(lián)模型主要有灰色面積關(guān)聯(lián)度、灰色綜合關(guān)聯(lián)度、灰色相對關(guān)聯(lián)度、B型關(guān)聯(lián)度、C型關(guān)聯(lián)度、歐幾里德關(guān)聯(lián)度等[19]。以上的灰色關(guān)聯(lián)模型都是基于因素間相似性或相近性構(gòu)造的。
結(jié)合灰色關(guān)聯(lián)理論的深入研究可知,建立灰色關(guān)聯(lián)分析模型時需要綜合考慮相似性和相近性兩方面因素[20]。因此,基于序列間相似性和相近性因素構(gòu)建灰色綜合關(guān)聯(lián)分析模型。任選一家投標人的詳細報價數(shù)據(jù)構(gòu)成系統(tǒng)主因素序列,即
Xi=[xi(1),xi(2),...,xi(n)]T
(1)
相應的其他投標人的詳細報價數(shù)據(jù)構(gòu)成系統(tǒng)相關(guān)因素序列為
Xj=[xj(1),xj(2),...,xj(n)]T
(2)
式中:i、j為投標人;n為投標人商務標書中的工料機報價數(shù)量;xi(k)∈R為i的第k個報價數(shù)據(jù),記ri=r(X0,Xi)為相關(guān)因素序列Xj對系統(tǒng)主因素序列Xi的灰色綜合關(guān)聯(lián)度。
灰色綜合關(guān)聯(lián)模型的構(gòu)建步驟如下。
第一步:計算序列x0與xi的相近性εij。對每個投標人的工料機報價數(shù)據(jù)序列建立相近性向量,令
sij(k)=xi(k)-xj(k),其中k=1,2,…,n,即
(3)
為序列Xi與Xj的相近性向量。
相近性向量Sij為n維列向量,n為序列的報價數(shù)據(jù)個數(shù),通過兩組原始報價數(shù)據(jù)序列之差可以算的相近性向量Sij。
計算相近性向量Sij的向量2范數(shù),向量2范數(shù)指向量中的各元素平方之和再開根號。它描述了報價數(shù)據(jù)序列之間的相對差異,計算公式為
(4)
則報價數(shù)據(jù)相近性為
(5)
相近性ε0i只與Xi和Xj有關(guān),描述了每個投標人工料機報價的相近程度,即每種材料價格之間的差價。
第二步:計算報價數(shù)據(jù)序列Xi和Xj的相似性δij。對報價數(shù)據(jù)序列利用總和標準化計算初像值
(6)
建立報價數(shù)據(jù)序列相似性向量,令
(7)
為報價數(shù)據(jù)序列間的相似性向量。
△xi表示報價數(shù)據(jù)折線上兩點線段之間的斜率,描述了報價數(shù)據(jù)序列Xi和Xj各段折線的空間形態(tài)特征,△Sij體現(xiàn)了報價數(shù)據(jù)序列間的相似性。
同樣,計算△Sij的向量2范數(shù)為
(8)
則報價數(shù)據(jù)序列相似性為
(9)
第三步:計算灰色綜合關(guān)聯(lián)度ri,即
(10)
則稱ri為序列Xi與Xj的灰色綜合關(guān)聯(lián)度。
顯然,綜合序列Xi與Xj的相近性和相似性特性建立的灰色綜合關(guān)聯(lián)模型,能更客觀全面地描述系統(tǒng)關(guān)聯(lián)關(guān)系。
文本挖掘是數(shù)據(jù)挖掘中的一部分內(nèi)容,但相對于其他結(jié)構(gòu)化的數(shù)據(jù)而言,文本是自然語言表達的,它具有半結(jié)構(gòu)甚至無結(jié)構(gòu)的形式[21]。根據(jù)國內(nèi)已有的文本挖掘模型,建立的文本挖掘模型包括文本集合的預處理、計算TF-IDF權(quán)重、建立權(quán)重空間向量、計算余弦值等步驟,詳細過程見圖2所示。
圖2 文本挖掘流程
該文本挖掘模型是利用python語言進行編寫,因為python語言具有可讀性高、語法簡單、免費開源、可移植性、可擴展、可嵌入、擴展庫、編程思想大道至簡等特點。模型主要涵蓋了jieba分詞、TF-IDF及基于空間向量的余弦算法三大模塊。
(1) jieba分詞。jieba分詞是一種中文分詞組件,主要有精確模式、全模式、搜索引擎模式三種分詞模式,并且支持繁體分詞和引入自定義詞典。本模型使用精確模式,因為它能精確切分文本,得出適合文本分析的源數(shù)據(jù)。
(2) TF-IDF權(quán)重。計算TF-IDF權(quán)重,其中TF(詞頻)表示關(guān)鍵詞出現(xiàn)的頻率,即
(11)
式中:N為某個詞在文章中出現(xiàn)的次數(shù);M為文章的總詞數(shù)。
IDF(逆文本頻率)用來衡量關(guān)鍵詞權(quán)重,即
(12)
式中:D為文章數(shù)量;Dw未出現(xiàn)的某關(guān)鍵詞文章數(shù)量。
根據(jù)TF和IDF就可以計算出TF-IDF權(quán)重,即
TF-IDF=TF×IDF
(13)
TF-IDF權(quán)重表示某個關(guān)鍵詞對文本的重要程度,可以通過提取TF-IDF值超過某一閾值的詞得到分析文本的關(guān)鍵詞集合。
(3) 空間向量的余弦算法?;诳臻g向量的余弦算法的原理是,首先把各文本簡化表示為N維向量,并以關(guān)鍵詞權(quán)重做其分量,再通過余弦算法計算兩向量之間的夾角余弦值,用以描述兩個技術(shù)標書的相關(guān)度大小。該算法首先要假設關(guān)鍵詞間不相關(guān),然后把文本內(nèi)容轉(zhuǎn)換成空間向量,簡化處理不同文本中相同關(guān)鍵詞之間的復雜關(guān)系,從而使文本具有可計算性。用D表示文本,T表示特征項,特征項指對其所在文檔D的關(guān)鍵內(nèi)容有代表性的基本語言單位(主要由詞或短語構(gòu)成),文本可以用特征項集表示為D(T1,T2,...,Tn),其中Tk是特征項,滿足條件1≤k≤n。假設a、b、c、d為某文本的特征項,那么可將此文本表示為D(a,b,c,d),并將遵從這個特征項順序,處理其它要與之比較的文本。對含有n個特征項的文本而言,通常會計算出每個特征項的TF-IDF權(quán)重,即D=D(a,w1;b,w2;c,w3;d,w4),簡記為F=F(w1,w2,w3,w4),稱F為文檔D的權(quán)值向量表示,其中wi(1≤i≤n)為特征項的TF-IDF權(quán)重。則可將兩篇文檔的相似度Sim(Di,Dj)轉(zhuǎn)化為兩向量間的夾角余弦值表示,即
(14)
式中wik、wjk分別為第i篇和第j篇文檔的第k個特征項的權(quán)值,1≤k≤n。
上述兩種模型分別分析了投標書中產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),從兩個方面分析了標書相似度,但作為一個完整的標書,它既有結(jié)構(gòu)化數(shù)據(jù),又有非結(jié)構(gòu)化數(shù)據(jù),需要綜合兩種結(jié)果計算相似度,綜合相似度的判定可以對圍標串標問題進行合理全面的評價,于是得到
Sk=θri+(1-θ)Sim(Di+Dj)
(15)
式中:θ為ri和Sim(Di+Dj)的比重;k為第k個投標人,k=1,2,3,…。如果側(cè)重商務標θ可取大一些,如果側(cè)重技術(shù)標θ可以取小一些。根據(jù)不同招投標項目,聘請多為專家給θ取值,得出θ的平均值,計算綜合相似度。
通過查閱天津市工程建設交易中心出版的《天津市建設工程交易統(tǒng)計年度表》,發(fā)現(xiàn)天津市某蔬菜基地建設項目被通報具有圍標串標行為,并獲得了該項目的投標書。該項目于2015年進行招投標,有A、B、C三家公司參與投標,評標方式為綜合評估法,即結(jié)合每個公司的技術(shù)標和商務標兩方面評估因素,從中選出最優(yōu)者。針對該項目進行分析,處理的結(jié)構(gòu)化數(shù)據(jù)是從商務標中梳理出三家公司主要的工料機價格,這三家公司的工料機價格采用國家統(tǒng)一要求,其部分價格數(shù)據(jù)見表1。非結(jié)構(gòu)化數(shù)據(jù)來自對技術(shù)標書中文本的處理結(jié)果。
表1 工料機報價數(shù)據(jù)(部分) 單位:元
將表1中的數(shù)據(jù)導入構(gòu)建的灰色綜合關(guān)聯(lián)模型中 計算各公司的灰色關(guān)聯(lián)度。分別將A、B、C三家公司的工料機報價作為系統(tǒng)主因素序列,其余兩家公司的設備報價作為系統(tǒng)相關(guān)因素序列,得出灰色關(guān)聯(lián)度的結(jié)果(見表2)。
表2 灰色綜合關(guān)聯(lián)度計算結(jié)果
從2015年某蔬菜基地建設項目招投標中歸納、整理出技術(shù)標書,利用文本挖掘?qū)夹g(shù)標書進行處理,得出相應的相似度值。分別將A公司、B公司和C公司的技術(shù)標書兩兩進行相似度檢測,經(jīng)過程序的運算得出對應的相似度(見表3)。
表3 投標公司技術(shù)標書的相似度
根據(jù)式(13),并結(jié)合表2和表3的計算結(jié)果,計算出標書綜合相似度,對于蔬菜基地建設項目,專家一致認為技術(shù)標的權(quán)重大于商務標的權(quán)重,得出的θ值為0.4,則算得綜合相似度(見表4)。
表4 投標公司標書綜合相似度
從表2中的灰色綜合關(guān)聯(lián)度結(jié)果可以看出,三家公司的工料機報價數(shù)據(jù)兩兩對比分析的灰色綜合關(guān)聯(lián)度都達到90%以上,表明這些報價之間有很強的關(guān)聯(lián)性。因此,從工料機報價方面推斷,該蔬菜基地建設項目可能存在圍標串標的行為。
從表3中的文本相似度結(jié)果可以看出,對比分析三家公司技術(shù)標書內(nèi)容相似度都在90%左右,表明它們之間的內(nèi)容基本相似。這個結(jié)果表明這三家公司可能一起商討過蔬菜基地建設項目施工的技術(shù)難點,并提出一套解決該技術(shù)難點的解決方案,在編制技術(shù)標書時,圍繞解決方案進行技術(shù)標書的編寫,就會導致技術(shù)標書內(nèi)容存在很高的相似度,從技術(shù)標書也可以推斷該項目可能存在圍標串標行為。
從表4中的綜合相似度結(jié)果可以看出,各投標公司的整個標書相似度都在90%以上,表明整個標書基本相似。該結(jié)果涵蓋了蔬菜基地招投標中標書的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),具有科學性、全面性,可以推斷該招投標存在圍標串標行為。
將灰色綜合關(guān)聯(lián)模型和文本挖掘模型應用于標書相似度分析中,發(fā)揮了灰色綜合關(guān)聯(lián)分析在小樣本數(shù)據(jù)分析中的優(yōu)勢,同時與文本挖掘模型結(jié)合而避免了灰色綜合關(guān)聯(lián)模型只分析結(jié)構(gòu)化數(shù)據(jù)的單一性,充分利用了招投標中產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),從兩方面計算出標書的綜合相似度,用于事前分析圍標串標問題,對圍標串標做出判斷。由于圍標串標行為的復雜性、隱蔽性等特點,在實際招投標過程中很難將其精準發(fā)現(xiàn)。應用本文所建圍標串標分析模型,從投標書角度分析圍標串標,對招投標行為進行事前分析,可在一定程度上規(guī)避圍標串標問題的產(chǎn)生,維護招投標市場的秩序,從而保證招投標市場的快速健康發(fā)展。
[1] 李海燕,黃鵬瑋.對我國招投標領(lǐng)域存在問題的思考[J].華北電力大學學報:社會科學版,2011(6):73-75.
[2] Friedman L. A competitive bidding strategy[J].OperationsResearch, 1956, 4(1): 104-112.
[3] 樊 群,殷 靜,關(guān)華濱,等.基于大數(shù)據(jù)的圍標串標行為識別關(guān)鍵技術(shù)研究[J].建筑市場與招標投標,2016(6):46-52.
[4] Patrick B. Comparing competition and collusion: A numerical approach[J].EconomicTheory, 2001,18(1): 187-205.
[5] Kreps D. Rational cooperation in finitely repeatedly prisoner dilemma [J].JournalofEconomicTheory, 1982 (27):245-252.
[6] Jean-Jacques, Laffont, David Martimort. Collusion under asymmetric information[J].Econometrical, 1997 (61):875-911.
[7] 郭 軍,彭尚源.如何防控招投標活動中的串標圍標行為[J].西南石油大學學報:社會科學版,2012(6): 32-35,88.
[8] 賈艷艷,楊 鵬.工程招投標階段相關(guān)問題研究[J].洛陽理工學院學報:社會科學版,2013(5):51-55.
[9] 黃 鵬,劉 剛,黎 放.復雜相似標的招標模型分析研究[J].海軍工程大學學報,2008(5):21-24.
[10] 馮芬芬.建設工基于博弈論的串標行為分析及對策探討[J].遵義師范學院學報,2011,13(1):22-24.
[11] 任 宏,祝連波.工程投標中串標行為的信號博弈分析[J].土木工程學報,2007,40(7):99-110.
[12] 崔建祝.博弈論在圍標串標治理中的應用[J].經(jīng)濟研究導刊,2012(28):210-212.
[13] 李 倩,張飛漣.政府監(jiān)管對建筑市場“圍標”行為的影響[J].中國林業(yè)科技大學學報,2008(5):127-131.
[14] 景建萍.工程造價管理中存在的問題及對策研究[J].工程技術(shù)研究,2017(1):181-190.
[15] 丁曉欣,貢 爽.關(guān)于建設單位對建設項目工程造價全過程控制的探究[J].長春工程學院學報:社會科學版,2016(3):33-36.
[16] 鄭叢旭,高 幸.工程投標中串標問題的分析[J].建筑管理現(xiàn)代化,2009,23(3):229-231.
[17] 郭起宏,李雙燕,萬迪昉.基于隱性激勵的公共部門組織合謀防范機制設計研究[J].財經(jīng)理論與實踐,2000(5):94-97.
[18] 劉思峰,蔡 華,楊英杰,等.灰色關(guān)聯(lián)分析模型研究進展[J].系統(tǒng)工程理論與實踐,2013(8):2041-2046.
[19] 董菲菲,羅賢運,呂保和.天然氣管道內(nèi)腐蝕影響因素的灰色綜合關(guān)聯(lián)度分析[J].安全與環(huán)境學報,2014(5):15-18.
[20] 張勇軍,石 輝,翟偉芳,等.基于層次分析法-灰色綜合關(guān)聯(lián)及多灰色模型組合建模的線損率預測[J].電網(wǎng)技術(shù),2011(6):71-76.
[21] Ghanem M. Chortaras A. Guo Y,et al. A grid infrastructure for mixed bioinformatics data and text mining[J].ComputerSystemsandApplications, 2005,34(1):116 -130.
EarlyWarningModelforTogether-ConspiredorColludedBiddingBehaviorBasedontheSimilarityofProjectsBiddingDocuments
Cheng Tiexin1, Liu Wentao1, Wang Chaoyang2, Wang Xuehai2
(1. College of Management, Tianjin Polytechnic University, Tianjin 300387, China;2. Tianjin Water Conservancy Transaction Management Center, Tianjin 300204, China)
Because of complexity, concealment and fraudulence in together-conspired and colluded bidding, the early warning model for together-conspired and colluded bidding based on the big data analysis on projects bidding documents was established, in which, for structured data in the bidding documents, the Grey comprehensive correlation analysis was applied to calculated the similarity between different commercial tenders, for unstructured data in the bidding documents, text mining was applied to calculate the similarity of technical schemes in the bidding documents, then, the comprehensive similarity was calculated according to which together-conspired bidding or colluded bidding behavior was judged. The empirical analysis of the bidding case demonstrated that the advantages of Grey comprehensive correlation analysis in the analysis of small sample data and text mining in analysis of unstructured data were fully taken, which could make early warning better for together-conspired and colluded bidding behavior.
bidding; together-conspired and colluded bidding; gray comprehensive correlation analysis; text mining
C931
A
1008-4339(2018)01-020-06
2017-05-05.
程鐵信(1973— ),男,博士,教授.
程鐵信,tiexincheng@vip.sina.com.