亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社區(qū)發(fā)現(xiàn)和關(guān)聯(lián)規(guī)則分析的供應(yīng)商圍串標(biāo)審計(jì)方法探索

        2020-09-27 23:04:42程向華李漢秋章崎峰尤震羅天
        中國內(nèi)部審計(jì) 2020年9期
        關(guān)鍵詞:數(shù)據(jù)分析

        程向華 李漢秋 章崎峰 尤震 羅天

        [摘要]供應(yīng)商間圍串標(biāo)行為是困擾企業(yè)招標(biāo)采購工作的難點(diǎn)問題之一,而找到供應(yīng)商間的緊密關(guān)系,則是破解這一難題的關(guān)鍵所在。本文通過社區(qū)發(fā)現(xiàn)算法和關(guān)聯(lián)規(guī)則分析算法,對企業(yè)的招標(biāo)采購數(shù)據(jù)進(jìn)行分析,識(shí)別其團(tuán)組社區(qū)并獲得內(nèi)部關(guān)系結(jié)構(gòu),從中發(fā)現(xiàn)供應(yīng)商間隱藏的關(guān)聯(lián)關(guān)系,為審計(jì)人員進(jìn)行分析提供有效線索。

        [關(guān)鍵詞]招投標(biāo)審計(jì) ? ?圍串標(biāo) ? ?數(shù)據(jù)分析

        一、導(dǎo)言

        自招標(biāo)投標(biāo)采購要求實(shí)施及推廣以來,供應(yīng)商圍串標(biāo)在企業(yè)采購招標(biāo)過程中屢見不鮮。對企業(yè)采購來說,該行為可能對招標(biāo)項(xiàng)目質(zhì)量產(chǎn)生不利影響。對此,常見的內(nèi)部審計(jì)策略是對每個(gè)項(xiàng)目進(jìn)行檢查,判斷是否存在國家招標(biāo)投標(biāo)法實(shí)施條例中所列投標(biāo)文件由同一單位編制、投標(biāo)文件異常一致、投標(biāo)保證金從相同賬戶轉(zhuǎn)出等串通投標(biāo)情形,或者通過分析供應(yīng)商之間是否存在股權(quán)相關(guān)投資、高管交叉任職等直接關(guān)系。但傳統(tǒng)方式核實(shí)工作量大、效率低,且難以發(fā)現(xiàn)供應(yīng)商之間更為隱蔽的私下掛靠或協(xié)商組團(tuán)投標(biāo)行為。隨著電子招采平臺(tái)的普及與企業(yè)信息化程度的提高,更有效率的一種策略是根據(jù)供應(yīng)商投標(biāo)行為特征,在審計(jì)模型中對供應(yīng)商緊密關(guān)系進(jìn)行識(shí)別,找出疑似圍串標(biāo)企業(yè)組,進(jìn)一步分析相關(guān)投標(biāo)項(xiàng)目。

        現(xiàn)有關(guān)聯(lián)組團(tuán)研究中,王俊芳、游松慶等采用頻繁集項(xiàng)等關(guān)聯(lián)算法對供應(yīng)商投標(biāo)數(shù)據(jù)進(jìn)行分析,挖掘供應(yīng)商之間的內(nèi)部關(guān)系。但實(shí)際應(yīng)用中,上述方法仍難以滿足圍串標(biāo)行為識(shí)別分析的需要:一是簡單的關(guān)聯(lián)規(guī)則識(shí)別疑似圍串標(biāo)團(tuán)組精準(zhǔn)度較低;二是未經(jīng)分類的供應(yīng)商投標(biāo)數(shù)據(jù)在頻繁項(xiàng)集計(jì)算中會(huì)產(chǎn)生較多冗余數(shù)據(jù)。

        本文整合社區(qū)發(fā)現(xiàn)和關(guān)聯(lián)規(guī)則分析算法進(jìn)行數(shù)據(jù)挖掘應(yīng)用,能夠有效識(shí)別供應(yīng)團(tuán)組社區(qū)并獲得其內(nèi)部關(guān)系結(jié)構(gòu),對于在合同招投標(biāo)審計(jì)過程中辨識(shí)圍串標(biāo)行為具有顯著作用。

        二、主要審計(jì)思路及相關(guān)算法

        (一)審計(jì)思路

        首先,利用社區(qū)發(fā)現(xiàn)算法對招采數(shù)據(jù)中涉及的供應(yīng)商進(jìn)行初步分組。其次,在供應(yīng)商初步分組中逐個(gè)應(yīng)用關(guān)聯(lián)規(guī)則分析尋找組內(nèi)頻繁項(xiàng)集,即經(jīng)常同時(shí)參與某些項(xiàng)目投標(biāo)的供應(yīng)商團(tuán)組,在結(jié)果中設(shè)置提取規(guī)則,進(jìn)一步提升社區(qū)名單的準(zhǔn)確性與覆蓋面,并獲得團(tuán)組內(nèi)部的關(guān)系結(jié)構(gòu)。最后,應(yīng)用數(shù)據(jù)分析提取的供應(yīng)商團(tuán)組,反查相關(guān)合同標(biāo)的,確認(rèn)有關(guān)行為及事實(shí)。

        (二)涉及算法介紹

        1.Louvain社區(qū)發(fā)現(xiàn)算法。Louvain算法是一種基于模塊度的社區(qū)發(fā)現(xiàn)算法,通過模塊度來衡量一個(gè)社區(qū)的緊密程度。本例中,供應(yīng)商視為節(jié)點(diǎn),一起投標(biāo)的同類供應(yīng)商視為社區(qū),供應(yīng)商在尋源單中共同出現(xiàn)次數(shù)為權(quán)重,次數(shù)越多,邊權(quán)越大。模塊度定義函數(shù)Q如下:

        其中,Aij代表節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的邊權(quán);ki和kj分別代表所有與節(jié)點(diǎn)i和節(jié)點(diǎn)j相連的邊的權(quán)重之和;m代表所有的邊權(quán)之和;ci和cj分別代表節(jié)點(diǎn)i和節(jié)點(diǎn)j所屬的社區(qū);表示克羅內(nèi)克函數(shù)。若一個(gè)供應(yīng)商(節(jié)點(diǎn))加入到某個(gè)社區(qū)(類別)中會(huì)使該社區(qū)的模塊度有最大程度的增加,則認(rèn)為該節(jié)點(diǎn)屬于該社區(qū);若未能使其模塊度增加,則該供應(yīng)商留在原社區(qū)中,從而實(shí)現(xiàn)對供應(yīng)商分類的目的。

        2.Apriori關(guān)聯(lián)規(guī)則分析算法。Apriori算法是通過連接產(chǎn)生候選項(xiàng)及其支持度然后通過剪枝生成頻繁項(xiàng)集(疑似供應(yīng)商團(tuán)組),并分析頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。相關(guān)指標(biāo)如下:

        (1)支持度(support)。支持度代表供應(yīng)商尋源單中當(dāng)前供應(yīng)商組合的頻繁程度,如果該組合的支持度大于預(yù)設(shè)的閾值,則認(rèn)為該組合為疑似團(tuán)組(頻繁項(xiàng)集)。Apriori算法采用反向減枝計(jì)算,即“若一個(gè)項(xiàng)目集是非頻繁項(xiàng)集,則它的所有超集也是非頻繁項(xiàng)集”,可以減少遍歷運(yùn)算量。

        (2)置信度(confidence)。置信度代表在供應(yīng)商A投標(biāo)的情況下,供應(yīng)商C同時(shí)出現(xiàn)的概率。

        (3)提升度(lift)。提升度用于衡量供應(yīng)商A與C投標(biāo)的相關(guān)性關(guān)系:當(dāng)提升度大于3時(shí),一般認(rèn)為關(guān)聯(lián)規(guī)則有價(jià)值;若供應(yīng)商A與C相互獨(dú)立,則提升度恰好為1;若提升度小于1,則表示供應(yīng)商A與C互斥。但實(shí)際應(yīng)用中,該指標(biāo)易受零事務(wù)影響,零事務(wù)即與團(tuán)組無關(guān)的供應(yīng)商投標(biāo)次數(shù)。如總投標(biāo)次數(shù)1000次中,供應(yīng)商A、C分別參與500次、600次,供應(yīng)商A、C共同投標(biāo)次數(shù)300次,則lift(A→C)為1;若總投標(biāo)次數(shù)為10000次,則lift(A→C)變?yōu)?0。

        3.KULC度量與不平衡比(IR)。引入不受零事務(wù)和事務(wù)總數(shù)影響的KULC度量與不平衡比(IR),減小因置信度和支持度失效產(chǎn)生的影響。KULC度量值在0-1之間,值越大,供應(yīng)商之間聯(lián)系越緊密。但當(dāng)KULC度量值在0.5左右時(shí),單從KULC度量無法判斷當(dāng)前團(tuán)組是否有價(jià)值。因此,引入不平衡IR比進(jìn)行參考。當(dāng)不平衡比接近0時(shí),認(rèn)為關(guān)聯(lián)關(guān)系是平衡的;不平衡比越大,則關(guān)聯(lián)關(guān)系越不平衡。若KULC度量值接近0.5并且不平衡比接近0,則認(rèn)為該關(guān)聯(lián)關(guān)系是沒有價(jià)值的。

        三、具體審計(jì)流程

        根據(jù)上述Louvain與Apriori算法,內(nèi)部審計(jì)需結(jié)合統(tǒng)計(jì)學(xué)相關(guān)知識(shí)并根據(jù)圍標(biāo)具有尋源單中全部或大部分供應(yīng)商同屬一個(gè)團(tuán)體這一顯著特征,通過全局統(tǒng)計(jì)和分析各個(gè)尋源單內(nèi)部的關(guān)系這兩個(gè)角度,評估各種團(tuán)體的出現(xiàn)形式,篩選出可能性較大的目標(biāo)組合,具體流程見圖1。

        流程的關(guān)鍵步驟如下:一是獲取招采數(shù)據(jù)。從招采系統(tǒng)中獲取采購尋源單,主要包括采購單位、項(xiàng)目名稱、投標(biāo)供應(yīng)商名單、中標(biāo)人名稱、中標(biāo)金額等字段信息。二是數(shù)據(jù)清洗、轉(zhuǎn)換。根據(jù)實(shí)際需要,剔除無效數(shù)據(jù),如同一尋源單中重復(fù)出現(xiàn)的供應(yīng)商,并對源數(shù)據(jù)進(jìn)行轉(zhuǎn)換,提取出關(guān)鍵數(shù)據(jù)。三是供應(yīng)商初步分組。按照同類尋源單各供應(yīng)商之間邊權(quán)增加1原則,對全局?jǐn)?shù)據(jù)進(jìn)行統(tǒng)計(jì),遍歷全部尋源單條目,形成涵蓋全部供應(yīng)商關(guān)系的網(wǎng)絡(luò)。然后,利用Louvain對樣本數(shù)據(jù)進(jìn)行分類,將關(guān)系密切的供應(yīng)商劃分到同一個(gè)社區(qū),減少后續(xù)Apriori的運(yùn)算時(shí)間,提升效率與準(zhǔn)確度。四是形成高關(guān)聯(lián)度供應(yīng)商團(tuán)組。對分類之后的每一個(gè)初步分組,單獨(dú)運(yùn)行Apriori算法,利用二分法尋找每個(gè)社群適用的最小支持度,獲得盡可能全面的頻繁項(xiàng)集結(jié)果,計(jì)算出對應(yīng)的關(guān)聯(lián)關(guān)系、KULC度量和不平衡比,并篩選出有價(jià)值的頻繁項(xiàng)集。五是輔助審計(jì)。根據(jù)上述頻繁項(xiàng)集,反查相關(guān)合同標(biāo)的,通過具體合同分析,排查有關(guān)圍串標(biāo)行為。

        四、方法運(yùn)用示例

        (一)社區(qū)發(fā)現(xiàn)結(jié)果

        通過Louvain社區(qū)分類算法,將采購尋源單中560家供應(yīng)商按互相之間同時(shí)出現(xiàn)的頻繁程度及業(yè)務(wù)范圍劃分為9個(gè)組別,如建筑建設(shè)、通信、工程設(shè)計(jì)、保險(xiǎn)、電器設(shè)備等。從結(jié)果上看,劃分到同一個(gè)社區(qū)中的供應(yīng)商業(yè)務(wù)方向大多一致,劃分結(jié)果較為精準(zhǔn),見圖2、圖3。此舉可以減少大量零事務(wù),為后續(xù)使用Apriori時(shí)設(shè)置最小置信度提供便利。若不對采購尋源單數(shù)據(jù)進(jìn)行預(yù)先劃分,在后續(xù)使用Apriori時(shí),在設(shè)置最小置信度時(shí)會(huì)遇到困難。因?yàn)楣?yīng)商種類繁雜,導(dǎo)致零事務(wù)數(shù)量巨大:若設(shè)置的最小置信度偏大,則會(huì)遺漏大量頻繁項(xiàng)集,導(dǎo)致輸出的結(jié)果覆蓋面大幅下降;若設(shè)置的最小置信度偏小,則會(huì)導(dǎo)致無法及時(shí)刪去非頻繁項(xiàng)集,失去Apriori算法的優(yōu)勢,導(dǎo)致計(jì)算時(shí)間指數(shù)性增長。

        (二)關(guān)聯(lián)規(guī)則分析結(jié)果

        一部分提升度大于3的頻繁項(xiàng)集的KULC度量在0.5左右,不平衡比接近0。在對該部分結(jié)果進(jìn)行排查之后發(fā)現(xiàn),該部分結(jié)果雖然提升度大于3,但并非有價(jià)值的供應(yīng)商團(tuán)組,見圖4。由此可見,單獨(dú)考慮提升度情況下的結(jié)果輸出形式并不準(zhǔn)確。

        在引入KULC度量與不平衡比之后,篩選出的供應(yīng)商團(tuán)組占比從原來只考慮提升度情況下的73.5%下降到39.7%,大幅減少了輸出的數(shù)據(jù)量,提升了精準(zhǔn)度,減少了后續(xù)審計(jì)疑點(diǎn)排查時(shí)間,見圖5。

        以第2組社區(qū)團(tuán)體中的供應(yīng)商組合ABC進(jìn)行說明。對于供應(yīng)商A→BC,其對應(yīng)的置信度為0.4,提升度為57.4,KULC度量值為0.7,不平衡比為0.6,見圖6。

        該供應(yīng)商團(tuán)組提升度極高,KULC度量值偏高,不在紅色標(biāo)注的0.4—0.6的范圍之內(nèi),并且不平衡比較大,遠(yuǎn)超紅色標(biāo)注的0.2的閾值。具備作為疑點(diǎn)的顯著特征,并且供應(yīng)商A有可能是該團(tuán)組的主導(dǎo)人。將該疑點(diǎn)事務(wù)提出,結(jié)合該組合中供應(yīng)商A的中標(biāo)率與全局情況下供應(yīng)商A的中標(biāo)率進(jìn)行分析,發(fā)現(xiàn)該組合中供應(yīng)商A的中標(biāo)率明顯偏高。該組合極有可能是高度關(guān)聯(lián)團(tuán)組,并且供應(yīng)商A有可能是主導(dǎo)人。根據(jù)上述分析結(jié)果,審計(jì)人員進(jìn)一步查找該團(tuán)組相關(guān)合同,分析確認(rèn)是否存在招標(biāo)投標(biāo)法實(shí)施條例所列述的串通投標(biāo)情形。

        從結(jié)果來看,該方法數(shù)據(jù)篩選精準(zhǔn)度較高、覆蓋范圍較廣,極大地縮短了排查時(shí)間,輔助審計(jì)的作用較為明顯。面對大量的尋源單數(shù)據(jù),通過采用Louvain分類結(jié)合Apriori挖掘的方式,能較好地克服尋源單數(shù)量龐大、種類繁多等難點(diǎn);能對大量標(biāo)的進(jìn)行快速分類,較為精準(zhǔn)地劃分項(xiàng)目類別。在對各個(gè)組別分別進(jìn)行Apriori挖掘時(shí),采用最小二分法快速尋找出適用于對應(yīng)情況下的最小支持度,能免除對每一個(gè)組別設(shè)置特定最小支持度的流程,可使審計(jì)人員將精力主要集中在篩選出的疑似圍標(biāo)團(tuán)伙名單,擴(kuò)大審計(jì)覆蓋面,提高圍標(biāo)團(tuán)伙發(fā)現(xiàn)率,降低審計(jì)風(fēng)險(xiǎn)。

        需要指出的是,在最終結(jié)果篩選的過程中,如何設(shè)置置信度、提升度、KULC度量及不平衡比,以更為精準(zhǔn)地篩選出有價(jià)值的疑點(diǎn)事務(wù),仍需進(jìn)一步與招標(biāo)實(shí)際核實(shí)、分析。由于標(biāo)的數(shù)量龐大,某些項(xiàng)目類型本身參與者不多,按照本算法,此類參與者可能會(huì)在結(jié)果中被誤認(rèn)為是疑點(diǎn)團(tuán)組輸出。如何在結(jié)果中進(jìn)一步篩選出高精準(zhǔn)度的疑點(diǎn)團(tuán)組,仍需根據(jù)各企業(yè)招標(biāo)實(shí)際,通過大量數(shù)據(jù)反復(fù)驗(yàn)證調(diào)試各指標(biāo)的參數(shù)。

        (作者單位:浙江省能源集團(tuán)有限公司,郵政編碼:310007,電子郵箱:513972995@qq.com)

        主要參考文獻(xiàn)

        遲殿委.淺析大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘算法及應(yīng)用[J].電子元器件與信息技術(shù), 2019(4):4-7

        杜潔,李芹,潘媛等.聚類分析在內(nèi)部審計(jì)中的應(yīng)用研究[J].中國管理信息化, 2019(1):4-6

        王俊芳,王中龍,劉建,耿建,李艷,王蕾,秦賓.電力企業(yè)供應(yīng)商疑似圍標(biāo)串標(biāo)行為分析[J].經(jīng)營與管理, 2018(5):120-123

        張志恒,成雪嬌.大數(shù)據(jù)環(huán)境下基于文本挖掘的審計(jì)數(shù)據(jù)分析框架[J].會(huì)計(jì)之友, 2017(16):117-120

        猜你喜歡
        數(shù)據(jù)分析
        電子物證檢驗(yàn)的數(shù)據(jù)分析與信息應(yīng)用研究
        基于matlab曲線擬合的數(shù)據(jù)預(yù)測分析
        商情(2016年40期)2016-11-28 11:28:07
        分眾媒體趨勢下場景營銷的商業(yè)前景
        商(2016年32期)2016-11-24 17:39:41
        佛山某給水管線控制測量探討
        科技資訊(2016年18期)2016-11-15 18:05:53
        SPSS在環(huán)境地球化學(xué)中的應(yīng)用
        考試周刊(2016年84期)2016-11-11 23:57:34
        大數(shù)據(jù)時(shí)代高校數(shù)據(jù)管理的思考
        科技視界(2016年18期)2016-11-03 22:51:40
        我校如何利用體育大課間活動(dòng)解決男生引體向上這個(gè)薄弱環(huán)節(jié)
        Excel電子表格在財(cái)務(wù)日常工作中的應(yīng)用
        淺析大數(shù)據(jù)時(shí)代背景下的市場營銷策略
        新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
        中國市場(2016年36期)2016-10-19 04:31:23
        邻居少妇张开腿让我爽了一夜| 亚洲日日噜噜噜夜夜爽爽| 中文字幕一区二区三区在线看一区 | 国产亚洲真人做受在线观看| 国产一级特黄无码免费视频| 国产亚洲精品日韩综合网| 男女啪啪免费视频网址| 少妇一级淫片中文字幕| 中文无码久久精品| 麻豆久久五月国产综合 | 无码精品色午夜| 免费人妻精品区一区二区三 | 欧美尺寸又黑又粗又长| 日本高清不在线一区二区色| 91人妻一区二区三区蜜臀| 免费无码又爽又高潮视频| 亚洲熟妇无码av另类vr影视| 天天澡天天揉揉AV无码人妻斩| 丰满少妇又爽又紧又丰满动态视频| 白白发在线视频免费观看2| 特黄特色的大片观看免费视频| 亚洲自拍另类欧美综合| 精品国产亚洲av久一区二区三区| 亚洲人成网站18禁止| 免费a级毛片出奶水| 手机AV片在线| 一区二区三区四区草逼福利视频| 日韩大片高清播放器大全| 久久99精品九九九久久婷婷| 久久99国产精品尤物| 日韩中文字幕一区在线| 中文字幕隔壁人妻欲求不满 | 百合av一区二区三区| 青青草成人原视频在线播放视频| 日本一区二区三区爆乳| 日韩a毛片免费观看| 日本肥老熟妇在线观看| 国产一区二区三区激情视频| 国产97在线 | 中文| 午夜免费福利一区二区无码AV| 国产亚洲一本二本三道|