李艷東
【關(guān)鍵詞】 知識(shí)圖譜; 商業(yè)銀行; 內(nèi)部審計(jì); 擔(dān)保; PageRank; 圖數(shù)據(jù)庫(kù)
【中圖分類號(hào)】 F239;C931.6? 【文獻(xiàn)標(biāo)識(shí)碼】 A? 【文章編號(hào)】 1004-5937(2021)22-0115-05
一、引言
知識(shí)圖譜是以圖的形式來(lái)描述世界萬(wàn)物及其關(guān)系的建模方法[ 1 ]。知識(shí)圖譜技術(shù)可以直觀、明了、形象地刻畫出審計(jì)關(guān)注對(duì)象(如客戶、員工、分支機(jī)構(gòu)、股東、監(jiān)管機(jī)構(gòu)、同業(yè)、供應(yīng)商、合作伙伴等)之間的關(guān)聯(lián)網(wǎng)絡(luò),并從多維度呈現(xiàn)審計(jì)對(duì)象的真實(shí)屬性和復(fù)雜多樣的連接關(guān)系,避免了抽樣風(fēng)險(xiǎn),降低了審計(jì)風(fēng)險(xiǎn),提升了內(nèi)部審計(jì)的工作效率和效果。本文基于大數(shù)據(jù)語(yǔ)言和開源工具軟件,構(gòu)建了改進(jìn)的知識(shí)圖譜技術(shù)實(shí)現(xiàn)方法,對(duì)商業(yè)銀行擔(dān)保業(yè)務(wù)審計(jì)高階模型進(jìn)行了嘗試和探索,有助于審計(jì)人員快速把握審計(jì)重點(diǎn),并掌握新型的審計(jì)思路,為內(nèi)部審計(jì)數(shù)字化轉(zhuǎn)型提供參考。
二、研究回顧
(一)知識(shí)圖譜簡(jiǎn)介
知識(shí)圖譜基于語(yǔ)義網(wǎng)絡(luò),能夠客觀描述實(shí)體之間或概念之間的復(fù)雜關(guān)聯(lián)關(guān)系。知識(shí)圖譜的構(gòu)建涉及節(jié)點(diǎn)抽取、屬性定義、關(guān)系建立、圖形展示、關(guān)系優(yōu)化等多方面技術(shù),而知識(shí)圖譜的應(yīng)用涉及自然語(yǔ)言處理(NLP)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)(Deep Learning)、人工智能等方面技術(shù)。
知識(shí)圖譜由節(jié)點(diǎn)和邊組成。節(jié)點(diǎn)可以是具象實(shí)體,如某個(gè)機(jī)構(gòu)、某位客戶等,也可以是抽象概念,如精品盈利、最佳服務(wù)等。邊可以是實(shí)體的屬性,如聯(lián)系方式、通信地址,也可以是實(shí)體之間的關(guān)系,如股東、供應(yīng)商。知識(shí)圖譜的初始理念是把用文本實(shí)現(xiàn)鏈接的傳統(tǒng)網(wǎng)絡(luò)轉(zhuǎn)化成具備一定智能、通過(guò)實(shí)體鏈接、能夠理解邏輯關(guān)系的語(yǔ)義網(wǎng)(Semantic)[ 2-3 ]。
1994年,Tim Berners-Lee提出網(wǎng)絡(luò)不應(yīng)該只是網(wǎng)頁(yè)之間的互相鏈接。因?yàn)樵诂F(xiàn)實(shí)生活中,網(wǎng)站描述的都是現(xiàn)實(shí)世界中存在的具體實(shí)物或者人腦中存在的抽象概念,網(wǎng)頁(yè)之間的鏈接應(yīng)當(dāng)體現(xiàn)這些實(shí)體或概念之間的關(guān)聯(lián)關(guān)系。但是當(dāng)時(shí)計(jì)算機(jī)無(wú)法有效地從網(wǎng)頁(yè)中識(shí)別出其中相關(guān)語(yǔ)義。Tim Berners-Lee于1998年提出了Semantic
Web的概念[ 4 ]。與傳統(tǒng)的基于網(wǎng)頁(yè)的互聯(lián)網(wǎng)不同,Semantic Web的本質(zhì)是基于事物(Web of Things),通過(guò)圖和鏈接的組織方式進(jìn)行呈現(xiàn)。圖中節(jié)點(diǎn)不僅支持網(wǎng)頁(yè),而且支持具象實(shí)體或抽象概念。圖中邊代表超鏈接,增加了語(yǔ)義描述,用于標(biāo)明實(shí)體之間的關(guān)聯(lián)關(guān)系。
在Semantic Web概念之后,大量新興語(yǔ)義和知識(shí)庫(kù)開始涌現(xiàn),如亞馬遜公司的True Knowledge,谷歌公司的Freebase,IBM公司的Yago等。谷歌公司在2010年收購(gòu)了MetaWeb公司,并以其Freebase產(chǎn)品為基礎(chǔ),于2012年推出基于知識(shí)圖譜的搜索引擎。之后,知識(shí)圖譜開始在智能問(wèn)答、輿情分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域凸顯出越來(lái)越重要的作用。
(二)PageRank算法簡(jiǎn)介
谷歌公司革命性的發(fā)明是“PageRank”網(wǎng)頁(yè)排名算法。該算法最初用于互聯(lián)網(wǎng)網(wǎng)頁(yè)搜集,在1998年前后使得網(wǎng)絡(luò)搜索實(shí)現(xiàn)質(zhì)的飛躍。該算法會(huì)通過(guò)一定規(guī)則確定出每個(gè)網(wǎng)頁(yè)的PageRank(PR)值來(lái)衡量網(wǎng)頁(yè)的重要程度,然后對(duì)PR值進(jìn)行大小排序[ 5 ]。在互聯(lián)網(wǎng),當(dāng)某網(wǎng)頁(yè)被多個(gè)網(wǎng)頁(yè)所指向或鏈接,說(shuō)明它受到認(rèn)可和信賴,其重要程度就高;如果某網(wǎng)頁(yè)沒(méi)有被指向或鏈接多次,但被其他重要的網(wǎng)頁(yè)指向和鏈接,那么該網(wǎng)頁(yè)重要程度也高。網(wǎng)頁(yè)的PR值主要受到三個(gè)因素影響,分別是指向該網(wǎng)頁(yè)的前置網(wǎng)頁(yè)數(shù)量、指向該網(wǎng)頁(yè)的前置網(wǎng)頁(yè)重要程度和該網(wǎng)頁(yè)背向指出數(shù)量。網(wǎng)頁(yè)P(yáng)R值的計(jì)算方法如公式(1)所示。其中,PR(A)、PR(B)、PR(C)分別表示網(wǎng)頁(yè)A、B、C的PR值,L(B)、L(C)、L(D)分別表示網(wǎng)頁(yè)B、C、D的出鏈數(shù)。
如果用向量B=(b1,b2,…,bn)T表示各網(wǎng)頁(yè)的排名值,用Bi表示第i次迭代結(jié)果,用矩陣A=a11 … a1m … a1n… … … … …am1 … amm … amn… … … … …an1 … anm … ann表示網(wǎng)頁(yè)之間的轉(zhuǎn)移概率,其中amn表示第m個(gè)網(wǎng)頁(yè)指向第n個(gè)網(wǎng)頁(yè)的鏈接概率,那么可以用公式(2)表示網(wǎng)頁(yè)排名情況。其中,Bi表示i時(shí)刻的網(wǎng)頁(yè)排名情況,Bi-1表示前一時(shí)刻的網(wǎng)頁(yè)排名情況。
在公式(2)經(jīng)過(guò)數(shù)次迭代趨于收斂后,可以得到公式(3):
由于存在某些孤立網(wǎng)頁(yè)不指向其他任何網(wǎng)頁(yè)的特殊情況,轉(zhuǎn)移矩陣A往往為稀疏矩陣。為了解決小概率事件下稀疏矩陣的運(yùn)算問(wèn)題,引入常數(shù)?琢進(jìn)行平滑處理,得到公式(4)。其中N是互聯(lián)網(wǎng)網(wǎng)頁(yè)的數(shù)量,I是單位矩陣,?琢為介于0到1之間的常數(shù),一般取0.15。
PageRank算法在數(shù)據(jù)挖掘與知識(shí)圖譜中的研究和應(yīng)用越來(lái)越多,尤其在社群識(shí)別(Community Identification)方面效果非常明顯。商業(yè)銀行在內(nèi)部審計(jì)中可以運(yùn)用PageRank算法,將審計(jì)關(guān)注對(duì)象作為網(wǎng)絡(luò)中的節(jié)點(diǎn),通過(guò)各種關(guān)聯(lián)關(guān)系構(gòu)建有向圖,然后計(jì)算轉(zhuǎn)移概率,再通過(guò)迭代,得到滿足收斂條件的PR值,進(jìn)而識(shí)別出可疑個(gè)體及其關(guān)聯(lián)團(tuán)體。
三、商業(yè)銀行擔(dān)保業(yè)務(wù)審計(jì)重點(diǎn)及存在困難
當(dāng)前,國(guó)內(nèi)外宏觀經(jīng)濟(jì)發(fā)展處于下行期。商業(yè)銀行為規(guī)避社會(huì)信用環(huán)境惡化風(fēng)險(xiǎn),主動(dòng)壓降信用貸款,發(fā)展擔(dān)保貸款加強(qiáng)風(fēng)險(xiǎn)補(bǔ)償。在實(shí)踐工作中,擔(dān)保貸款管理不到位給銀行信貸資產(chǎn)造成損失的案例層出不窮,成為商業(yè)銀行內(nèi)部審計(jì)必須關(guān)注的重點(diǎn)。
廣義擔(dān)保包括保證、質(zhì)押和抵押等,是指商業(yè)銀行通過(guò)改變信貸風(fēng)險(xiǎn)輪廓來(lái)影響借款人的違約損失率或違約概率,從而降低其信用風(fēng)險(xiǎn)。狹義擔(dān)保特指保證,是指商業(yè)銀行與保證人約定,如果借款人不履行債務(wù),保證人將承擔(dān)履行債務(wù)的責(zé)任[ 6 ]。擔(dān)保的最大特點(diǎn)是以第三人的信用來(lái)實(shí)現(xiàn)債務(wù)履約。在本文中,擔(dān)保特指狹義擔(dān)保。