楊綺+陳偉
【摘 要】 運動員信息舞弊審計是目前體育比賽中關(guān)注的一個重要問題。針對體育比賽的現(xiàn)狀及需要,提出了基于多字段分析的運動員信息舞弊審計方法。該方法通過對參賽運動員信息數(shù)據(jù)表中的多個字段進行檢測來查找重復(fù)運動員信息,發(fā)現(xiàn)舞弊線索。在分析該方法原理的基礎(chǔ)上,設(shè)計了兩種實現(xiàn)方法,以實例驗證了這兩種方法的有效性及實用價值,并對這兩種方法的優(yōu)缺點進行了比較。研究表明:基于多字段分析的運動員信息舞弊審計方法能有效地檢測運動員舞弊信息,滿足了體育比賽的實際需要。
【關(guān)鍵詞】 運動員信息; 舞弊審計; 多字段分析
中圖分類號:F249;G808.2 文獻標識碼:A 文章編號:1004-5937(2014)33-0112-04
一、問題的提出
1971年的“乒乓外交”敲開了封閉多年的中美關(guān)系大門,中美兩國乒乓球隊的友好往來,推動了兩國關(guān)系正?;倪M程,開創(chuàng)了我國外交史上的先河。如今,體育不僅服務(wù)于政治和外交,而且在市場經(jīng)濟的大潮中起著重要的作用,成為推動我國經(jīng)濟持續(xù)增長的重要力量。然而,隨著體育比賽商業(yè)化的發(fā)展,在一些大型比賽項目中,常常會出現(xiàn)參賽運動員舞弊問題,即在不同地方注冊的運動員可能會代表不同的運動隊參加比賽,這違反了比賽規(guī)則。比如:2012年在河南南陽舉辦的第七屆全國農(nóng)民運動會象棋比賽中就被曝出有專業(yè)棋手改名參賽。
為了能有效地檢測出這些違規(guī)的運動員信息,僅靠人工判斷效率低下;另外,只從身份證信息或姓名這一個字段信息來判斷運動員信息還不夠準確。因此,如何通過對運動員信息進行數(shù)據(jù)分析來檢測運動員信息舞弊成為一些大型比賽順利開展所面臨的重要問題。
對于數(shù)據(jù)分析,目前常用的方法主要有:賬表分析、數(shù)據(jù)查詢、審計抽樣、數(shù)值分析、統(tǒng)計分析等,但這些方法多用于舞弊審計領(lǐng)域之中,很少應(yīng)用于大型體育比賽項目中?;谝陨戏治?,本文提出了基于多字段分析的運動員信息舞弊審計方法。
二、運動員信息舞弊審計方法原理分析
表1為某運動員信息表中關(guān)于運動員信息的4條記錄。在表1中,編號為Y98001和Y98003的這兩條記錄僅從編號和姓名來看是不一樣,但這兩條記錄除了編號和姓名不同外,性別、年齡、身高、體重、運動項目、入隊時間、運動員等級等字段都一樣,這樣的運動員信息實際上有可能是同一名運動員。因此,對于這樣的運動員信息,僅從編號和姓名上來判斷其歸屬的運動隊存在很大的漏洞。根據(jù)以上分析,本文提出一種基于多字段分析的運動員信息舞弊審計方法,其原理如圖1所示。
該方法的原理描述如下:
首先,根據(jù)對被審計運動員信息表的分析和實際情況選取比較字段;其次,對運動員信息表中的數(shù)據(jù)進行預(yù)處理,如標準化數(shù)據(jù)字段格式等;再次,根據(jù)實際情況,選擇相應(yīng)的重復(fù)數(shù)據(jù)分析方法,并根據(jù)所選取的比較字段,檢測重復(fù)運動員信息,所檢測出的重復(fù)信息即為可疑數(shù)據(jù);最后,對檢測出的每一組重復(fù)運動員的信息(可疑數(shù)據(jù))由工作人員通過一定的方法做進一步的延伸調(diào)查,最終確認是否有運動員的舞弊信息。
三、運動員信息舞弊審計方法的實現(xiàn)
根據(jù)以上分析,結(jié)合常用的數(shù)據(jù)分析方法,可以采用多種方法實現(xiàn)運動員信息舞弊審計。本文設(shè)計了兩種運動員信息舞弊審計方法。
(一)基于數(shù)據(jù)查詢的方法
數(shù)據(jù)查詢是目前最常用的數(shù)據(jù)分析方法。簡單地講,數(shù)據(jù)查詢就是按照一定的數(shù)據(jù)分析模型,在通用軟件(如Microsoft Access)中采用SQL命令來分析采集來的電子數(shù)據(jù)。運用SQL語句的強大查詢功能,通過構(gòu)建一些復(fù)雜的SQL語句,完成模糊查詢以及多表之間的交叉查詢等功能,從而可以完成復(fù)雜的數(shù)據(jù)處理功能。針對運動員信息舞弊審計的需要,假設(shè)工作人員想根據(jù)“性別、年齡、身高、體重、運動項目、入隊時間、運動員等級”這幾個字段查找重復(fù)運動員信息,其對應(yīng)的SQL查詢語句如下:
(二)基于數(shù)據(jù)分析軟件的方法
對于不熟悉SQL查詢語句的工作人員,在條件許可的情況下,也可以采用一些數(shù)據(jù)分析軟件來完成運動員信息舞弊檢測。比如采用數(shù)據(jù)分析軟件(如IDEA)的重號分析功能來完成運動員信息的舞弊檢測。
重號分析用來計算某個字段中相同數(shù)值重復(fù)的次數(shù)。在舞弊審計領(lǐng)域,重號分析一般多用來檢查一個數(shù)據(jù)表中是否存在相同的發(fā)票被重復(fù)記賬,以判斷是否有利用發(fā)票重復(fù)報銷或重復(fù)使用發(fā)票、使用虛假發(fā)票的情況。重號分析這種方法目前已被應(yīng)用于現(xiàn)場審計實施系統(tǒng)、ACL以及IDEA等審計數(shù)據(jù)分析軟件中。
四、案例分析
(一)案例介紹
本節(jié)以實例來分析以上兩種基于多字段分析的運動員信息舞弊審計方法的應(yīng)用。假設(shè)“運動員信息表”為某大型比賽活動中運動員的信息數(shù)據(jù),數(shù)據(jù)格式為Microsoft Access數(shù)據(jù)表,如圖2所示。
(二)基于數(shù)據(jù)查詢的方法
總之,工作人員可以根據(jù)需要更改相應(yīng)的SQL語句,對字段進行檢測,從而靈活地檢測出重復(fù)運動員信息。
(三)基于數(shù)據(jù)分析軟件的方法
以IDEA數(shù)據(jù)分析軟件為例,分析如何采用數(shù)據(jù)分析軟件來檢測重復(fù)運動員信息,主要過程如下。
五、兩種方法的比較
根據(jù)以上分析可以發(fā)現(xiàn):
一是基于數(shù)據(jù)查詢方法的優(yōu)點是使用起來比較靈活,且Access數(shù)據(jù)庫系統(tǒng)比較容易獲得;缺點是要求工作人員必須靈活掌握如何寫SQL查詢語句。
二是基于數(shù)據(jù)分析軟件方法的優(yōu)點是使用起來比較簡單;缺點是數(shù)據(jù)分析軟件(如IDEA)是專門的軟件,一般不能免費獲得。
六、總結(jié)
本文根據(jù)我國大型體育比賽活動的需要,提出了基于多字段分析的運動員信息舞弊審計方法,有效地滿足了體育比賽的實際需要。在實際使用過程中,工作人員可以根據(jù)實際情況和所具備的條件,選擇最佳方法。
另外,不管被審計的運動員信息數(shù)據(jù)以何種數(shù)據(jù)格式存在,如Excel、文本文件或其他數(shù)據(jù)庫格式,在實際操作中可以先把這些不同格式的數(shù)據(jù)采集到Access數(shù)據(jù)庫或IDEA中,然后再采用本文的方法對這些數(shù)據(jù)進行分析。
當(dāng)然,本文所研究的方法不能夠解決體育比賽中所有的運動員信息舞弊問題,但通過和其他方法一起使用,能在很大程度上提高工作效率,滿足大型體育比賽活動的需要?!?/p>
【參考文獻】
[1] 換個馬甲當(dāng)農(nóng)民21人被“清退”[N].青島晚報,2012-09-26.
[2] Monge A E. Matching algorithms within a duplicate detection system[J].IEEE Data Engineer Bulletin, 2000,23(4):14-20.
[3] Navarro G. A guided tour to approximate string matching[J]. ACM Computing Surveys, 2001,33(1):31-88.
[4] Durtschi C, Hillison W, Pacini C. The effective use of benford's law to assist in detecting fraud in accounting data[J].Journal of Forensic Accounting,2004,5(1):17-34.
[5] 陳偉,張金城,Robin Qiu.計算機輔助審計技術(shù)(CAATs)研究綜述[J].計算機科學(xué),2007,34(10): 290-294.
[6] 陳偉,Robin Qiu,劉思峰.一種基于數(shù)據(jù)匹配技術(shù)的審計證據(jù)獲取方法[J].計算機科學(xué),2008,35(8): 183-187,194.
[7] 陳偉.計算機輔助審計原理及應(yīng)用(第二版)[M].北京:清華大學(xué)出版社,2012.
[8] 陳偉,Robin Qiu.面向大型數(shù)據(jù)庫的審計數(shù)據(jù)采集方法[J].計算機應(yīng)用,2008,28(8):2144-2146,2149.endprint
【摘 要】 運動員信息舞弊審計是目前體育比賽中關(guān)注的一個重要問題。針對體育比賽的現(xiàn)狀及需要,提出了基于多字段分析的運動員信息舞弊審計方法。該方法通過對參賽運動員信息數(shù)據(jù)表中的多個字段進行檢測來查找重復(fù)運動員信息,發(fā)現(xiàn)舞弊線索。在分析該方法原理的基礎(chǔ)上,設(shè)計了兩種實現(xiàn)方法,以實例驗證了這兩種方法的有效性及實用價值,并對這兩種方法的優(yōu)缺點進行了比較。研究表明:基于多字段分析的運動員信息舞弊審計方法能有效地檢測運動員舞弊信息,滿足了體育比賽的實際需要。
【關(guān)鍵詞】 運動員信息; 舞弊審計; 多字段分析
中圖分類號:F249;G808.2 文獻標識碼:A 文章編號:1004-5937(2014)33-0112-04
一、問題的提出
1971年的“乒乓外交”敲開了封閉多年的中美關(guān)系大門,中美兩國乒乓球隊的友好往來,推動了兩國關(guān)系正?;倪M程,開創(chuàng)了我國外交史上的先河。如今,體育不僅服務(wù)于政治和外交,而且在市場經(jīng)濟的大潮中起著重要的作用,成為推動我國經(jīng)濟持續(xù)增長的重要力量。然而,隨著體育比賽商業(yè)化的發(fā)展,在一些大型比賽項目中,常常會出現(xiàn)參賽運動員舞弊問題,即在不同地方注冊的運動員可能會代表不同的運動隊參加比賽,這違反了比賽規(guī)則。比如:2012年在河南南陽舉辦的第七屆全國農(nóng)民運動會象棋比賽中就被曝出有專業(yè)棋手改名參賽。
為了能有效地檢測出這些違規(guī)的運動員信息,僅靠人工判斷效率低下;另外,只從身份證信息或姓名這一個字段信息來判斷運動員信息還不夠準確。因此,如何通過對運動員信息進行數(shù)據(jù)分析來檢測運動員信息舞弊成為一些大型比賽順利開展所面臨的重要問題。
對于數(shù)據(jù)分析,目前常用的方法主要有:賬表分析、數(shù)據(jù)查詢、審計抽樣、數(shù)值分析、統(tǒng)計分析等,但這些方法多用于舞弊審計領(lǐng)域之中,很少應(yīng)用于大型體育比賽項目中?;谝陨戏治觯疚奶岢隽嘶诙嘧侄畏治龅倪\動員信息舞弊審計方法。
二、運動員信息舞弊審計方法原理分析
表1為某運動員信息表中關(guān)于運動員信息的4條記錄。在表1中,編號為Y98001和Y98003的這兩條記錄僅從編號和姓名來看是不一樣,但這兩條記錄除了編號和姓名不同外,性別、年齡、身高、體重、運動項目、入隊時間、運動員等級等字段都一樣,這樣的運動員信息實際上有可能是同一名運動員。因此,對于這樣的運動員信息,僅從編號和姓名上來判斷其歸屬的運動隊存在很大的漏洞。根據(jù)以上分析,本文提出一種基于多字段分析的運動員信息舞弊審計方法,其原理如圖1所示。
該方法的原理描述如下:
首先,根據(jù)對被審計運動員信息表的分析和實際情況選取比較字段;其次,對運動員信息表中的數(shù)據(jù)進行預(yù)處理,如標準化數(shù)據(jù)字段格式等;再次,根據(jù)實際情況,選擇相應(yīng)的重復(fù)數(shù)據(jù)分析方法,并根據(jù)所選取的比較字段,檢測重復(fù)運動員信息,所檢測出的重復(fù)信息即為可疑數(shù)據(jù);最后,對檢測出的每一組重復(fù)運動員的信息(可疑數(shù)據(jù))由工作人員通過一定的方法做進一步的延伸調(diào)查,最終確認是否有運動員的舞弊信息。
三、運動員信息舞弊審計方法的實現(xiàn)
根據(jù)以上分析,結(jié)合常用的數(shù)據(jù)分析方法,可以采用多種方法實現(xiàn)運動員信息舞弊審計。本文設(shè)計了兩種運動員信息舞弊審計方法。
(一)基于數(shù)據(jù)查詢的方法
數(shù)據(jù)查詢是目前最常用的數(shù)據(jù)分析方法。簡單地講,數(shù)據(jù)查詢就是按照一定的數(shù)據(jù)分析模型,在通用軟件(如Microsoft Access)中采用SQL命令來分析采集來的電子數(shù)據(jù)。運用SQL語句的強大查詢功能,通過構(gòu)建一些復(fù)雜的SQL語句,完成模糊查詢以及多表之間的交叉查詢等功能,從而可以完成復(fù)雜的數(shù)據(jù)處理功能。針對運動員信息舞弊審計的需要,假設(shè)工作人員想根據(jù)“性別、年齡、身高、體重、運動項目、入隊時間、運動員等級”這幾個字段查找重復(fù)運動員信息,其對應(yīng)的SQL查詢語句如下:
(二)基于數(shù)據(jù)分析軟件的方法
對于不熟悉SQL查詢語句的工作人員,在條件許可的情況下,也可以采用一些數(shù)據(jù)分析軟件來完成運動員信息舞弊檢測。比如采用數(shù)據(jù)分析軟件(如IDEA)的重號分析功能來完成運動員信息的舞弊檢測。
重號分析用來計算某個字段中相同數(shù)值重復(fù)的次數(shù)。在舞弊審計領(lǐng)域,重號分析一般多用來檢查一個數(shù)據(jù)表中是否存在相同的發(fā)票被重復(fù)記賬,以判斷是否有利用發(fā)票重復(fù)報銷或重復(fù)使用發(fā)票、使用虛假發(fā)票的情況。重號分析這種方法目前已被應(yīng)用于現(xiàn)場審計實施系統(tǒng)、ACL以及IDEA等審計數(shù)據(jù)分析軟件中。
四、案例分析
(一)案例介紹
本節(jié)以實例來分析以上兩種基于多字段分析的運動員信息舞弊審計方法的應(yīng)用。假設(shè)“運動員信息表”為某大型比賽活動中運動員的信息數(shù)據(jù),數(shù)據(jù)格式為Microsoft Access數(shù)據(jù)表,如圖2所示。
(二)基于數(shù)據(jù)查詢的方法
總之,工作人員可以根據(jù)需要更改相應(yīng)的SQL語句,對字段進行檢測,從而靈活地檢測出重復(fù)運動員信息。
(三)基于數(shù)據(jù)分析軟件的方法
以IDEA數(shù)據(jù)分析軟件為例,分析如何采用數(shù)據(jù)分析軟件來檢測重復(fù)運動員信息,主要過程如下。
五、兩種方法的比較
根據(jù)以上分析可以發(fā)現(xiàn):
一是基于數(shù)據(jù)查詢方法的優(yōu)點是使用起來比較靈活,且Access數(shù)據(jù)庫系統(tǒng)比較容易獲得;缺點是要求工作人員必須靈活掌握如何寫SQL查詢語句。
二是基于數(shù)據(jù)分析軟件方法的優(yōu)點是使用起來比較簡單;缺點是數(shù)據(jù)分析軟件(如IDEA)是專門的軟件,一般不能免費獲得。
六、總結(jié)
本文根據(jù)我國大型體育比賽活動的需要,提出了基于多字段分析的運動員信息舞弊審計方法,有效地滿足了體育比賽的實際需要。在實際使用過程中,工作人員可以根據(jù)實際情況和所具備的條件,選擇最佳方法。
另外,不管被審計的運動員信息數(shù)據(jù)以何種數(shù)據(jù)格式存在,如Excel、文本文件或其他數(shù)據(jù)庫格式,在實際操作中可以先把這些不同格式的數(shù)據(jù)采集到Access數(shù)據(jù)庫或IDEA中,然后再采用本文的方法對這些數(shù)據(jù)進行分析。
當(dāng)然,本文所研究的方法不能夠解決體育比賽中所有的運動員信息舞弊問題,但通過和其他方法一起使用,能在很大程度上提高工作效率,滿足大型體育比賽活動的需要?!?/p>
【參考文獻】
[1] 換個馬甲當(dāng)農(nóng)民21人被“清退”[N].青島晚報,2012-09-26.
[2] Monge A E. Matching algorithms within a duplicate detection system[J].IEEE Data Engineer Bulletin, 2000,23(4):14-20.
[3] Navarro G. A guided tour to approximate string matching[J]. ACM Computing Surveys, 2001,33(1):31-88.
[4] Durtschi C, Hillison W, Pacini C. The effective use of benford's law to assist in detecting fraud in accounting data[J].Journal of Forensic Accounting,2004,5(1):17-34.
[5] 陳偉,張金城,Robin Qiu.計算機輔助審計技術(shù)(CAATs)研究綜述[J].計算機科學(xué),2007,34(10): 290-294.
[6] 陳偉,Robin Qiu,劉思峰.一種基于數(shù)據(jù)匹配技術(shù)的審計證據(jù)獲取方法[J].計算機科學(xué),2008,35(8): 183-187,194.
[7] 陳偉.計算機輔助審計原理及應(yīng)用(第二版)[M].北京:清華大學(xué)出版社,2012.
[8] 陳偉,Robin Qiu.面向大型數(shù)據(jù)庫的審計數(shù)據(jù)采集方法[J].計算機應(yīng)用,2008,28(8):2144-2146,2149.endprint
【摘 要】 運動員信息舞弊審計是目前體育比賽中關(guān)注的一個重要問題。針對體育比賽的現(xiàn)狀及需要,提出了基于多字段分析的運動員信息舞弊審計方法。該方法通過對參賽運動員信息數(shù)據(jù)表中的多個字段進行檢測來查找重復(fù)運動員信息,發(fā)現(xiàn)舞弊線索。在分析該方法原理的基礎(chǔ)上,設(shè)計了兩種實現(xiàn)方法,以實例驗證了這兩種方法的有效性及實用價值,并對這兩種方法的優(yōu)缺點進行了比較。研究表明:基于多字段分析的運動員信息舞弊審計方法能有效地檢測運動員舞弊信息,滿足了體育比賽的實際需要。
【關(guān)鍵詞】 運動員信息; 舞弊審計; 多字段分析
中圖分類號:F249;G808.2 文獻標識碼:A 文章編號:1004-5937(2014)33-0112-04
一、問題的提出
1971年的“乒乓外交”敲開了封閉多年的中美關(guān)系大門,中美兩國乒乓球隊的友好往來,推動了兩國關(guān)系正?;倪M程,開創(chuàng)了我國外交史上的先河。如今,體育不僅服務(wù)于政治和外交,而且在市場經(jīng)濟的大潮中起著重要的作用,成為推動我國經(jīng)濟持續(xù)增長的重要力量。然而,隨著體育比賽商業(yè)化的發(fā)展,在一些大型比賽項目中,常常會出現(xiàn)參賽運動員舞弊問題,即在不同地方注冊的運動員可能會代表不同的運動隊參加比賽,這違反了比賽規(guī)則。比如:2012年在河南南陽舉辦的第七屆全國農(nóng)民運動會象棋比賽中就被曝出有專業(yè)棋手改名參賽。
為了能有效地檢測出這些違規(guī)的運動員信息,僅靠人工判斷效率低下;另外,只從身份證信息或姓名這一個字段信息來判斷運動員信息還不夠準確。因此,如何通過對運動員信息進行數(shù)據(jù)分析來檢測運動員信息舞弊成為一些大型比賽順利開展所面臨的重要問題。
對于數(shù)據(jù)分析,目前常用的方法主要有:賬表分析、數(shù)據(jù)查詢、審計抽樣、數(shù)值分析、統(tǒng)計分析等,但這些方法多用于舞弊審計領(lǐng)域之中,很少應(yīng)用于大型體育比賽項目中?;谝陨戏治?,本文提出了基于多字段分析的運動員信息舞弊審計方法。
二、運動員信息舞弊審計方法原理分析
表1為某運動員信息表中關(guān)于運動員信息的4條記錄。在表1中,編號為Y98001和Y98003的這兩條記錄僅從編號和姓名來看是不一樣,但這兩條記錄除了編號和姓名不同外,性別、年齡、身高、體重、運動項目、入隊時間、運動員等級等字段都一樣,這樣的運動員信息實際上有可能是同一名運動員。因此,對于這樣的運動員信息,僅從編號和姓名上來判斷其歸屬的運動隊存在很大的漏洞。根據(jù)以上分析,本文提出一種基于多字段分析的運動員信息舞弊審計方法,其原理如圖1所示。
該方法的原理描述如下:
首先,根據(jù)對被審計運動員信息表的分析和實際情況選取比較字段;其次,對運動員信息表中的數(shù)據(jù)進行預(yù)處理,如標準化數(shù)據(jù)字段格式等;再次,根據(jù)實際情況,選擇相應(yīng)的重復(fù)數(shù)據(jù)分析方法,并根據(jù)所選取的比較字段,檢測重復(fù)運動員信息,所檢測出的重復(fù)信息即為可疑數(shù)據(jù);最后,對檢測出的每一組重復(fù)運動員的信息(可疑數(shù)據(jù))由工作人員通過一定的方法做進一步的延伸調(diào)查,最終確認是否有運動員的舞弊信息。
三、運動員信息舞弊審計方法的實現(xiàn)
根據(jù)以上分析,結(jié)合常用的數(shù)據(jù)分析方法,可以采用多種方法實現(xiàn)運動員信息舞弊審計。本文設(shè)計了兩種運動員信息舞弊審計方法。
(一)基于數(shù)據(jù)查詢的方法
數(shù)據(jù)查詢是目前最常用的數(shù)據(jù)分析方法。簡單地講,數(shù)據(jù)查詢就是按照一定的數(shù)據(jù)分析模型,在通用軟件(如Microsoft Access)中采用SQL命令來分析采集來的電子數(shù)據(jù)。運用SQL語句的強大查詢功能,通過構(gòu)建一些復(fù)雜的SQL語句,完成模糊查詢以及多表之間的交叉查詢等功能,從而可以完成復(fù)雜的數(shù)據(jù)處理功能。針對運動員信息舞弊審計的需要,假設(shè)工作人員想根據(jù)“性別、年齡、身高、體重、運動項目、入隊時間、運動員等級”這幾個字段查找重復(fù)運動員信息,其對應(yīng)的SQL查詢語句如下:
(二)基于數(shù)據(jù)分析軟件的方法
對于不熟悉SQL查詢語句的工作人員,在條件許可的情況下,也可以采用一些數(shù)據(jù)分析軟件來完成運動員信息舞弊檢測。比如采用數(shù)據(jù)分析軟件(如IDEA)的重號分析功能來完成運動員信息的舞弊檢測。
重號分析用來計算某個字段中相同數(shù)值重復(fù)的次數(shù)。在舞弊審計領(lǐng)域,重號分析一般多用來檢查一個數(shù)據(jù)表中是否存在相同的發(fā)票被重復(fù)記賬,以判斷是否有利用發(fā)票重復(fù)報銷或重復(fù)使用發(fā)票、使用虛假發(fā)票的情況。重號分析這種方法目前已被應(yīng)用于現(xiàn)場審計實施系統(tǒng)、ACL以及IDEA等審計數(shù)據(jù)分析軟件中。
四、案例分析
(一)案例介紹
本節(jié)以實例來分析以上兩種基于多字段分析的運動員信息舞弊審計方法的應(yīng)用。假設(shè)“運動員信息表”為某大型比賽活動中運動員的信息數(shù)據(jù),數(shù)據(jù)格式為Microsoft Access數(shù)據(jù)表,如圖2所示。
(二)基于數(shù)據(jù)查詢的方法
總之,工作人員可以根據(jù)需要更改相應(yīng)的SQL語句,對字段進行檢測,從而靈活地檢測出重復(fù)運動員信息。
(三)基于數(shù)據(jù)分析軟件的方法
以IDEA數(shù)據(jù)分析軟件為例,分析如何采用數(shù)據(jù)分析軟件來檢測重復(fù)運動員信息,主要過程如下。
五、兩種方法的比較
根據(jù)以上分析可以發(fā)現(xiàn):
一是基于數(shù)據(jù)查詢方法的優(yōu)點是使用起來比較靈活,且Access數(shù)據(jù)庫系統(tǒng)比較容易獲得;缺點是要求工作人員必須靈活掌握如何寫SQL查詢語句。
二是基于數(shù)據(jù)分析軟件方法的優(yōu)點是使用起來比較簡單;缺點是數(shù)據(jù)分析軟件(如IDEA)是專門的軟件,一般不能免費獲得。
六、總結(jié)
本文根據(jù)我國大型體育比賽活動的需要,提出了基于多字段分析的運動員信息舞弊審計方法,有效地滿足了體育比賽的實際需要。在實際使用過程中,工作人員可以根據(jù)實際情況和所具備的條件,選擇最佳方法。
另外,不管被審計的運動員信息數(shù)據(jù)以何種數(shù)據(jù)格式存在,如Excel、文本文件或其他數(shù)據(jù)庫格式,在實際操作中可以先把這些不同格式的數(shù)據(jù)采集到Access數(shù)據(jù)庫或IDEA中,然后再采用本文的方法對這些數(shù)據(jù)進行分析。
當(dāng)然,本文所研究的方法不能夠解決體育比賽中所有的運動員信息舞弊問題,但通過和其他方法一起使用,能在很大程度上提高工作效率,滿足大型體育比賽活動的需要?!?/p>
【參考文獻】
[1] 換個馬甲當(dāng)農(nóng)民21人被“清退”[N].青島晚報,2012-09-26.
[2] Monge A E. Matching algorithms within a duplicate detection system[J].IEEE Data Engineer Bulletin, 2000,23(4):14-20.
[3] Navarro G. A guided tour to approximate string matching[J]. ACM Computing Surveys, 2001,33(1):31-88.
[4] Durtschi C, Hillison W, Pacini C. The effective use of benford's law to assist in detecting fraud in accounting data[J].Journal of Forensic Accounting,2004,5(1):17-34.
[5] 陳偉,張金城,Robin Qiu.計算機輔助審計技術(shù)(CAATs)研究綜述[J].計算機科學(xué),2007,34(10): 290-294.
[6] 陳偉,Robin Qiu,劉思峰.一種基于數(shù)據(jù)匹配技術(shù)的審計證據(jù)獲取方法[J].計算機科學(xué),2008,35(8): 183-187,194.
[7] 陳偉.計算機輔助審計原理及應(yīng)用(第二版)[M].北京:清華大學(xué)出版社,2012.
[8] 陳偉,Robin Qiu.面向大型數(shù)據(jù)庫的審計數(shù)據(jù)采集方法[J].計算機應(yīng)用,2008,28(8):2144-2146,2149.endprint