田桂申 白雪嬌 章達(dá)英
摘要:為解決信息審計(jì)系統(tǒng)在用戶登錄操作識(shí)別上存在的自動(dòng)化程度差、智能化等級低等現(xiàn)實(shí)問題,通過引入一種基于人機(jī)認(rèn)證的數(shù)據(jù)挖掘算法,采用人臉識(shí)別技術(shù)與賬號密碼配合提供用于身份認(rèn)證的身份令牌,將用戶信息預(yù)存儲(chǔ)在身份庫中,保證賬號僅對持有者本人提供登錄操作權(quán)限,并支持對16925個(gè)IP地址進(jìn)行動(dòng)態(tài)追蹤、自動(dòng)獲取關(guān)鍵崗位信息,輔助數(shù)字化審計(jì)平臺(tái)監(jiān)控及預(yù)警功能的實(shí)現(xiàn),具有顯著經(jīng)濟(jì)及社會(huì)效益。
關(guān)鍵詞:信息審計(jì);人機(jī)認(rèn)證;數(shù)據(jù)挖掘;算法設(shè)計(jì)
一、引言
在當(dāng)前數(shù)字經(jīng)濟(jì)時(shí)代,工信部、網(wǎng)信辦與公安部于2021年7月聯(lián)合印發(fā)《網(wǎng)絡(luò)產(chǎn)品安全漏洞管理規(guī)定》,標(biāo)志著企業(yè)數(shù)據(jù)安全、網(wǎng)絡(luò)安全問題已正式上升至國家安全戰(zhàn)略高度,開展信息系統(tǒng)審計(jì)成為維護(hù)數(shù)據(jù)安全、推動(dòng)審計(jì)全覆蓋、實(shí)現(xiàn)“科技強(qiáng)審”目標(biāo)的客觀需要。但現(xiàn)有信息系統(tǒng)仍存在出借賬號辦理業(yè)務(wù)、缺乏全流程追溯機(jī)制、未落實(shí)“不相容崗位分離”、多個(gè)IP可同時(shí)登錄一個(gè)賬號等問題,導(dǎo)致在資金支付、業(yè)務(wù)審批環(huán)節(jié)面臨系統(tǒng)性風(fēng)險(xiǎn),亟需規(guī)劃一種身份管理作業(yè)系統(tǒng)方案,用于解決現(xiàn)有技術(shù)手段有限的難題,實(shí)現(xiàn)審計(jì)監(jiān)督全覆蓋。
二、研究背景
(一)國外研究綜述
美國早在計(jì)算機(jī)進(jìn)入使用階段即提出信息系統(tǒng)審計(jì)的概念,1969年成立電子數(shù)據(jù)處理審計(jì)師協(xié)會(huì),1994年該協(xié)會(huì)正式更名為ISACA,并制定頒布一系列準(zhǔn)則、指南等文件,用于指導(dǎo)信息系統(tǒng)審計(jì)工作的規(guī)范化開展。現(xiàn)階段由ISACA協(xié)會(huì)頒布的《國際信息系統(tǒng)審計(jì)指南CISA》已在全球范圍內(nèi)推廣,信息系統(tǒng)審計(jì)步入智慧化階段[1]。
(二)國內(nèi)研究綜述
國內(nèi)在20世紀(jì)90年代開始信息系統(tǒng)審計(jì)方面的研究與探索,中國內(nèi)部審計(jì)協(xié)會(huì)于2020年12月發(fā)布《第3205號內(nèi)部審計(jì)實(shí)務(wù)指南——信息系統(tǒng)審計(jì)》文件,為信息系統(tǒng)審計(jì)實(shí)踐提供指導(dǎo)。2021年3月,內(nèi)蒙古自治區(qū)科技廳向公司下發(fā)關(guān)于科技計(jì)劃項(xiàng)目的任務(wù)書,加快推動(dòng)公司信息系統(tǒng)審計(jì)工作的發(fā)展,現(xiàn)已完成信息系統(tǒng)審計(jì)方案的編制,梳理編寫126個(gè)信息系統(tǒng)審計(jì)模型清單,并計(jì)劃采用數(shù)據(jù)挖掘、區(qū)塊鏈等人工智能技術(shù)進(jìn)行系統(tǒng)漏洞的技術(shù)攻關(guān),為信息系統(tǒng)審計(jì)的智慧化探索打下良好基礎(chǔ)[2]。
三、研究內(nèi)容與方案
(一)研究內(nèi)容
為規(guī)劃身份管理作業(yè)系統(tǒng)方案,擬引入人臉識(shí)別技術(shù)與人機(jī)認(rèn)證數(shù)據(jù)挖掘算法,為身份管理引擎提供一種支持人臉識(shí)別、賬號密碼的身份令牌,用于對用戶身份進(jìn)行認(rèn)證,并存儲(chǔ)至身份信息數(shù)據(jù)庫中,同時(shí)記錄用戶姓名、登陸時(shí)間、登陸地點(diǎn)、登陸方式以及訪問客體等信息,便于后續(xù)信息追溯及責(zé)任界定。項(xiàng)目建設(shè)目標(biāo)在于利用生物識(shí)別方式進(jìn)行用戶賬號的自動(dòng)控制,僅支持賬號擁有者本人執(zhí)行賬號登錄操作,同時(shí)解決項(xiàng)目公司16925個(gè)IP的自動(dòng)追蹤問題,支持自動(dòng)獲取各關(guān)鍵崗位信息,并利用數(shù)字化審計(jì)平臺(tái)對同一個(gè)賬號在相同時(shí)段內(nèi)利用多個(gè)電腦終端登錄行為進(jìn)行監(jiān)控和預(yù)警,維護(hù)系統(tǒng)數(shù)據(jù)與信息安全[3]。
(二)建設(shè)需求分析
在業(yè)務(wù)需求方面,主要需解決信息系統(tǒng)賬號出借共用問題,嚴(yán)格執(zhí)行業(yè)務(wù)辦理的全流程追溯,遵循“不相容崗位分離”原則進(jìn)行系統(tǒng)審批流程管控,滿足信息系統(tǒng)的人機(jī)認(rèn)證功能需求。在集成需求方面,需完成信息系統(tǒng)認(rèn)證開發(fā),與i國網(wǎng)、統(tǒng)一權(quán)限系統(tǒng)采用接口調(diào)用方式實(shí)現(xiàn)部分?jǐn)?shù)據(jù)集成與雙向流動(dòng)。在非功能需求方面,需圍繞兼容性、可靠性、可維護(hù)性和易用性四個(gè)方面對審計(jì)移動(dòng)作業(yè)終端進(jìn)行功能升級[4]。
(三)項(xiàng)目實(shí)施方案
基于信息審計(jì)系統(tǒng)建設(shè)需求,在規(guī)劃身份管理系統(tǒng)作業(yè)方案時(shí),其核心技術(shù)要點(diǎn)在于應(yīng)用人臉識(shí)別技術(shù)進(jìn)行人機(jī)認(rèn)證,用戶可選擇通過人臉識(shí)別或輸入用戶名和密碼登錄系統(tǒng),且該系統(tǒng)需與國網(wǎng)統(tǒng)一權(quán)限系統(tǒng)對接,還需將用戶信息提前錄入,并通過認(rèn)證后存儲(chǔ)在身份庫中。在整體方案設(shè)計(jì)上,以用戶身份為中心,對網(wǎng)絡(luò)中的人、設(shè)備和應(yīng)用均賦予邏輯身份,基于身份進(jìn)行細(xì)粒度權(quán)限設(shè)置及判定,并且在用戶身份認(rèn)證環(huán)節(jié)增加人臉識(shí)別的生物特征。在人機(jī)認(rèn)證功能實(shí)現(xiàn)上,基于OpenCV視覺和機(jī)器學(xué)習(xí)庫引入級聯(lián)分類,運(yùn)用局部二值模式直方圖LBPH算法建立一種對人臉的面部、眼睛、微笑等進(jìn)行預(yù)訓(xùn)練的分類器;通過Haar級聯(lián)檢測找到人臉,并將檢測到的人臉位置返回為Rect(x,y,w,h);待獲取位置信息后即可為面部創(chuàng)建像素采集模塊ROI,并在此ROI模塊上進(jìn)行眼睛檢測,通過人臉識(shí)別后即可使用戶成功登錄系統(tǒng)。
四、數(shù)據(jù)挖掘算法設(shè)計(jì)及應(yīng)用
(一)算法設(shè)計(jì)
1.信息系統(tǒng)認(rèn)證功能
該功能主要通過調(diào)用i國網(wǎng)二維碼掃描組件實(shí)現(xiàn),在系統(tǒng)模塊設(shè)計(jì)上,包含用戶注冊、人臉識(shí)別、數(shù)字簽名、二維碼四個(gè)功能模塊,具體設(shè)計(jì)如下:
(1)用戶信息注冊模塊,基于“開始→輸入用戶名和密碼→判斷是否存在該用戶→確認(rèn)后輸入基本信息→記錄、存儲(chǔ)→結(jié)束”的流程完成用戶登錄操作。當(dāng)用戶登錄系統(tǒng)后顯示login.jsp頁面,輸入用戶名、密碼信息或啟用人臉識(shí)別功能提交至login_conf.jsp頁面,調(diào)用后臺(tái)數(shù)據(jù)庫檢索用戶預(yù)先錄入的身份信息,跳轉(zhuǎn)至handle_success.jsp或login_failure.jap頁面執(zhí)行后續(xù)操作,并將信息提交后跳轉(zhuǎn)至handle.java頁面,將用戶的姓名、登錄時(shí)間、登陸地點(diǎn)、登錄方式、訪問客體等信息存儲(chǔ)在數(shù)據(jù)庫中。
(2)人臉識(shí)別模塊,利用分類器對人臉面部、眼睛、微笑等信息提取特征,與保存在數(shù)據(jù)庫中的用戶頭像特征進(jìn)行比較,確認(rèn)符合用戶本人信息后生成二維碼憑證。其識(shí)別過程為“圖像采集裝置捕捉人臉圖像,提取特征信息→二維碼解碼→調(diào)用數(shù)據(jù)庫提取頭像特征→判斷用戶身份是否正確→顯示用戶身份信息并保存”。在具體識(shí)別過程中,先從CFRDemoDlg類中調(diào)用函數(shù)OnBnClickedExport(),建立人臉特征識(shí)別矩陣;隨后調(diào)用SavePicToModel()函數(shù),將用戶提交的人臉信息添加在模板庫中;接下來進(jìn)入CEnrollDlg類,依次調(diào)用MatchImage()、PicRecognize()、Pic2NormFace()函數(shù),識(shí)別圖像信息并將結(jié)果存儲(chǔ),返回保存值,并將保存值與閾值進(jìn)行比較,確認(rèn)超出閾值后即判定識(shí)別成功,發(fā)放準(zhǔn)許登入許可。
(3)數(shù)字簽名模塊,基于簽名算法和密鑰進(jìn)行用戶信息檢驗(yàn),既能夠保證對用戶身份信息進(jìn)行驗(yàn)證,同時(shí)可防范出現(xiàn)偽造二維碼或用戶登入信息等情況的發(fā)生。
(4)二維碼模塊,該模塊主要通過掃描、識(shí)別用戶數(shù)字簽名,根據(jù)對應(yīng)編碼生成二維碼憑證,經(jīng)解碼后獲取原始數(shù)字簽名信息,用于對數(shù)字簽名進(jìn)行驗(yàn)證。二維碼編碼流程為:“傳入二維碼版本、簽名密鑰→調(diào)用數(shù)據(jù)庫,提取有效信息和簽名→對簽名信息進(jìn)行編碼→完成數(shù)據(jù)處理并存儲(chǔ)在COR_Encode中,返回True→根據(jù)信息處理結(jié)果生成以pFilenameStr為路徑的二維碼圖片”。在具體編碼過程中,先輸入簽名密鑰,調(diào)用CTrainDlg類函數(shù)OnBnClickedQREncode(),從中調(diào)取用戶預(yù)先保存的信息并簽名認(rèn)證;隨后調(diào)用函數(shù)EncodeData(),完成編碼信息處理;在ProcessEncode()函數(shù)中,根據(jù)數(shù)據(jù)處理結(jié)果生成存儲(chǔ)路徑,并保存在filePathName文件中。二維碼解碼流程為“輸入二維碼→利用OnBnClickedQRDecode()將二維碼圖像分解為數(shù)字信息→完成解碼→保存字符串信息,返回True→讀取ContentDecoder類字符串信息,解碼完畢”。在具體解碼過程中,先進(jìn)入CEnrollDlg類中,提交二維碼平整,提取filePathName文件,并導(dǎo)入驗(yàn)證密鑰;隨后調(diào)用函數(shù)OnBnClickedQRDecode(),將該路徑中保存的圖像轉(zhuǎn)化為數(shù)字信息;接下來調(diào)用函數(shù)DecodeData(),完成數(shù)字信息解碼,獲取字符串并存儲(chǔ)在變量中,返回BOOL類型值;最后將存儲(chǔ)信息讀取至CString類的ciphertext變量中,返回?cái)?shù)值,獲得解碼后的字符串,用于對用戶身份進(jìn)行識(shí)別,完成數(shù)字簽名的驗(yàn)證。
2.服務(wù)端基礎(chǔ)算法庫
服務(wù)器端基礎(chǔ)算法庫以深度學(xué)習(xí)算法為核心,集成分類、聚類、標(biāo)準(zhǔn)化、結(jié)構(gòu)化、業(yè)務(wù)模型訓(xùn)練、特征提取、主成分分析、回歸、序列分析等算法類型?;谌藱C(jī)認(rèn)證功能進(jìn)行數(shù)據(jù)挖掘算法的設(shè)計(jì),主要運(yùn)用仿真優(yōu)化方法以相對最少次數(shù)獲取滿意解,將系統(tǒng)所需最大化指標(biāo)設(shè)為P=P1,P2,…,Pp,最小化指標(biāo)設(shè)為Q=Q1,Q2,…,Qq,仿真優(yōu)化總耗時(shí)為T,則建立目標(biāo)函數(shù)為:
在目標(biāo)函數(shù)的約束條件設(shè)計(jì)上,將不同子系統(tǒng)的仿真輸出結(jié)果視為系統(tǒng)輸入值,通過對整體系統(tǒng)進(jìn)行仿真獲取各指標(biāo)的輸出結(jié)果,將第i個(gè)子系統(tǒng)的輸出結(jié)果設(shè)為Si(i∈[1,n]),由此設(shè)置約束條件Pi和Qi;隨后將仿真優(yōu)化總耗時(shí)設(shè)為T,利用ti(i∈[1,n])表示第i個(gè)子系統(tǒng)的單次仿真耗時(shí),整體耗時(shí)為tn+1,由此設(shè)置仿真條件T;將子系統(tǒng)仿真優(yōu)化總次數(shù)設(shè)為ci,整體系統(tǒng)仿真次數(shù)為cn+1,子系統(tǒng)仿真輸出結(jié)果ki表示輸入變量的數(shù)量,設(shè)置約束條件Si;將整體系統(tǒng)輸入變量的可行域設(shè)為xij,則約束條件表示為:
(二)硬件配置
原信息審計(jì)系統(tǒng)在建設(shè)環(huán)節(jié)已滿足硬件設(shè)計(jì)條件,因此人機(jī)認(rèn)證系統(tǒng)擬充分利用原有硬件設(shè)備,不涉及新增硬件設(shè)計(jì),依據(jù)功能邏輯完成各單元的劃分,并將相應(yīng)程序存儲(chǔ)在ROM/RAM或磁盤中。
(三)軟件方案
根據(jù)系統(tǒng)安全穩(wěn)定運(yùn)行需求,選用企業(yè)級關(guān)系型數(shù)據(jù)庫Mysql與工業(yè)級標(biāo)準(zhǔn)J2EE應(yīng)用服務(wù)器軟件,遵循ANSI/ISOSQL-89、ANSI/ISOSQL-92標(biāo)準(zhǔn),支持分區(qū)技術(shù)、聯(lián)機(jī)存儲(chǔ)及備份功能,滿足C2級安全要求以上,且符合雙字節(jié)編碼[5]。在軟件應(yīng)用部分功能實(shí)現(xiàn)上,主要涉及以下技術(shù)方案:
1.身份鑒別技術(shù),采用SSO技術(shù)框架與Portal建立系統(tǒng)公用組件,提供統(tǒng)一開放接口與CA、PKI認(rèn)證模塊對接,支持對用戶身份標(biāo)記及鑒別控制,建立集“CA認(rèn)證+PKI+用戶名、密碼”于一體的身份識(shí)別認(rèn)證機(jī)制,并采用軟件容錯(cuò)技術(shù)保證用戶身份的唯一性與鑒別結(jié)果的可靠性。在系統(tǒng)管理管理策略設(shè)計(jì)上包含以下兩種:一種是登陸失敗策略,當(dāng)用戶登錄失敗次數(shù)達(dá)到限值后,將禁止其再次登陸,或當(dāng)其登錄時(shí)長超限后將強(qiáng)制退出;另一種是安全策略,由系統(tǒng)結(jié)合預(yù)先設(shè)定的參數(shù)對用戶認(rèn)證失敗行為進(jìn)行管控,并生成錯(cuò)誤登錄信息日志。
2.訪問控制技術(shù),以資源管理平臺(tái)為核心進(jìn)行系統(tǒng)安全策略配置,利用TDM軟件對控制權(quán)進(jìn)行分配、訪問本地隊(duì)列數(shù)據(jù),與平臺(tái)訪問不同類型文件、數(shù)據(jù)庫表功能相結(jié)合;在用戶訪問權(quán)限控制上,主要包含系統(tǒng)級、功能級(菜單級)、頁面級(流程級)、字段級(按鈕級)四類權(quán)限,由統(tǒng)一平臺(tái)對不同用戶對應(yīng)的操作訪問權(quán)限進(jìn)行分配與定義,并借助工作流組件完成最小權(quán)限的設(shè)置,實(shí)現(xiàn)不同權(quán)限間的有效制約。
3.剩余信息保護(hù),選用基于Web開發(fā)的Session、Cookies兩種工具建立信息系統(tǒng),采用Session方式對用戶鑒別信息進(jìn)行存儲(chǔ),并且當(dāng)用戶退出系統(tǒng)后,依照預(yù)設(shè)流程進(jìn)行Cookies的清理,保證發(fā)揮信息保護(hù)作用。
4.抗抵賴,采用基于PKI結(jié)構(gòu)的數(shù)字證書進(jìn)行待傳輸數(shù)據(jù)信息的加密處理,利用數(shù)字簽名確保用戶輸入身份信息的真實(shí)性;同時(shí)設(shè)置分級別操作日志,用戶登錄系統(tǒng)或執(zhí)行業(yè)務(wù)操作過程中可利用operationlog日志進(jìn)行過程數(shù)據(jù)的存儲(chǔ),便于事后查詢管理,保證業(yè)務(wù)操作的抗抵賴性。
(四)系統(tǒng)測試
1.測試環(huán)境建構(gòu)。為針對人臉識(shí)別認(rèn)證功能的實(shí)現(xiàn)進(jìn)行驗(yàn)證,在實(shí)驗(yàn)室環(huán)境下采集10名用戶的人臉圖像信息,建立小型人臉識(shí)別庫,對照攝像頭采集的圖像判斷是否有人臉,并基于圖像預(yù)處理與數(shù)據(jù)轉(zhuǎn)化后,將人臉圖像以.xml格式存儲(chǔ)在/dev/vcs/video目錄中;隨后對10名用戶進(jìn)行人臉檢測,經(jīng)預(yù)處理提取特征信息,基于最近鄰分類算法與模板庫中的圖像特征進(jìn)行識(shí)別,判斷是否與人臉識(shí)別庫中的信息符合,并生成識(shí)別結(jié)果。
2.測試結(jié)果分析。基于Linux環(huán)境下在計(jì)算機(jī)終端觀察測試結(jié)果,顯示對話框中對應(yīng)人臉識(shí)別圖像庫中的數(shù)據(jù)與標(biāo)記的用戶名及其身份信息,證明該系統(tǒng)可有效實(shí)現(xiàn)人機(jī)認(rèn)證功能。在此基礎(chǔ)上進(jìn)行整體評價(jià):(1)兼容性,對外開放可直接接入平臺(tái)的API接口,提供語音轉(zhuǎn)換、結(jié)構(gòu)化處理等服務(wù)功能。(2)可靠性,單節(jié)點(diǎn)服務(wù)器支持100用戶并發(fā)、1000用戶在線,在執(zhí)行多用戶并發(fā)操作時(shí),將靜態(tài)頁面類響應(yīng)時(shí)間控制在3s內(nèi),事務(wù)處理類響應(yīng)時(shí)間控制在8s內(nèi),模塊試運(yùn)行3個(gè)月以上,達(dá)到7×24h可靠運(yùn)行,年可用率超過99.97%。(3)可維護(hù)性,滿足易理解、易分析、易配制、易修改、易測試要求。(4)易用性,頁面布局合理、通用操作規(guī)范,且出錯(cuò)處理、反饋與提示均滿足人性化要求。
五、結(jié)束語
通過面向信息審計(jì)系統(tǒng)合規(guī)性管理與控制需求,建立一種基于人機(jī)識(shí)別的數(shù)據(jù)挖掘算法,解決同一賬號在同一時(shí)段、不同終端登錄所引發(fā)的安全問題,有效提升網(wǎng)絡(luò)安全管理水平,并進(jìn)一步加快推進(jìn)系統(tǒng)數(shù)字化、智能化建設(shè),為信息審計(jì)系統(tǒng)認(rèn)證功能實(shí)現(xiàn)及應(yīng)用場景的拓寬提供良好示范經(jīng)驗(yàn)。
作者單位:田桂申? ? 白雪嬌? ? 章達(dá)英? ? 國網(wǎng)內(nèi)蒙古東部電力有限公司
參? 考? 文? 獻(xiàn)
[1]齊智江.計(jì)算機(jī)入侵檢測數(shù)據(jù)挖掘模型設(shè)計(jì)及系統(tǒng)實(shí)驗(yàn)驗(yàn)證[J].科學(xué)技術(shù)創(chuàng)新,2022,(07):69-72.
[2]徐剛.醫(yī)院信息管理系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2021,(03):3.
[3]李明亮,關(guān)虹.高校智能化審計(jì)管理信息系統(tǒng)的構(gòu)建與實(shí)施[J].教育財(cái)會(huì)研究,2021,(02):6.
[4]毛玲玥.審計(jì)信息系統(tǒng)的異常數(shù)據(jù)挖掘算法和應(yīng)用[J].全國流通經(jīng)濟(jì),2020,(19):2.
[5]王良,鮑喜,王云,等.基于數(shù)據(jù)挖掘算法的審計(jì)數(shù)據(jù)分析及案例應(yīng)用[J].中國注冊會(huì)計(jì)師,2020,(06):5.