王 炯,魏春明,趙 森,張?jiān)品?,?靖,王芳琳
(1.公安部物證鑒定中心,北京 100038;2.浙江警察學(xué)院,杭州 310053)
在我國,隨著社會經(jīng)濟(jì)的發(fā)展越來越多的化合物出現(xiàn)在人們的日常生活中,由此導(dǎo)致的投毒、中毒事件也日益增多,造成了巨大的人民生命財(cái)產(chǎn)損失。在應(yīng)對這些中毒案事件時(shí),無論是及時(shí)、專業(yè)的現(xiàn)場中毒救治還是實(shí)驗(yàn)室的后續(xù)毒物檢驗(yàn),其首要任務(wù)是判斷引發(fā)中毒的是哪一種或哪一類毒物,并且能夠及時(shí)獲得相關(guān)毒物的基本信息用于輔助現(xiàn)場處置工作[1-2]。因此,研究建立一套中毒判定軟件,利用不同毒物中毒所引發(fā)的受害人不同中毒反應(yīng)的區(qū)別,以及受害人生前的中毒表現(xiàn)或死后的解剖所見信息來判斷毒物種類,并且提供相關(guān)毒物的數(shù)據(jù)信息、檢驗(yàn)技術(shù)方法或相關(guān)處置的行業(yè)標(biāo)準(zhǔn)[3-4],對中毒案件處置中的專業(yè)人員或非專業(yè)人員提供技術(shù)支持,可有效地提高中毒現(xiàn)場救治能力和實(shí)驗(yàn)室毒物篩查、檢驗(yàn)效率,從而提高相關(guān)部門應(yīng)對中毒案事件的能力。
本軟件的核心功能是中毒判定,在中毒案例中,不同的毒物中毒會引發(fā)受害人不同的中毒反應(yīng),在中毒表現(xiàn)或尸體解剖中會表現(xiàn)出不同的中毒特征,因此,應(yīng)用數(shù)據(jù)挖掘技術(shù),收集大量的中毒案例數(shù)據(jù),從中發(fā)現(xiàn)中毒特征與毒物之間的規(guī)律[5-6],根據(jù)中毒特征對毒物進(jìn)行判定。
基于數(shù)據(jù)挖掘技術(shù)來實(shí)現(xiàn)中毒判定功能,首先建立中毒案例數(shù)據(jù)庫,從中調(diào)用與毒物、中毒相關(guān)的數(shù)據(jù)作為源數(shù)據(jù)來建立數(shù)學(xué)模型。實(shí)現(xiàn)這一過程,需要建立中毒特征模型(數(shù)據(jù)字典)來描述中毒受害人的中毒表現(xiàn)信息和尸體檢驗(yàn)信息,并通過中毒特征模型來將案例中的中毒特征數(shù)字化,便于研究應(yīng)用。本文的中毒特征模型分為中毒表現(xiàn)特征模型(生前)和尸體檢驗(yàn)特征模型(死后)兩類。其中,中毒表現(xiàn)特征模型分為眼部、神經(jīng)系統(tǒng)、呼吸系統(tǒng)、循環(huán)系統(tǒng)、皮膚黏膜、消化系統(tǒng)、泌尿系統(tǒng)、血液系統(tǒng)、其他共九個(gè)部分95個(gè)選項(xiàng),尸體檢驗(yàn)特征模型分為尸表體態(tài)、解剖所見、病理學(xué)檢查三個(gè)部分99個(gè)選項(xiàng)。
在建立的中毒案例數(shù)據(jù)庫中,按以下原則抽取數(shù)據(jù):1)案例中有中毒受害人,且其有中毒特征信息;2)案件檢材中有中毒受害人的生物檢材,且生物檢材中檢出具體毒物;3)具體毒物為多種時(shí),每一種均與中毒特征對應(yīng)形成一條訓(xùn)練數(shù)據(jù);4)對毒物種類進(jìn)行篩選,人為合并部分毒物相關(guān)案例,形成毒物種類中毒案例,如有機(jī)磷類殺蟲劑、氰化物等。
本文應(yīng)用SPSS Modeler13.0數(shù)學(xué)工具,選用Apriori關(guān)聯(lián)規(guī)則建立中毒判定功能的數(shù)學(xué)模型[7]。Apriori算法用于發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián)規(guī)則,是以下形式的語句:如果條件則結(jié)果。
1)支持度(Support)。假設(shè)X是一個(gè)屬性集,D是一個(gè)交易數(shù)據(jù)集,把D中包含X的交易記錄個(gè)數(shù)與D中總的交易記錄個(gè)數(shù)的比值,稱為X在D中的支持度。那么,關(guān)聯(lián)規(guī)則XY的支持度則定義為既包含X又包含Y的交易記錄個(gè)數(shù)與D中總的交易記錄個(gè)數(shù)的比值,即sup(XY)=P(X∪Y)。支持度描述X和Y同時(shí)出現(xiàn)的可能性大小,反映了規(guī)則的重要性。支持度很低的規(guī)則很可能是偶然出現(xiàn)的,而且多半也是人們不感興趣的。最小支持度(Minimum Support),記作min_sup。它是由用戶給定的,用于衡量屬性集在規(guī)則發(fā)現(xiàn)過程中的最低重要性。
2)置信度(Confidence)。若X和Y都是數(shù)據(jù)集D中屬性的集合,規(guī)則XY的置信度記作conf(XY),則conf(XY)定義為在數(shù)據(jù)集D中同時(shí)包含X和Y的記錄數(shù)與只包含X的記錄數(shù)的比值,也可以表示為屬性集(X∪Y)的支持度與屬性集X的支持度之比,即sup(X∪Y)/sup(X)。置信度描述Y在包含X的事務(wù)中出現(xiàn)的概率大小,反映規(guī)則的正確性。規(guī)則XY的置信度越高,說明在包含X的事務(wù)中Y出現(xiàn)的可能性就越大。最小置信度(Minimum Confidence)記作min_conf。它是由用戶給定的,用于衡量所挖掘得到的規(guī)則的最低可信程度。
在進(jìn)行關(guān)聯(lián)分析生成規(guī)則時(shí),需要預(yù)先設(shè)定最小支持度和最小置信度,關(guān)聯(lián)規(guī)則XY有意義,需同時(shí)滿足最小支持度和最小置信度。設(shè)定的最低支持度越低、最低置信度越低、最大條件數(shù)越高,發(fā)現(xiàn)的規(guī)則就越多;反之,最低支持度越高、最低置信度越高、最大條件數(shù)越低,發(fā)現(xiàn)的的規(guī)則就越少。例如,“如果中毒者在中毒后10~30 min之內(nèi)出現(xiàn)了強(qiáng)直性抽搐和瞳孔擴(kuò)大的癥狀,則引發(fā)中毒的毒物為毒鼠強(qiáng),其置信度為 90%?!盇priori從數(shù)據(jù)中提取一系列規(guī)則,提取的規(guī)則帶有出現(xiàn)頻率最高的信息內(nèi)容。在模型的優(yōu)化過程中,由于各個(gè)毒物出現(xiàn)的次數(shù)或頻次差別比較大,如果只建立一個(gè)模型,則需要設(shè)置較小的最低支持度和最低置信度,才能將出現(xiàn)次數(shù)較少的毒物與其出現(xiàn)癥狀之間的關(guān)聯(lián)規(guī)則挖掘出來,但這種情況會造成挖掘出的規(guī)則數(shù)量過多,導(dǎo)致模型過大,運(yùn)行和加載速度就會很慢。所以,綜合考慮模型的準(zhǔn)確性和運(yùn)行加載的速度,本文選擇依次建立10個(gè)模型(模型參數(shù)見表1),建立一個(gè)關(guān)聯(lián)規(guī)則挖掘系列,既滿足準(zhǔn)確度需求,也提升功能的易用性、友好度。
表1 Apriori模型參數(shù)表Table 1 Parameters of the Apriori model
實(shí)際判定時(shí),每個(gè)模型運(yùn)算提交一個(gè)判定結(jié)果,取置信度最高的前5個(gè)結(jié)果作為最終判定輸出結(jié)果,其中包含正確結(jié)果時(shí)認(rèn)定為判定準(zhǔn)確。在此定義下,用已有的訓(xùn)練集再次作為測試集,對建立的算法模型進(jìn)行測試,結(jié)果中包含正確結(jié)果時(shí)定義為判定準(zhǔn)確。結(jié)果中毒表現(xiàn)部分的判定準(zhǔn)確率為91.55%,尸體檢驗(yàn)部分的判定準(zhǔn)確率為88.24%。在國外的類似研究中,采用神經(jīng)網(wǎng)絡(luò)的算法,利用生前的中毒癥狀、毒物性狀給出毒物判斷的報(bào)道[5-6],并沒有計(jì)算準(zhǔn)確率,也未見采用尸檢檢驗(yàn)特征進(jìn)行中毒判定相關(guān)研究的報(bào)道。
鑒于判定功能以單機(jī)軟件的形式在PC上實(shí)現(xiàn),PC的計(jì)算能力有限,運(yùn)算模型花費(fèi)時(shí)間較久會影響用戶體驗(yàn)。因此,軟件開發(fā)時(shí)將輸入項(xiàng)為3個(gè)特征以內(nèi)的關(guān)聯(lián)規(guī)則用程序固化,輸入特征數(shù)在3以內(nèi)時(shí)直接輸出判定結(jié)果,提高運(yùn)算速率,判定結(jié)果基本達(dá)到“即選即顯示”。
軟件針對公安行業(yè)處置中毒案事件定制了專門的查詢功能,包括毒物數(shù)據(jù)查詢、毒物檢驗(yàn)方法查詢、行業(yè)標(biāo)準(zhǔn)查詢功能(見圖1)。
圖1 毒物查詢Fig.1 Interface for query of toxic substance from database
毒物數(shù)據(jù)查詢以中毒案例庫中的檢出毒物為基礎(chǔ),加以擴(kuò)充后,集成了臨床藥物、毒品、農(nóng)藥、殺鼠劑、金屬毒物、無機(jī)化合物、揮發(fā)性毒物、植物毒素、蘑菇毒素、動物毒素及其它毒物共11個(gè)大類共計(jì)2529種毒物的基礎(chǔ)信息,如名稱、CAS號、理化性質(zhì)、用途等信息;還重點(diǎn)收錄毒物的中毒特征數(shù)據(jù),如毒性、中毒表現(xiàn)、中毒機(jī)理、體內(nèi)代謝、臨床救治、法醫(yī)學(xué)檢驗(yàn)、解剖及病理圖片等內(nèi)容。軟件還集成了文獻(xiàn)報(bào)道的毒物檢驗(yàn)方法,按照方法適用范圍、檢驗(yàn)材料、提取凈化方法、檢測方法、結(jié)果評價(jià),搜錄、整理了1135個(gè)毒物檢驗(yàn)方法,同時(shí)收錄了30個(gè)毒物檢驗(yàn)的行業(yè)標(biāo)準(zhǔn),供毒物檢驗(yàn)技術(shù)人員參考。
本軟件將優(yōu)化建立的中毒判定數(shù)學(xué)模型以單機(jī)軟件的方式運(yùn)行,在中毒處置輔助毒物中毒判定、涉毒相關(guān)信息查詢、檢驗(yàn)方法咨詢方面提供便攜易用的專家級輔助應(yīng)用,為現(xiàn)場調(diào)查、中毒救治、實(shí)驗(yàn)室檢驗(yàn)提供一體化的信息輔助方案,為中毒現(xiàn)場處置人員、實(shí)驗(yàn)室檢驗(yàn)人員提供實(shí)戰(zhàn)技術(shù)支撐。目前軟件研發(fā)的版本為1.0版本,使用權(quán)完全開放,并沒有授權(quán)、銷售及加密等使用限制,可支持Windows操作系統(tǒng)(Windows XP及以上版本),對PC的性能并沒有特殊要求,日常工作的便攜式計(jì)算機(jī)均可以安裝使用。后續(xù)隨著毒物數(shù)據(jù)、方法標(biāo)準(zhǔn)等的不斷完善更新,軟件的應(yīng)用價(jià)值會得到提升,在經(jīng)費(fèi)允許的條件下,也可考慮開發(fā)手機(jī)APP,提升軟件的易用性。
[1] 廖林川,沈敏,張大明,等.法醫(yī)毒物分析信息管理系統(tǒng)的開發(fā)與應(yīng)用[J].法醫(yī)學(xué)雜志,2004,20(2):105-106.
[2] 寧旭,董兆君,牟玲,等.重慶市化學(xué)事故醫(yī)學(xué)應(yīng)急救援指揮系統(tǒng)的研制[J].中國危重病急救醫(yī)學(xué),2006,18(12):755-758.
[3] 贠克明,王玉瑾,劉立新,等.急診中毒快速檢驗(yàn)診斷系統(tǒng)的建立[J].中國藥物與臨床,2006, 6(9):655-662.
[4] 陳航,戴廣宇,沈敏,等.法醫(yī)毒物學(xué)數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)與開發(fā)[J].醫(yī)學(xué)信息學(xué)雜志,2012, 33(11):36-40.
[5] BHAVNANI S K, ABRAHAM A, DEMENIUK C, et al. Network analysis of toxic chemicals and symptoms: implications for designing first-responder systems[J]. AMIAAnnual Symposium proceedings, 2007:51-55.
[6] BHAVNANI S K, GANESAN A, SCOTT C, et al. A novel system for rapidly identifying toxic chemicals[J]. AMIAAnnual Symposium proceedings, 2008:878.
[7] WANG J, ZHANG Y, WANG F L, et al. The application of data mining technology for the judgment of poisoning cases[C]//Ubiquitous Intelligence and Computing and 2015 IEEE, Intl Conf on Autonomic and Trusted Computing and 2015 IEEE,Intl Conf on Scalable Computing and Communications and ITS Associated Workshops. IEEE, 2016.