湯艷君 安俊霖
(中國(guó)刑事警察學(xué)院網(wǎng)絡(luò)犯罪偵查系 遼寧 沈陽(yáng) 110035)
隨著網(wǎng)絡(luò)的普及,用戶不僅開始重視對(duì)網(wǎng)絡(luò)信息內(nèi)容的隱匿保護(hù),也開始重視對(duì)網(wǎng)絡(luò)通信雙方的身份和通信模式的隱匿保護(hù)。匿名網(wǎng)絡(luò)使得用戶在互聯(lián)網(wǎng)中個(gè)人信息不會(huì)被泄露。匿名網(wǎng)絡(luò)是隱匿了上網(wǎng)者的IP報(bào)文信息,以實(shí)現(xiàn)保護(hù)上網(wǎng)者的個(gè)人信息和防止被惡意追蹤。
用戶尋找互聯(lián)網(wǎng)上的信息通常會(huì)使用必應(yīng)或百度等搜索引擎,而這類信息稱為表面信息(Surface Web),即能被常規(guī)搜索引擎爬取的信息。與之相對(duì)的即暗網(wǎng)(Dark Web),暗網(wǎng)就是人們無(wú)法使用常規(guī)搜索引擎找到的虛擬空間[1]。與互聯(lián)網(wǎng)相比,暗網(wǎng)不僅網(wǎng)址數(shù)量多,而且使用簡(jiǎn)單,僅需洋蔥路由器和VPN便可進(jìn)入其中,更重要的是不會(huì)留有任何訪問(wèn)記錄。
當(dāng)前針對(duì)暗網(wǎng)監(jiān)管的研究較少,主要集中在“去匿名技術(shù)”、網(wǎng)絡(luò)流量分析技術(shù)、深度挖掘等方面。而針對(duì)暗網(wǎng)網(wǎng)絡(luò)的研究主要為Tor、I2P、HORNET。雖然對(duì)于Tor網(wǎng)絡(luò)內(nèi)容不能直接進(jìn)行解密,但能利用網(wǎng)絡(luò)流量分析技術(shù)來(lái)追蹤到用戶的位置。其中網(wǎng)絡(luò)流量分析技術(shù)包括:
(1)網(wǎng)絡(luò)數(shù)據(jù)采集:通過(guò)架設(shè)國(guó)外服務(wù)器并掌握大量的Tor節(jié)點(diǎn)來(lái)實(shí)現(xiàn),對(duì)一些敏感信息進(jìn)行跟蹤和截獲。
(2)匿名網(wǎng)絡(luò)行為分析:通過(guò)識(shí)別用戶是否在使用Tor瀏覽器來(lái)進(jìn)行。
現(xiàn)有的相關(guān)法律法規(guī)和管理政策對(duì)暗網(wǎng)進(jìn)行監(jiān)管存在很大局限性。其中《中華人民共和國(guó)網(wǎng)絡(luò)安全法》第24條規(guī)定:“網(wǎng)絡(luò)運(yùn)營(yíng)者為用戶辦理網(wǎng)絡(luò)接入、域名注冊(cè)服務(wù),辦理固定電話、移動(dòng)電話等入網(wǎng)手續(xù),或者為用戶提供信息發(fā)布、即使通信等服務(wù),在于用戶簽訂協(xié)議或者確認(rèn)提供服務(wù)時(shí),應(yīng)當(dāng)要求用戶提供真實(shí)身份信息。用戶不提供真實(shí)身份信息的,網(wǎng)絡(luò)運(yùn)營(yíng)者不得為其提供相關(guān)服務(wù)”[2]。雖然網(wǎng)絡(luò)安全法規(guī)定了入網(wǎng)、域名注冊(cè)等需要進(jìn)行實(shí)名制,但暗網(wǎng)網(wǎng)絡(luò)還是能隱藏用戶的身份,許多不法分子依然可以通過(guò)暗網(wǎng)進(jìn)行非法交易。
因此,提出利用Python的Selenium瀏覽器自動(dòng)化測(cè)試框架進(jìn)入Tor網(wǎng)絡(luò),爬取暗網(wǎng)數(shù)據(jù),實(shí)現(xiàn)對(duì)暗網(wǎng)的取證,為打擊暗網(wǎng)犯罪的公安工作提供一定的借鑒意義。
與普通的案件不同,暗網(wǎng)是基于計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)發(fā)展起來(lái)的,其犯罪證據(jù)必然具備網(wǎng)絡(luò)、計(jì)算機(jī)、通信等方面的獨(dú)有特征[3]。而暗網(wǎng)案件取證需要在互聯(lián)網(wǎng)取證的方法框架內(nèi)進(jìn)行,具體取證思路如下:
(1)獲取信息:首先了解清楚取證任務(wù)的背景、需求、目的、網(wǎng)絡(luò)設(shè)備和環(huán)境。主要包括案件發(fā)生的日期、事件、網(wǎng)絡(luò)拓?fù)?、通信系統(tǒng)、涉案的系統(tǒng)和數(shù)據(jù)、涉案的人員及案件發(fā)生后的操作和處置流程等。
(2)制定方案:在開展取證工作前,需要針對(duì)取證工作進(jìn)行評(píng)估并且制定有效的方案。制定取證方案主要包括確定參加取證的人員、取證的目的、時(shí)間要求、設(shè)備、列出初步的分析和取證計(jì)劃和預(yù)設(shè)可能會(huì)遇到狀況及對(duì)應(yīng)的響應(yīng)辦法等。
(3)收集證據(jù):首先記錄收集的證據(jù)源的時(shí)間、來(lái)源、收集方式、證據(jù)源的軟硬件信息等,然后使用工具或設(shè)備收集證據(jù),最后將收集的證據(jù)進(jìn)行有效的保存和哈希值計(jì)算,并明確證據(jù)的監(jiān)管保護(hù)措施。
(4)數(shù)據(jù)分析:網(wǎng)絡(luò)取證的最大特點(diǎn)就是會(huì)涉及到多個(gè)證據(jù)源,其中許多帶有時(shí)間戳,可以使用一些方法和工具進(jìn)行證據(jù)數(shù)據(jù)的關(guān)聯(lián)。在理清眾多證據(jù)源時(shí),需要建立一條有效的時(shí)間線,并且從取證的需求或目標(biāo)入手。
(5)出具報(bào)告或者筆錄:取證過(guò)程和結(jié)果通過(guò)勘驗(yàn)筆錄、證據(jù)檢查筆錄或者檢驗(yàn)報(bào)告的方式呈現(xiàn),要保持科學(xué)的嚴(yán)謹(jǐn)性和完整性。突出重點(diǎn)和在較高的層次上進(jìn)行闡述是關(guān)鍵環(huán)節(jié),還需要有易于為之辯護(hù)的細(xì)節(jié)作為支撐。
匿名通信系統(tǒng)Tor(The Second Generation Onion Router),即第二代洋蔥路由系統(tǒng),由一組洋蔥路由器組成(也稱之為Tor節(jié)點(diǎn))。它不僅能夠提供客戶端匿名通信,還可以幫助用戶匿名上網(wǎng)和保護(hù)用戶隱私[4]。
Tor的工作原理,即用戶首先運(yùn)行Tor Server,所使用的電腦就相當(dāng)于一個(gè)Tor節(jié)點(diǎn),經(jīng)由這個(gè)節(jié)點(diǎn)第三方能夠訪問(wèn)其他節(jié)點(diǎn),用戶也能夠通過(guò)第三方的節(jié)點(diǎn)對(duì)其他節(jié)點(diǎn)進(jìn)行訪問(wèn)。數(shù)據(jù)經(jīng)過(guò)所選路徑,最終到達(dá)Tor節(jié)點(diǎn)來(lái)訪問(wèn)目標(biāo)資源。Tor選擇的路徑是隨機(jī)的,隨機(jī)選取路由來(lái)傳輸數(shù)據(jù)就會(huì)無(wú)法實(shí)現(xiàn)數(shù)據(jù)追蹤。
在針對(duì)樹形網(wǎng)站爬取數(shù)據(jù)的過(guò)程中,可能會(huì)遇到環(huán)路鏈接問(wèn)題,比如從首頁(yè)到下面節(jié)點(diǎn),但是下面的鏈接節(jié)點(diǎn)又會(huì)鏈接指向首頁(yè),所以需要對(duì)鏈接進(jìn)行去重。在設(shè)計(jì)暗網(wǎng)數(shù)據(jù)爬蟲中選擇深度優(yōu)先算法[5],其原理是將輸入的主網(wǎng)站的域名作為入口,然后判斷是否為同一站點(diǎn)鏈接,防止爬出站外而導(dǎo)致無(wú)限嘗試爬取,接著去爬取匹配的所有子域名(例如:子域名_1、子域_2……),再將爬取的子域名_1作為新的入口,繼續(xù)爬取子域名_1所匹配的所有子域名,直到抓到盡頭,如圖1所示。
圖1 深度優(yōu)先策略
相關(guān)代碼如下:
defTargetUrl(self,url):
target_url = []
fort in self.processUrl(url):
ifre.findall(domain_url,t):
target_url.append(t)
fort in target_url:
print(‘ 同一站點(diǎn)的鏈接為: ’+ t)
self.save(t)
returntarget_url
在分析Tor工作原理和深度優(yōu)先算法的基礎(chǔ)上,提出一種爬取暗網(wǎng)數(shù)據(jù)的方法:利用基于Python的Selenium瀏覽器自動(dòng)化測(cè)試框架來(lái)實(shí)現(xiàn)[6]。當(dāng)用戶操作時(shí),不需要用戶關(guān)注底層的網(wǎng)絡(luò)通信協(xié)議,只需要一個(gè)程序來(lái)控制操作過(guò)程。設(shè)計(jì)的爬蟲的取證工作流程如圖2所示。
圖2 暗網(wǎng)爬蟲工作流程圖
本實(shí)驗(yàn)的暗網(wǎng)數(shù)據(jù)爬蟲的取證結(jié)果,即某暗網(wǎng)真實(shí)網(wǎng)頁(yè)和某暗網(wǎng)下載到本地后還原的網(wǎng)頁(yè)分別展示如圖3和圖4(其中真實(shí)網(wǎng)頁(yè)的地址為:http://****.onion/;還原網(wǎng)頁(yè)的地址為: file:///C:/passport/Onion%20 Identity%20...)。
圖3 某暗網(wǎng)真實(shí)網(wǎng)頁(yè)
圖4 某暗網(wǎng)的還原網(wǎng)頁(yè)
實(shí)驗(yàn)表明,可以實(shí)現(xiàn)對(duì)暗網(wǎng)網(wǎng)頁(yè)內(nèi)容的客觀、有效地爬取,能夠完全地還原暗網(wǎng)真實(shí)網(wǎng)頁(yè)內(nèi)容,將數(shù)據(jù)保存至本地進(jìn)行分析和固定。
2018年5月,某市公安局刑警支隊(duì)根據(jù)專案組提供的線索,將涉嫌非法購(gòu)買槍支和彈藥的犯罪嫌疑人李某被捕。經(jīng)過(guò)審查,該男子供認(rèn)在暗網(wǎng)上購(gòu)買槍支和彈藥,并繳獲李某的計(jì)算機(jī)主機(jī)一臺(tái)。根據(jù)市局要求,需要檢驗(yàn)李某在暗網(wǎng)網(wǎng)站與涉槍案件有關(guān)的資料信息,并查看涉案的即時(shí)消息聊天記錄。
3.2.1 常規(guī)性取證
常規(guī)性取證包括系統(tǒng)信息提取、用戶痕跡調(diào)查、即使通信、郵件客戶端解析、Web郵件解析、文本分析、反取證軟件檢測(cè)等[7]。
(1)提取當(dāng)前存儲(chǔ)介質(zhì)上的操作系統(tǒng)信息、本地用戶信息、網(wǎng)絡(luò)配置、安裝軟件信息及硬件等信息。這部分分析結(jié)果讓取證人員對(duì)存儲(chǔ)介質(zhì)上安裝的操作系統(tǒng)環(huán)境有個(gè)整體上的認(rèn)識(shí),方便進(jìn)一步的調(diào)查取證。
(2)查找歷史上網(wǎng)痕跡記錄,主要對(duì)計(jì)算機(jī)中的瀏覽器地址欄、瀏覽器收藏夾、瀏覽器歷史記錄、瀏覽器臨時(shí)文件和Cookies記錄進(jìn)行查看。瀏覽器的收藏夾可以反映出用戶對(duì)哪些網(wǎng)站感興趣,對(duì)案件調(diào)查起到輔助分析的作用。Cookies記錄用戶所訪問(wèn)過(guò)的站點(diǎn)和訪問(wèn)的頻率,以及最近訪問(wèn)的時(shí)間信息等。根據(jù)案情,李某必然會(huì)搜索相關(guān)暗網(wǎng)方面的內(nèi)容,比如如何進(jìn)入暗網(wǎng)、如何購(gòu)買比特幣等。
(3)搜索存儲(chǔ)介質(zhì)中的與案件相關(guān)文件,如.xls、.jpg、郵件等文件及聊天記錄內(nèi)容。在暗網(wǎng)購(gòu)買槍支彈藥過(guò)程中,買賣雙方必然會(huì)使用聊天工具,調(diào)查李某使用聊天工具的聊天記錄,可獲得涉案槍支的型號(hào)、價(jià)格、工藝情況等信息。
3.2.2 遠(yuǎn)程勘驗(yàn)取證
本案的重點(diǎn)是查找和恢復(fù)涉及槍支相關(guān)網(wǎng)頁(yè)并進(jìn)行分析、整理,導(dǎo)出證明案件事實(shí)的網(wǎng)頁(yè)文件。具體取證步驟如下:
(1)配置網(wǎng)絡(luò)環(huán)境。設(shè)置國(guó)外代理,配置洋蔥路由。
(2)檢測(cè)暗網(wǎng)服務(wù)器。為了驗(yàn)證上一步的網(wǎng)絡(luò)環(huán)境配置和確認(rèn)服務(wù)器站點(diǎn)的地址正確與否,需要暗網(wǎng)服務(wù)器進(jìn)行鏈接確認(rèn),保障后續(xù)的數(shù)據(jù)收集工作能夠順利進(jìn)行。
(3)爬取網(wǎng)絡(luò)數(shù)據(jù)。由于各個(gè)站點(diǎn)的數(shù)據(jù)內(nèi)容和格式不完全相同,需針對(duì)特定的站點(diǎn)制定單獨(dú)的數(shù)據(jù)爬取規(guī)則和方法,并且其中涉及到的其他站點(diǎn)的數(shù)據(jù)也需要依次爬取和收集,并做好對(duì)應(yīng)的操作記錄。首先打開暗網(wǎng)爬蟲程序,輸入犯罪嫌疑人李某供述的暗網(wǎng)網(wǎng)址,如圖5所示,暗網(wǎng)網(wǎng)頁(yè)真實(shí)頁(yè)面與還原頁(yè)面分別展示如圖6和圖7(其中暗網(wǎng)真實(shí)網(wǎng)頁(yè)的地址為:http://****.onion;暗網(wǎng)還原頁(yè)面的地址為:file:///C:/UK%20guns/UK%20 Guns%20...)。
圖5 輸入暗網(wǎng)域名地址
圖6 暗網(wǎng)真實(shí)網(wǎng)頁(yè)
圖7 暗網(wǎng)還原網(wǎng)頁(yè)
(4)數(shù)據(jù)分析。對(duì)爬取和收集的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析、清洗、篩選,參照取證任務(wù)的目標(biāo)(即李某購(gòu)買槍支彈藥交流信息內(nèi)容、買賣賬目信息、轉(zhuǎn)賬記錄、交易賬號(hào)等)進(jìn)行數(shù)據(jù)分析研究,對(duì)數(shù)據(jù)進(jìn)行歸類分析和處理。
(5)制作遠(yuǎn)程勘驗(yàn)檢查筆錄。根據(jù)《關(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問(wèn)題的規(guī)定》要求將取證過(guò)程和結(jié)果通過(guò)遠(yuǎn)程勘驗(yàn)檢查筆錄的方式呈現(xiàn)。提取的電子數(shù)據(jù)應(yīng)突出李某購(gòu)買槍支彈藥交流信息內(nèi)容、買賣賬目信息、轉(zhuǎn)賬記錄、交易賬號(hào)等內(nèi)容。
通過(guò)對(duì)暗網(wǎng)爬蟲取證技術(shù)的研究,實(shí)現(xiàn)了高效爬取暗網(wǎng)目標(biāo)數(shù)據(jù)并進(jìn)行固定,為打擊暗網(wǎng)犯罪的公安工作提供一定的借鑒。從應(yīng)用方面來(lái)講,因?yàn)榘稻W(wǎng)可能隨時(shí)更改域名和地址,暗網(wǎng)所提供的市場(chǎng)和服務(wù)也可能隨時(shí)會(huì)轉(zhuǎn)移或關(guān)閉,所以可使用暗網(wǎng)爬蟲工具對(duì)目標(biāo)網(wǎng)站進(jìn)行取證固定,然后進(jìn)一步對(duì)暗網(wǎng)的數(shù)據(jù)進(jìn)行還原、挖掘及分析,提高獲取數(shù)據(jù)的證據(jù)價(jià)值和效率,為打擊犯罪提供有力支持。