曾良偉 張宇 朱金玉
摘 要:IP地址地理定位是網(wǎng)絡(luò)拓?fù)錅y(cè)繪的基礎(chǔ),然而如何準(zhǔn)確定位IP地址是一個(gè)難題。為了提高IP地址定位的準(zhǔn)確性,本文提出了3種優(yōu)化IP地理定位準(zhǔn)確性的方法。首先綜合各個(gè)IP地理定位數(shù)據(jù)庫(kù)的優(yōu)點(diǎn),合并新的地理定位數(shù)據(jù)庫(kù),新集成數(shù)據(jù)庫(kù)定位一致率較其他數(shù)據(jù)庫(kù)提高了2%。然后獲取互聯(lián)網(wǎng)路由器接口信息并對(duì)路由器定位,定位后的路由器可以作為地標(biāo)點(diǎn)定位接口IP地址以及相鄰IP地址。最后搜集路徑信息,從路徑中推斷出地區(qū)的邊界網(wǎng)關(guān)IP地址,得到的網(wǎng)關(guān)IP地址列表能夠?qū)Φ貐^(qū)內(nèi)部的IP地址定位提供幫助。
關(guān)鍵詞: 網(wǎng)絡(luò)拓?fù)錅y(cè)繪;IP地理定位;路由器定位;地區(qū)網(wǎng)關(guān)
【Abstract】 IP address geolocation is the basis of network topology mapping, but how to accurately locate an IP address is a problem. In order to improve the accuracy of IP address location, this paper proposes three methods to optimize the accuracy of IP geolocation. First, the paper integrates advantages of each IP geolocation database to merge the newly geolocation database. The newly integrated database geolocation accuracy is 2% higher than other databases. Then the paper collects the Internet router interface information and locates the router. The located router can be used as a landmark point to locate the interface IP address and the adjacent IP address. Finally, the paper collects the path information, infer the regional border gateway IP address from the path. The list of gateway IP addresses can help locate the IP address within the region.
【Key words】 ?network topology mapping; IP geolocation; router geolocation; region gateway
0 引 言
如何將網(wǎng)絡(luò)空間與地理信息相互映射,將虛擬、動(dòng)態(tài)的網(wǎng)絡(luò)空間測(cè)繪成可靠、有效的網(wǎng)絡(luò)空間地圖,是一項(xiàng)非常重要的工作[1]。IP地理定位技術(shù)分為2類(lèi)。通過(guò)ISP、查詢(xún)whois信息等基于服務(wù)商填寫(xiě)的方法獲取IP地址對(duì)應(yīng)地理信息[2],或者利用測(cè)量延遲或網(wǎng)絡(luò)拓?fù)鋵?duì)IP地址進(jìn)行定位[3]。本文從3個(gè)角度對(duì)IP定位準(zhǔn)確性進(jìn)行優(yōu)化。首先是合并各個(gè)公司的IP定位數(shù)據(jù)庫(kù),IP定位數(shù)據(jù)庫(kù)包含了IP地址段對(duì)應(yīng)的地理信息以及額外信息,提供接口供用戶(hù)查詢(xún)IP地址定位信息?,F(xiàn)在流行的數(shù)據(jù)庫(kù)不僅難于被校正,而且由于缺少建立這些數(shù)據(jù)庫(kù)的方法的相關(guān)信息,其準(zhǔn)確度也仍有待商榷;然后是定位路由器,網(wǎng)絡(luò)空間中有許多路由器節(jié)點(diǎn),而且都是信息傳輸?shù)闹修D(zhuǎn)站。若能準(zhǔn)確定位路由器地理信息,對(duì)路由器相連的終端節(jié)點(diǎn)進(jìn)行定位將變得非常簡(jiǎn)單;最后是識(shí)別地區(qū)的網(wǎng)關(guān)IP地址列表,這些網(wǎng)關(guān)IP地址可以作為地理定位中的地標(biāo)點(diǎn)指導(dǎo)該地區(qū)的地理定位,地區(qū)外的監(jiān)測(cè)點(diǎn)測(cè)量地區(qū)內(nèi)目的IP地址時(shí),路徑中一定經(jīng)過(guò)該地區(qū)的網(wǎng)關(guān)IP地址且經(jīng)過(guò)網(wǎng)關(guān)IP地址后的路徑IP地址均屬于該地區(qū)。本文主要貢獻(xiàn)如下:
(1) 將多個(gè)流行的地理定位數(shù)據(jù)庫(kù)合并為一個(gè)更為準(zhǔn)確的定位數(shù)據(jù)庫(kù)。
(2) 提出3種路由器定位方法。
(3)提取Traceroute數(shù)據(jù)中的網(wǎng)關(guān)IP地址信息。
1 相關(guān)工作
1.1 IP地理定位
GeoTrack[4]通過(guò)挖掘主機(jī)名字中可能包含的不同粒度的地理位置信息推測(cè)主機(jī)的位置。DRoP算法[5]提取和解碼路由器接口的主機(jī)名中包含的地理信息字符串來(lái)給出定位。NetGeo算法[6]通過(guò)直接查詢(xún)Whois數(shù)據(jù)庫(kù)來(lái)推測(cè)主機(jī)位置信息。MaxMind、IP2Location、埃文、IPMarker、IPIP.NET等基于數(shù)據(jù)庫(kù)的商業(yè)定位系統(tǒng)綜合各種方法來(lái)收集、獲取位置信息,定位精確度可為國(guó)家、城市、甚至于郵編級(jí)。
1.2 路由器定位
CAIDA維護(hù)宏觀(guān)互聯(lián)網(wǎng)拓?fù)鋽?shù)據(jù)工具包(ITDK),ITDK包含大面積測(cè)量全球互聯(lián)網(wǎng)得到的鏈接和路由數(shù)據(jù)。對(duì)于在路由器級(jí)別研究Internet的拓?fù)浣Y(jié)構(gòu)以及其他用途非常有用。測(cè)量數(shù)據(jù)利用MIDAR和iffinder工具合并路由器信息,本文使用路由器接口信息和路由器鏈接信息來(lái)對(duì)路由器進(jìn)行定位[7]。
1.3 邊界推測(cè)
CFS算法[8]通過(guò)多個(gè)約束源縮小一個(gè)給定的對(duì)等鏈接可能的位置范圍,從而推斷對(duì)等互連所在的地理位置及互連關(guān)系類(lèi)型。MAP-IT方法[9]根據(jù)多條的traceroute路徑中提取IP地址的接口鄰居集,提出啟發(fā)式推斷方法來(lái)識(shí)別域間連接的接口和所屬AS。Bdrmap[10]方法利用有針對(duì)性的traceroute、traceroute特性知識(shí)和結(jié)構(gòu)化啟發(fā)式方法集中拓?fù)浼s束,從而正確地識(shí)別邊界路由器的域間鏈接。
圖4中,每個(gè)點(diǎn)代表一個(gè)IP地址,利用數(shù)據(jù)庫(kù)定位的相同地點(diǎn)用相同顏色做出表示。作為網(wǎng)關(guān)IP地址,則應(yīng)為地理位置的分界線(xiàn),那么在網(wǎng)關(guān)左側(cè)的非綠色圓圈其定位結(jié)果錯(cuò)誤,網(wǎng)關(guān)右側(cè)的綠色圓圈定位結(jié)果錯(cuò)誤。由此得到的網(wǎng)關(guān)IP地址,在一定程度上可以指導(dǎo)地理定位。
4 結(jié)束語(yǔ)
本文融合各個(gè)地理定位數(shù)據(jù)庫(kù)數(shù)據(jù),增加了IP地址定位的2%的一致率。提出了3種路由器定位方法,對(duì)Caida ITDK中的路由器進(jìn)行定位,并且驗(yàn)證了定位結(jié)果的準(zhǔn)確率。從公開(kāi)的Traceroute數(shù)據(jù)中提取目標(biāo)地區(qū)的網(wǎng)關(guān)IP地址列表,使用Ping測(cè)量、人工檢驗(yàn)以及運(yùn)營(yíng)商檢驗(yàn)的方式對(duì)得到的列表進(jìn)行驗(yàn)證。在未來(lái),則會(huì)利用路由器定位結(jié)果對(duì)附近的終端IP地址進(jìn)行定位,以及通過(guò)得到的地區(qū)網(wǎng)關(guān)IP地址對(duì)地區(qū)內(nèi)部IP地址定位。
參考文獻(xiàn)
[1]埃文.網(wǎng)絡(luò)空間地區(qū)測(cè)繪的意義[EB/OL]. [2018-01-12]. https://blog.csdn.net/aiwenipgeolocation/article/details/79040485.
[2]BENDALE J, RATANARAJ K J. Review of different IP Geolocation methods and concepts[J]. International Journal of Computer Science & Information Technology, 2014,5(1):436.
[3]IETF Geopriv Workgroup.Geopriv status pages[EB/OL].[2012-10-24]. http://tools.ietf.org/wg/geopriv/.
[4]PADMANABHAN V N, SUBRAMANIAN L. An investigation of geographic mapping techniques for internet hosts[C]//roceedings of the ACM SIGCOMM Computer Communication Review. New York, USA: ACM, 2001: 173-185.
[5]HUFFAKER B, FOMENKOV M, CLAFFY K. DRoP: DNS-based router positioning[J]. ACM SIGCOMM CCR, 2014, 44(3): 5-13.
[6]MOORE D, PERIAKARUPPAN R, DONOHOE J, et al. Where in the world is netgeo.caida.org?[C]// Internet Society Conference. Yokohama, Japan: CAIDA, 2000.
[7]CAIDA, Macroscopic Internet Topology Data Kit (ITDK)[EB/OL].[2019-05-03]. http://www.caida.org/data/internet-topology-data-kit/.
[8]GIOTSAS V, SMARAGDAKIS G, HUFFAKER B, et al. Mapping peering interconnections to a facility[C]// ACM SIGCOMM Conference on emerging Networking EXperiments and Technologies (CoNEXT). Heidelberg, Germany: ACM, 2015:1-13.
[9]MARDER A, SMITH J M. MAP-IT: Multipass accurate passive inferences from traceroute[C]// ACM on Internet Measurement Conference. Santa Monica, CA, USA:ACM, 2016:397-411.
[10]LUCKIE M, DHAMDHERE A, HUFFAKER B, et al. bdrmap: Inference of borders between IP networks[C]// Proceedings of the 2016 Internet Measurement Conference. Santa Monica, California, USA:ACM, 2016:381-396.
[11]百度. 百度翻譯開(kāi)放平臺(tái)[EB/OL].[2019]. http://api.fanyi.baidu.com/api/trans/product/index.