佳都新太科技股份有限公司 鄧任遠
利用P2P下載工具實現(xiàn)離線下載服務
佳都新太科技股份有限公司 鄧任遠
當用戶使用普通下載工具下載大的資源文件或者冷門資源時,常常要等待一天甚至更長時間才能完成,下載時需要長時間地占用用戶的電腦資源和網(wǎng)絡資源,用戶不能關閉下載工具和個人機器。而離線下載是利用服務器“代”用戶進行下載,待服務端下載完成后,用戶再用下載工具將資源從服務器取到自己本機,具備無需掛機等待、高速的特點。本文所述的是利用成熟的P2P下載工具BitComet、eMule進行二次開發(fā),對用戶提供離線下載服務的方法,該方法同時支持HTTP、BT、ED2K、MAGNET多種下載方式。而且在服務端可以分布運行多個P2P下載工具,以滿足客戶端的大量用戶下載請求,下載任務在各個下載引擎上的分配由服務端統(tǒng)一調(diào)度管理。
離線下載;p2p;BT;ED2K;下載任務管理;下載引擎
在傳統(tǒng)下載方式中,一般是把文件由服務器端傳送到客戶端,例如FTP,HTTP等等。由于是從一臺服務器下載,服務器所提供的帶寬是一定的,因而下載人越多速度越慢。但是這樣就出現(xiàn)了一個問題,隨著用戶的增多,對帶寬的要求也隨之增多,用戶過多就會造成瓶頸,而且搞不好還會把服務器掛掉,所以很多的服務器會都有用戶人數(shù)的限制,這樣即使你使用的是寬帶網(wǎng),通常也很難達到運營商許諾的最高下載速度,這里面固然有網(wǎng)絡的原因,但與服務器的限制也不無關系。
隨著P2P技術(shù)的出現(xiàn),用戶可以充分利用網(wǎng)絡帶寬,人可以直接連接到其他用戶的計算機、交換文件,而不是像過去那樣連接到服務器去瀏覽與下載,改變互聯(lián)網(wǎng)現(xiàn)在的以大網(wǎng)站為中心的狀態(tài)、重返”非中心化”,并把權(quán)力交還給用戶。目前常用的P2P工具有支持BitTorrent協(xié)議的比特彗星BitComet,支持ED2K協(xié)議的電騾eMule。
但用戶使用P2P工具下載電影、游戲大型資源,或者冷門資源時,用戶就得下很久,有時需要花費幾天的時間,期間用戶必須長期掛機以保證下載任務的不中斷,給用戶的設備使用帶來了很多不便和限制。
我們在此依托成熟的工具和技術(shù),實現(xiàn)了一種離線下載的服務方案。將比特彗星BitComet和電騾eMule運行在服務端,用戶通過web頁面向服務端提交下載請求,服務端接受情況后,會根據(jù)下載請求的類型,分布將請求加載到這些P2P工具的中,生成下載任務,由這些工具在服務端利用高速的帶寬進行下載,或者由服務器掛機“代”用戶下載冷門資源。而用戶的設備在成果提交完下載任務請求后,就可斷開網(wǎng)絡或者關機。用戶可以隨時訪問離線下載的服務頁面,查詢自己要求資源的下載進度,當看到下載完成后,就可以一次性地取回下載文件,完成下載過程。
圖1
我們提供的離線下載服務,是幫助用戶提供了一個下載代理,用戶只需提交下載請求,由我們的下載代理保持在線,幫助用戶完成下載任務。而這些代理的實現(xiàn),我們使用的是比特彗星、電騾這樣的成熟穩(wěn)定工具,避免了完全從P2P底層協(xié)議進行開發(fā),同時可以更好地利用網(wǎng)絡中的已有資源點。
離線下載原理如下:
(1)用戶通過Web頁面提交一個下載請求。
圖2
圖3
(2)服務端的下載任務管理器接收到請求后,首先查詢提交的下載鏈接是否被下載過。如果已下載過,直接把已下載的資源文件復制到服務器上用戶的個人儲存空間;如果沒有,就將用戶的下載請求轉(zhuǎn)發(fā)到一個下載引擎模塊。
(3)每個下載引擎模塊管理著一個BitComet和eMule下載工具,下載引擎判斷下載任務類型,如果是BT下載,則通過BitComet的http管理接口,將任務添加到BitComet的下載任務中,并開始下載;如果是ED2K下載,則通過eMule的http管理接口,將任務添加到eMule的下載任務中,并開始下載。
(4)BitComet和eMule下載工具執(zhí)行下載任務,并由下載引擎模塊通過他們的http管理接口查詢下載進度。
(5)下載完成后,用戶在Web頁面上可以查詢到下載進度已為100%,用戶可以通過工具從本人的存儲空間一次性取回自己的文件。
系統(tǒng)采用典型的分層架構(gòu),為了信息隱匿的需要,要求每一層只能調(diào)用其下一層的接口。每層都根據(jù)業(yè)務需求提供最低限度的接口,保證層次之間的依賴僅僅停留在接口級別。系統(tǒng)結(jié)構(gòu)如圖1。
離線下載系統(tǒng)包括:用戶離線下載Portal頁面、下載任務管理模塊、下載引擎模塊、文件管理模塊。
對用戶以WEB頁面的方式提供離線下載功能使用。用戶離線下載Portal頁面通過調(diào)用下載任務管理模塊的下載管理接口提供給用戶添加、刪除、暫停、啟動下載任務及強制重新下載的功能。其中,強制重新下載的使用場景為,有可能系統(tǒng)下載歷史中的某一文件特征碼對應的文件已經(jīng)不合實際,用戶根據(jù)系統(tǒng)下載歷史所獲取的文件并非用戶所需要的文件,則用戶可使用強制重新下載功能,讓系統(tǒng)刪除該文件特征碼對應的下載文件并重新下載。
用戶離線下載Portal網(wǎng)站可通過查詢數(shù)據(jù)庫獲取用戶的已完成下載任務及下載歷史。Protal網(wǎng)站需要分為正在下載任務列表及已完成下載列表兩個界面,正在下載任務列表中的任務清單及狀態(tài)是通過下載任務管理模塊的查詢接口中返回;而已完成下載列表的數(shù)據(jù)則通過查詢數(shù)據(jù)庫表獲取。
下載任務管理模塊通過讀取數(shù)據(jù)庫中的配置信息,以獲取各下載引擎模塊的信息。
下載任務管理模塊以HTTP+JSON方式提供給用戶離線下載Portal頁面調(diào)用,用于提供網(wǎng)站查詢用戶的下載任務列表、添加用戶下載任務、刪除用戶下載任務、暫停用戶下載任務、啟動用戶下載任務、強制重新下載。其中強制重新下載時,系統(tǒng)刪除該文件特征碼對應的下載文件并重新下載。
下載任務管理模塊通過定時調(diào)用各下載引擎的查詢下載任務接口,以獲取最新的下載任務狀態(tài),并更新系統(tǒng)任務列表。對于下載完成的任務,需要將下載文件移動到系統(tǒng)備份空間,并復制到相應用戶的個人存儲空間上。下載完成后,還需要通知下載引擎刪除該完成的任務。
下載引擎模塊代理第三方下載工具(BitComet及eMule)的下載控制操作,屏蔽各種下載工具的差異。根據(jù)配置信息,初始化本機上的第三方下載工具接口。
下載引擎模塊以HTTP+JSON方式提供文件下載接口給下載任務管理模塊調(diào)用,用于提供下載任務管理模塊獲取下載引擎節(jié)點上的下載任務列表、添加下載任務、刪除下載任務、暫停下載任務、啟動下載任務。
下載引擎模塊需要增加消息隊列以保證發(fā)向下載工具的操作是單線程操作,以確保操作順序。
下載引擎模塊對BitComet工具進行遠程暫停、刪除、啟動操作之前,需要先做一次獲取BitComet下載列表的操作,并根據(jù)特征碼找出BitComet的taskid,再進行暫停、刪除、啟動操作。
離線下載的文件往往是較大的文件,如果通過網(wǎng)絡連接來進行頻繁的復制、移動操作將影響網(wǎng)絡帶寬及操作時間過長。
文件管理模塊則在文件服務器上的一個應用模塊,用于接受下載任務管理模塊發(fā)出的下載文件復制、移動、刪除操作,并最終于文件服務器上,通過外調(diào)操作系統(tǒng)命令進行文件的復制、移動及刪除。經(jīng)過測試,直接使用外調(diào)操作系統(tǒng)命令進行大文件的復制速度是最快的,比使用NIO或管道等方式都快。
參考代碼如下:
離線下載系統(tǒng)中添加下載任務和刪除下載任務的活動圖分別如圖2和圖3。
基于該種設計方案的離線下載系統(tǒng),已經(jīng)在北京聯(lián)通寬帶業(yè)務中心上線試運行。該系統(tǒng)充分利用了北京聯(lián)通寬帶業(yè)務中心的網(wǎng)絡帶寬優(yōu)勢,通過在多臺服務上部署多個下載引擎,每個引擎各管理一套BitComet和eMule的方法,以滿足公網(wǎng)上大用戶量的下載任務請求。實用中表明,對于一些冷門資源,文件大小雖然只有600M,但完成下載所需的時間卻是57小時34分鐘,下載完成后取回到用戶本地只需要10多分鐘。通過離線下載系統(tǒng)大大提高了用戶的下載效率。
本文所設計的離線下載方案,避免了完全從P2P底層協(xié)議開發(fā)或者掌握龐大的P2P開源代碼工程,利用成熟的P2P下載工具,通過分析這些工具的外部管理接口,而達到向工具中加載下載任務,啟動、暫停等控制下載任務,提供一種快速實現(xiàn)的離線下載服務。并且依靠成熟工具的穩(wěn)定性來保障了服務的穩(wěn)定性。通過離線下載服務,提高了用戶下載的效率,釋放了本地設備的使用,充分利用了服務端的帶寬資源和設備資源。隨著系統(tǒng)商業(yè)度的提供,將會為服務提供商帶來良好的經(jīng)濟效益。
[1]茹林.P2P網(wǎng)絡中多線程下載的研究[Z].大連海事大學,2009.
[2]林泓,何巍.利用JXTA平臺實現(xiàn)P2P服務的研究[J].武漢理工大學學報(信息與管理工程版),2005(02).