鄭海山
(廈門大學(xué) 信息與網(wǎng)絡(luò)中心,福建 廈門361005)
高校內(nèi)部的網(wǎng)站主要分為以下幾個類型:高校門戶、各部處網(wǎng)站、研究所和科研機(jī)構(gòu)網(wǎng)站、會議網(wǎng)站、校內(nèi)信息化應(yīng)用、教師個人主頁、學(xué)生社團(tuán)網(wǎng)站、圖書館資源等。在廈門大學(xué),目前校內(nèi)共有超過700個網(wǎng)站。除了以上幾種類型外,高校相關(guān)的網(wǎng)站還包括高校教師在互聯(lián)網(wǎng)上的微博、博客、其他專業(yè)網(wǎng)站的頁面。師生員工和校外人員發(fā)現(xiàn)這些網(wǎng)站還主要以高校門戶、信息化門戶、搜索為主。[1]
高校門戶網(wǎng)站以學(xué)校簡介、師資力量、招生、新聞等內(nèi)容為主,門戶除了新聞外其他內(nèi)容的更新頻率較低。[2]信息化門戶以聚合校內(nèi)信息化應(yīng)用為主。[3]而這2個門戶都無法囊括高校校內(nèi)外的所有相關(guān)網(wǎng)址。大部分研究所和會議站點(diǎn)一經(jīng)建立無人訪問,為了增加網(wǎng)站的曝光度,還應(yīng)引入以上兩個門戶之外的第3種網(wǎng)址導(dǎo)航站作為一個有力的補(bǔ)充。
網(wǎng)址導(dǎo)航站除作為收集所有高校校內(nèi)外相關(guān)網(wǎng)址的功能外,他還可滿足以下兩種訪問需求:(1)作為高校校內(nèi)用戶的上網(wǎng)門戶,校內(nèi)用戶可將其設(shè)置為瀏覽器主頁,從網(wǎng)址導(dǎo)航站一鍵即可進(jìn)入信息化應(yīng)用和圖書館、學(xué)生處、人事處等網(wǎng)站。(2)滿足用戶無目的瀏覽需求。用戶可通過網(wǎng)址導(dǎo)航站了解高校的整體信息化建設(shè)水平、某個學(xué)科相關(guān)的所有網(wǎng)站、高校的科研成果、學(xué)生社團(tuán)等類別的信息。
所以高校校內(nèi)網(wǎng)址導(dǎo)航站起到對外負(fù)責(zé)展示高??蒲袑?shí)力,對內(nèi)方便師生員工發(fā)現(xiàn)網(wǎng)站的作用。建立高校校內(nèi)網(wǎng)址導(dǎo)航站是高校網(wǎng)站信息化建設(shè)必不可少的一個環(huán)節(jié),其重要性程度與高校門戶和信息化門戶一樣。
筆者對國內(nèi)前幾大高校的導(dǎo)航網(wǎng)站進(jìn)行了分析,分析對象以在Google搜索內(nèi)能搜索到的為準(zhǔn)。以在2014年2月份,使用同一瀏覽器、同樣設(shè)置、首次頁面訪問禁止緩存、二次訪問為有瀏覽器緩存的導(dǎo)航網(wǎng)站。測試結(jié)果如表1所示。
同時(shí)分析得出,清華大學(xué)導(dǎo)航網(wǎng)和中國科學(xué)技術(shù)大學(xué)網(wǎng)址導(dǎo)航頁面較為完整,但是里面還包含著大量的其他校外站點(diǎn)。其中浙江大學(xué)導(dǎo)航做了網(wǎng)址搜索拼音功能,但是使用時(shí)提示錯誤而無法正常使用。所有的站點(diǎn)手機(jī)下訪問效果均較差,沒有對手機(jī)做優(yōu)化。
經(jīng)過分析比較,筆者歸納出高校校內(nèi)網(wǎng)址導(dǎo)航站應(yīng)具有以下特征:
(1)高校校內(nèi)網(wǎng)址導(dǎo)航站應(yīng)具有權(quán)威性,收錄網(wǎng)址全面,以體現(xiàn)大學(xué)文化、突顯學(xué)子樂觀,積極向上的精神和展示科研氛圍為主。導(dǎo)航站應(yīng)有專人負(fù)責(zé)審核維護(hù),導(dǎo)航站內(nèi)網(wǎng)址必須是可對外公開的網(wǎng)站。私人工作室和待發(fā)布站點(diǎn)應(yīng)剔除。
(2)導(dǎo)航站應(yīng)以校內(nèi)網(wǎng)址為主,商業(yè)網(wǎng)址的維護(hù)成本較高,若要提供應(yīng)鏈接到互聯(lián)網(wǎng)上專業(yè)的導(dǎo)航網(wǎng)址hao123、百度導(dǎo)航等。
(3)導(dǎo)航站應(yīng)提供讓用戶提交網(wǎng)址功能,應(yīng)提供讓用戶可自定義網(wǎng)址功能。
(4)導(dǎo)航站作為高校師生和校外人士訪問的門戶,應(yīng)對訪問速度做優(yōu)化。導(dǎo)航站設(shè)置為瀏覽器首頁后不應(yīng)影響到用戶瀏覽器速度。搜索,農(nóng)歷等在不影響速度的情況下可酌情添加。
(5)導(dǎo)航站應(yīng)對移動終端訪問優(yōu)化,可采取響應(yīng)式布局優(yōu)化。[4]
(6)導(dǎo)航站為了統(tǒng)計(jì)訪問頻率高低應(yīng)對用戶訪問網(wǎng)址行為進(jìn)行記錄。
(7)導(dǎo)航站應(yīng)提供多種網(wǎng)址被發(fā)現(xiàn)渠道,包括分類、搜索、全部展示等方法。
表1 部分高校網(wǎng)址導(dǎo)航站分析
廈門大學(xué)校內(nèi)網(wǎng)址導(dǎo)航站操作系統(tǒng)為Ubuntu,Web服務(wù)器為Apache2,數(shù)據(jù)庫使用輕量級的SQLite數(shù)據(jù)庫,腳本使用Python語言開發(fā),網(wǎng)頁后臺語言為PHP。網(wǎng)址的預(yù)覽圖使用c#開發(fā)。網(wǎng)站前端JavaScript框架使用JQuery,CSS框架使用Bootstrap。系統(tǒng)框架如圖1所示。
圖1 系統(tǒng)框架
導(dǎo)航站的網(wǎng)址收錄應(yīng)當(dāng)全面,在高校這方面有著天然的優(yōu)勢。在廈門大學(xué),筆者使用以下幾個方法收集網(wǎng)址:
(1)備案登記系統(tǒng)
根據(jù)中華人民共和國國務(wù)院令第292號《互聯(lián)網(wǎng)信息服務(wù)管理辦法》和中華人民共和國信息產(chǎn)業(yè)部令第33號《非經(jīng)營性互聯(lián)網(wǎng)信息服務(wù)備案管理辦法》,高校都已經(jīng)建立了自己的備案系統(tǒng),通過檢索備案系統(tǒng)的數(shù)據(jù),可以獲得大部分網(wǎng)站的名稱和網(wǎng)址。
(2)DSN記錄
高校有以大學(xué)縮寫命名的.edu.cn后綴的域名服務(wù)器,通過檢索DNS記錄,再根據(jù)DNS記錄模擬訪問網(wǎng)頁端口也可獲得在用網(wǎng)址和其名稱(名稱以網(wǎng)站首頁標(biāo)題為參考)。
(3)端口掃描
在以上2種方法外,還有些服務(wù)器沒有DNS記錄,尚未履行備案流程,這些可以通過掃描本高校內(nèi)部的IP段,查找所有80、8080端口上的Web應(yīng)用,使用Python客戶端模擬訪問獲得在用的網(wǎng)址和其名稱。
(4)用戶登記
有些教師的微博、博客、其他網(wǎng)站等不在校內(nèi)登記,有些會議站點(diǎn)使用校外的建站平臺,這些站點(diǎn)應(yīng)當(dāng)允許用戶自行提交網(wǎng)址。
通過以上4種方法收集到的所有網(wǎng)址,篩選掉重復(fù)記錄,整理網(wǎng)址網(wǎng)站名和別名,通過人工過濾一些內(nèi)部的不適合在互聯(lián)網(wǎng)公開的網(wǎng)址,最終可以得到高校所有相關(guān)的網(wǎng)址。網(wǎng)址數(shù)據(jù)庫定義如表2所示。
收集到大量的網(wǎng)址后,需要對這些網(wǎng)址進(jìn)行歸類以方便訪問。由于單個網(wǎng)址可能會屬于多個類,為了簡化設(shè)計(jì),筆者應(yīng)用了非常自由的貼標(biāo)簽方法對網(wǎng)址進(jìn)行分類。[5]每個網(wǎng)址屬于的所有標(biāo)簽用逗號分隔保存,PHP后臺程序遍歷網(wǎng)址Category字段即可收集到某一個分類的所有網(wǎng)址。
在廈門大學(xué),筆者按照高校訪問用戶角色區(qū)分,分為“常用網(wǎng)址”、“學(xué)生服務(wù)”、“教師服務(wù)”、“文獻(xiàn)資源”、“特別推薦”、“個人”等分類。[6]其中“常用網(wǎng)址”是根據(jù)后臺記錄的用戶對網(wǎng)址的訪問頻次把最常被訪問的網(wǎng)址做的歸類。分類采用人工分類。
表2 網(wǎng)址數(shù)據(jù)庫定義
廈門大學(xué)校內(nèi)網(wǎng)址導(dǎo)航站根據(jù)分析得到的網(wǎng)址導(dǎo)航站的主要特征實(shí)現(xiàn)了以下功能:首頁欄目由菜單、搜索框、搜索結(jié)果區(qū)域、“常用網(wǎng)址”、部分類別網(wǎng)址構(gòu)成。其他頁面包括自定義網(wǎng)址頁面、全部網(wǎng)址頁面和帶網(wǎng)址預(yù)覽圖的全部網(wǎng)址頁面。搜索功能可根據(jù)拼音或者拼音首字母搜索,搜索結(jié)果立刻顯示。
為了在移動端有更好的體驗(yàn),網(wǎng)頁排版使用Bootstrap的響應(yīng)式布局,在桌面瀏覽器一行顯示12個網(wǎng)址,在手機(jī)端瀏覽器一行只顯示2個網(wǎng)址。桌面瀏覽器的導(dǎo)航條在手機(jī)瀏覽器可自動縮小為下拉菜單。通過Bootstrap CSS框架,無需修改后端PHP代碼即可達(dá)到在不同大小的瀏覽器有不同的顯示樣式。
在顯示所有網(wǎng)址頁面時(shí),為了讓用戶對網(wǎng)址的網(wǎng)站內(nèi)容有更直觀的印象,筆者對所有網(wǎng)址的網(wǎng)站首頁作了截圖顯示在頁面上。截圖使用c#語言,Visual Studio開發(fā),通過WebBrowser控件,訪問網(wǎng)址并截圖保存,保存的文件名為網(wǎng)址的MD5值。通過定期運(yùn)行c#程序更新首頁截圖。最終展示效果如圖2所示。
為了獲得最快的訪問速度,筆者對網(wǎng)址導(dǎo)航站做了如下處理:
圖2 全部網(wǎng)址頁面帶預(yù)覽圖版
(1)首頁靜態(tài)化
網(wǎng)址導(dǎo)航站的首頁進(jìn)行了靜態(tài)化處理,根據(jù)網(wǎng)址導(dǎo)航站的網(wǎng)址更新頻率制定出在服務(wù)器緩存4個小時(shí)的規(guī)則。在4個小時(shí)之內(nèi),所有訪問都是直接返回靜態(tài)頁面用以減少頁面生成的時(shí)間。同時(shí)使用Apache2的mod_expire模塊,設(shè)置靜態(tài)文件的Expires和Last-Modified頭部,設(shè)置靜態(tài)頁面失效時(shí)間為2小時(shí),通過這個設(shè)置,在瀏覽器端,2小時(shí)之內(nèi)在網(wǎng)址導(dǎo)航站訪問都無需再次跟服務(wù)器交互。
(2)對頁面進(jìn)行g(shù)zip壓縮
gzip壓縮可以減少瀏覽器和服務(wù)器之間傳輸?shù)臄?shù)據(jù)大小,通過Apache2的mod_deflate模塊啟用gzip壓縮。
(3)對于網(wǎng)址的搜索也在客戶端完成
在首頁靜態(tài)化生成時(shí)也把用于搜索的字段“Link”、“SiteName”、“SiteNameAlias”和以上3個字段的拼音全稱、拼音首字母(使用PHP查表法轉(zhuǎn)換中文到拼音)使用逗號分隔全部組合成一個字符串寫入首頁的JavaScript代碼內(nèi)。對于以上3個字段的搜索全部在瀏覽器客戶端完成,無需和服務(wù)器交互。首頁載入的第一時(shí)間輸入焦點(diǎn)定位在搜索框,直接回車可訪問搜索結(jié)果的第一個內(nèi)容。
(4)網(wǎng)址預(yù)覽圖使用延遲加載
全部網(wǎng)址的預(yù)覽圖版頁面除了顯示前面的幾張圖片外,其余圖片只有在頁面下拉到相應(yīng)位置時(shí)才真正去下載圖片加載,加快了頁面載入的速度,也節(jié)省了移動端的數(shù)據(jù)流量。
對于網(wǎng)址導(dǎo)航站,最有用的數(shù)據(jù)是某個網(wǎng)址的用戶點(diǎn)擊數(shù)量,這個數(shù)據(jù)在調(diào)整網(wǎng)址的分類和排序時(shí)是重要的參考。一種做法可在展示網(wǎng)址頁面的時(shí)候不直接輸出網(wǎng)址而是去服務(wù)器獲得網(wǎng)址然后重定向,在服務(wù)器完成網(wǎng)址訪問統(tǒng)計(jì)功能。在廈門大學(xué)校內(nèi)網(wǎng)址導(dǎo)航站,筆者使用了另外一種方法提高用戶的訪問速度,減少在服務(wù)器計(jì)數(shù)導(dǎo)致的網(wǎng)絡(luò)交互流量和服務(wù)器處理時(shí)間。該方法為直接在展示網(wǎng)址頁面上輸出網(wǎng)址,用戶點(diǎn)擊網(wǎng)址鏈接后使用瀏覽器客戶端腳本JavaScript訪問服務(wù)器的一個網(wǎng)址并立即返回404代碼,在客戶端重定向網(wǎng)址,后臺每天使用Python腳本分析Apache2的404網(wǎng)址訪問記錄即可統(tǒng)計(jì)到所有網(wǎng)址的訪問頻次。
廈門大學(xué)校內(nèi)網(wǎng)址導(dǎo)航站實(shí)現(xiàn)了導(dǎo)航站的特征,達(dá)到了方便校內(nèi)外人員和展示高校文化科研成果的目的。以表1同樣的測試標(biāo)準(zhǔn),廈門大學(xué)校內(nèi)網(wǎng)址導(dǎo)航站首次下載量僅為88k,頁面展示時(shí)間為0.733秒,2小時(shí)內(nèi)下載量為0k,2小時(shí)后在服務(wù)器網(wǎng)址沒有更改的情況下下載量僅為0.5k,載入時(shí)間為0.113秒。筆者今后將繼續(xù)關(guān)注高校網(wǎng)址導(dǎo)航站發(fā)展,嘗試在不影響速度的情況下可再加入搜索、農(nóng)歷、重要新聞等欄目的可行性。在速度方面還可以再進(jìn)一步優(yōu)化,例如在統(tǒng)計(jì)網(wǎng)址訪問次數(shù)方面,目前是每次訪問一個網(wǎng)址時(shí)均會訪問一次服務(wù)器,可修改為點(diǎn)擊網(wǎng)址后不直接提交到服務(wù)器而是記錄在瀏覽器端,多次后合并提交達(dá)到減少網(wǎng)絡(luò)交互的目的。
[1]劉建軍.網(wǎng)絡(luò)資源獲取方法探討[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2013(1):130-132.
[2]楊林.普通高校網(wǎng)站主頁設(shè)計(jì)思路探討[J].保山師專學(xué)報(bào),2006(5):7-9.
[3]方偉杰,洪波,云霞等.基于W eb2.0的校園信息門戶設(shè)計(jì)與實(shí)現(xiàn)[J].中國教育信息化,2012(23):33-35.
[4]劉歡,盧蓓蓉.使用響應(yīng)式設(shè)計(jì)構(gòu)建高校新型門戶網(wǎng)站[J].中國教育信息化,2013(9):71-74.
[5]黃建年,侯漢清.Tag分類基本問題探究[J].情報(bào)理論與實(shí)踐,2008(3):461-465.
[6]張瑾,劉歡.基于用戶服務(wù)的高校門戶網(wǎng)站建設(shè)模式探討[J].中國教育信息化,2012(19):20-23.