張小波 付達杰
摘要:為了更好的幫助用戶在網(wǎng)絡獲得個人所需的信息資源,搜索引擎、推薦系統(tǒng)需要搜集和使用大量用戶的個人信息,而這些個人信息中大都包含了一些隱私數(shù)據(jù),因此用戶隱私安全的問題就隨之而出。首先就網(wǎng)絡信息資源個性化推薦中隱私保護進行了綜述,然后分析比較了目前使用的相關保護措施,最后提出隱私保護措施的幾點改進。
關鍵詞:個性化搜索;個性化推薦系統(tǒng);隱私保護;信息安全;網(wǎng)絡安全
中圖分類號:TP315 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2015.04.014
0.引言
隨著互聯(lián)網(wǎng)的飛速發(fā)展,大數(shù)據(jù)時代也接踵而至,大幅增長的數(shù)據(jù)使得以此為基礎使用搜索引擎進行搜索的結果也相應增加,從而用戶需找其所需的網(wǎng)絡信息資源也變得越來越困難。早先當用戶分別在Google、Yahoo或者百度上使用同一關鍵字進行搜索的時候,雖然有幾十頁甚至上百頁的結果,但是大部分是重復的或者不相關的,很明顯,這并不是用戶所需要的理想的結果。在此需求之下,個性化推薦系統(tǒng)相應而生。個性化推薦系統(tǒng)是根據(jù)用戶的個性化信息,例如興趣、愛好、搜索習慣等進行統(tǒng)計建模,然后將相關聯(lián)的網(wǎng)絡信息資源(網(wǎng)頁、產(chǎn)品等)在用戶進行搜索的時候推薦給用戶,以滿足用戶多元化個性化的需求。
1995年3月斯坦福大學的Mark Balabanovic等人在美國人工智能協(xié)會上率先推出了個性化推薦系統(tǒng)LIRA。從此之后,個性化推薦技術開始迅猛地發(fā)展,2004年3月Google第一個beta版Personalized Search從Google Labs Proiect誕生,得到了用戶的好評。緊隨其后,國內(nèi)外大量的研究院和公司開始投入巨資進行個性化推薦系統(tǒng)與個性化搜索技術的研發(fā)。在個性化推薦系統(tǒng)與個性化搜索技術當中核心就是獲取用戶個人信息數(shù)據(jù),這些數(shù)據(jù)包含了大量用戶的隱私,隱私安全這一敏感問題漸漸浮現(xiàn)出來。雖然一些國家擬定了相關的法律法規(guī)來保護隱私數(shù)據(jù),但是在隱私保護技術上仍然處于起步階段,以致正當個性化推薦系統(tǒng)發(fā)展的如火如荼之時,AOL、Yahoo、Apple、Faeebook等知名大型企業(yè)曝出用戶搜索數(shù)據(jù)、注冊信息泄露問題。其中國內(nèi)所熟知的中國開發(fā)者技術在線社區(qū)CSDN更是有600萬注冊用戶數(shù)據(jù)被泄露。這些數(shù)據(jù)包含了用戶的興趣、愛好、聯(lián)系方式等,使得用戶對于網(wǎng)絡信息安全信任度降低和對個性化推薦的反感。從而導致需要大量用戶信息的個性化推薦系統(tǒng)與個人隱私保護之間產(chǎn)生了一定的矛盾。本文對現(xiàn)有隱私保護的措施進行了相關的研究,并指出其中的不足,提出相關改進建議,使之能在一定程度上平衡矛盾。