摘要:數(shù)字圖書(shū)館在發(fā)展過(guò)程中,信息的載量越來(lái)越大,服務(wù)模式難以創(chuàng)新?,F(xiàn)存的個(gè)性化信息服務(wù)存在多種弊端。用戶畫(huà)像通過(guò)分析用戶的行為偏好,為精準(zhǔn)推薦做參考。本文基于用戶的畫(huà)像視角,通過(guò)分析構(gòu)建過(guò)程,提出了一種數(shù)字圖書(shū)館個(gè)性化信息服務(wù)研究的新思路。
關(guān)鍵詞:用戶畫(huà)像;個(gè)性化;數(shù)字圖書(shū)館
1背景
當(dāng)今,數(shù)字化、開(kāi)放化、互聯(lián)化的信息環(huán)境愈演愈烈,人類(lèi)社會(huì)進(jìn)入了數(shù)據(jù)富足供給的時(shí)代,數(shù)據(jù)資源已不再是稀缺資源[1]。“互聯(lián)網(wǎng)+”時(shí)代的到來(lái)促使高校數(shù)字圖書(shū)館所處的社會(huì)環(huán)境和技術(shù)環(huán)境出現(xiàn)較大改變,數(shù)字圖書(shū)館的服務(wù)內(nèi)涵由信息搜索和信息瀏覽拓展為行為策略指出和信息共享,出現(xiàn)了新的服務(wù)模式包括嵌入式服務(wù),全媒體服務(wù),O2O服務(wù),MOOCs服務(wù),云閱讀服務(wù)[2]。
隨著用戶對(duì)于信息的需求量增加,數(shù)字圖書(shū)館未來(lái)的發(fā)展趨勢(shì)逐漸偏向于用戶的個(gè)性化信息服務(wù)研究。數(shù)字圖書(shū)館的個(gè)性化信息服務(wù)大致包括自定義服務(wù)界面設(shè)定、符合個(gè)人需求的內(nèi)容定制、個(gè)性化信息推送服務(wù)以及智能的信息檢索定制等[3]。當(dāng)前,個(gè)性化數(shù)字圖書(shū)館信息服務(wù)中存在技術(shù)問(wèn)題和用戶隱私問(wèn)題以及圖書(shū)館員素質(zhì)方面的問(wèn)題,同時(shí)如何為用戶推送符合他們要求的內(nèi)容也成為研究的難題。用戶畫(huà)像的概念最早由交互設(shè)計(jì)之父艾倫·庫(kù)珀(AlanCooper)提出。
他說(shuō),用戶畫(huà)像是真實(shí)用戶的虛擬表示,基于一組真實(shí)數(shù)據(jù)的目標(biāo)用戶模型。自2011年起,互聯(lián)網(wǎng)正式進(jìn)入了大數(shù)據(jù)時(shí)代。網(wǎng)絡(luò)社交文化的迅猛發(fā)展連帶出龐大的線上用戶數(shù)據(jù),有了足夠的數(shù)據(jù)基礎(chǔ),如何精準(zhǔn)的服務(wù)于用戶的問(wèn)題也隨之產(chǎn)生,對(duì)用戶畫(huà)像的研究熱潮也開(kāi)始興起。本文通過(guò)分析用戶畫(huà)像以及數(shù)字圖書(shū)館個(gè)性化信息服務(wù)的研究現(xiàn)狀,分析了用戶畫(huà)像具體的構(gòu)建過(guò)程,并提出了其對(duì)于個(gè)性化信息服務(wù)的價(jià)值。
2領(lǐng)域研究進(jìn)展
2.1用戶畫(huà)像研究現(xiàn)狀
以CNKI數(shù)據(jù)庫(kù)作為來(lái)源數(shù)據(jù)庫(kù),以“用戶畫(huà)像”為關(guān)鍵詞進(jìn)行檢索,限定中文文獻(xiàn),不限定時(shí)間,檢索到的文獻(xiàn)數(shù)量為629,對(duì)檢索到的文獻(xiàn)進(jìn)行可視化分析,如圖1所示。從圖中可以看出,對(duì)于用戶畫(huà)像的研究,在2010-2013年的熱度較低;隨著大數(shù)據(jù)時(shí)代的來(lái)臨,2013年以后,國(guó)內(nèi)眾多學(xué)者對(duì)用戶畫(huà)像研究的熱度逐步上升。通過(guò)對(duì)文獻(xiàn)的細(xì)致梳理,目前國(guó)內(nèi)學(xué)者對(duì)于用戶畫(huà)像的研究主要分為:(1)理論層面的探討;(2)用戶畫(huà)像模型構(gòu)建方法;(3)用戶畫(huà)像的應(yīng)用。
2.1.1理論層面研究現(xiàn)狀
用戶畫(huà)像的概念最初應(yīng)用于電子商務(wù)領(lǐng)域。在大數(shù)據(jù)時(shí)代,用戶信息泛濫。如圖2所示,每個(gè)用戶的特定信息都被抽象到標(biāo)簽中,這些標(biāo)簽用于具體化用戶的形象,以便為用戶提供有針對(duì)性的服務(wù)。國(guó)內(nèi)學(xué)者對(duì)于用戶畫(huà)像的定義有不同的理解。余孟杰對(duì)于用戶畫(huà)像的定義更加偏向于用戶角色,指出在產(chǎn)品研發(fā)時(shí)需要這樣一個(gè)角色來(lái)進(jìn)行討論,通過(guò)“用戶信息標(biāo)簽化”把抽象化的數(shù)據(jù)具體為虛擬人物[4]。徐恩,於志文,杜賀和郭斌認(rèn)為用戶畫(huà)像是基于一系列數(shù)據(jù)的模型[5]。劉海,盧慧,阮金花,田丙強(qiáng),胡守忠等認(rèn)為用戶畫(huà)像是消費(fèi)者基本信息和消費(fèi)記錄所構(gòu)成的數(shù)據(jù)集合[6]。黎小林等基于商品營(yíng)銷(xiāo)的角度認(rèn)為用戶畫(huà)像是指通過(guò)收集與分析用戶的相關(guān)數(shù)字化數(shù)據(jù)蹤跡,如頁(yè)面點(diǎn)擊歷史、商品交易記錄、用戶反饋數(shù)據(jù)等,將用戶所有的標(biāo)簽綜合起來(lái),勾勒出該用戶的整體特征與輪廓[7]。
2.1.2模型構(gòu)建的研究現(xiàn)狀
陳澤宇和黃勃提出了基于主題詞改進(jìn)的詞向量模型來(lái)構(gòu)建用戶畫(huà)像,相比于只利用目標(biāo)單詞的詞向量,用主題詞向量將代表這個(gè)主題下單詞的整體語(yǔ)義,更好的表達(dá)了用戶的特征[8]。張壯,馮小年和錢(qián)鐵云提出一種基于多模態(tài)融合的用戶畫(huà)像模型用于解決用戶畫(huà)像建模中各模態(tài)不能深入交互的問(wèn)題[9]。蔣明會(huì),苗奪謙,羅晟,趙才榮等基于粒計(jì)算思想,本文以用戶在搜索引擎的歷史搜索記錄和用戶屬性(年齡、性別、學(xué)歷)為原始數(shù)據(jù),使用Stacking模型融合技術(shù)對(duì)多種模型進(jìn)行融合以改進(jìn)單一模型、單一粒度學(xué)習(xí)的限制,實(shí)現(xiàn)了多粒度的用戶畫(huà)像[10]。徐恩,於志文,杜賀,郭斌等基于手機(jī)感知數(shù)據(jù)從年齡、性別和人格特征三方面來(lái)構(gòu)建用戶畫(huà)像.然后,使用隨機(jī)森林分類(lèi)模型識(shí)別性別,并利用SVR來(lái)識(shí)別人格特征.由此提出了一種基于多維感知數(shù)據(jù)的用戶畫(huà)像模型[11]。
2.1.3在圖書(shū)館領(lǐng)域應(yīng)用的現(xiàn)狀
王雪峰通過(guò)基于用戶畫(huà)像的相關(guān)理論,對(duì)智慧圖書(shū)館的群體進(jìn)行劃分,從而對(duì)不同用戶的行為需求進(jìn)行深層次的挖掘,并分析每一類(lèi)用戶群體的典型特征,實(shí)現(xiàn)了用戶畫(huà)像的精準(zhǔn)刻畫(huà)。從而對(duì)群體用戶的行為進(jìn)行可視化呈現(xiàn)[12]。徐海玲等基于概念格構(gòu)建了高校圖書(shū)館群體用戶興趣畫(huà)像,揭示不同群體用戶的行為需求,挖掘潛在的行為規(guī)律,為高校圖書(shū)館不同群體用戶的個(gè)性化服務(wù)提供參考[13]。李丹等在圖書(shū)館廣泛的讀者行為框架中定位用戶與應(yīng)用系統(tǒng)的互動(dòng)需求,探討可以更好地在讀者與INNOPAC等應(yīng)用系統(tǒng)的互動(dòng)關(guān)系中發(fā)揮良好作用的推薦方式[14]。過(guò)仕明通過(guò)用戶畫(huà)像和場(chǎng)景五力等相關(guān)理論,構(gòu)建了數(shù)字圖書(shū)館用戶畫(huà)像,揭示了不同群體用戶的行為需求,并對(duì)其場(chǎng)景進(jìn)行了重構(gòu),為數(shù)字圖書(shū)館更好發(fā)展提供了服務(wù)和參考[15]。
王雪峰基于超級(jí)IP和用戶畫(huà)像的理論,清晰明了的揭示了不同群體用戶的特征,對(duì)群體用戶的行為進(jìn)行可視化呈現(xiàn),并基于用戶的行為提供更加符合特征的場(chǎng)景,從而進(jìn)一步提升智慧圖書(shū)館的服務(wù)能力[12]。
2.2數(shù)字圖書(shū)館個(gè)性化信息服務(wù)
胡英義總結(jié)了互聯(lián)網(wǎng)環(huán)境下高校圖書(shū)館提供信息服務(wù)的必要性和緊迫性,并提出改變提供信息服務(wù)的方式和方法[16]。在過(guò)去的十年中,徐遠(yuǎn)峰提出了通過(guò)現(xiàn)代信息技術(shù)提高圖書(shū)館信息服務(wù)水平并竊聽(tīng)信息技術(shù)潛力''的想法[17]。劉素清等根據(jù)新媒體的特點(diǎn),提出了數(shù)字圖書(shū)館信息服務(wù)的新方向,分析了新媒體時(shí)代用戶對(duì)決策信息的個(gè)性化需求[18]?;跀?shù)據(jù)挖掘技術(shù),安貝提出了大學(xué)數(shù)字圖書(shū)館的信息服務(wù)優(yōu)化策略,并優(yōu)化了大學(xué)數(shù)字圖書(shū)館的信息服務(wù)策略[19]。
3基于用戶畫(huà)像的個(gè)性化服務(wù)策略研究
3.1數(shù)據(jù)來(lái)源和構(gòu)建方法
數(shù)據(jù)的收集面向全體師生,包括本科生,碩士生,博士生以及教師。數(shù)據(jù)的來(lái)源是圖書(shū)館后臺(tái)記錄的數(shù)據(jù),主要是借書(shū)的記錄數(shù)據(jù)以及用戶的靜態(tài)屬性即性別、年齡、專(zhuān)業(yè)、年級(jí)、職稱(chēng)等如圖3。通過(guò)構(gòu)建不同群體的借閱偏好,構(gòu)建用戶畫(huà)像,為用戶提供個(gè)性化服務(wù)。根據(jù)數(shù)據(jù)來(lái)源的不同,目前對(duì)用戶畫(huà)像的構(gòu)建方法主要分為兩種:基于人文學(xué)科范疇的研究方向和基于計(jì)算機(jī)、數(shù)據(jù)統(tǒng)計(jì)等范疇的研究方向。圖書(shū)館個(gè)性化信息服務(wù)的用戶畫(huà)像屬于人文學(xué)科范疇的研究方向。
3.2構(gòu)建步驟與個(gè)性化服務(wù)
將采集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)清理,構(gòu)建標(biāo)簽體系后進(jìn)行聚類(lèi),然后進(jìn)行可視化的呈現(xiàn)。半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)主要是在各種系統(tǒng)模塊中生成的行為數(shù)據(jù),例如書(shū)目歸還系統(tǒng)中的數(shù)據(jù)恢復(fù),電子閱讀管理系統(tǒng)中的數(shù)據(jù)輸入,Internet接口上的數(shù)據(jù)和數(shù)據(jù)庫(kù)操作數(shù)據(jù)等。由于數(shù)據(jù)生成的形式不同,標(biāo)準(zhǔn)和規(guī)范不同,數(shù)據(jù)的存儲(chǔ)方式和格式具有一定程度的排他性,因此較為復(fù)雜?;诩上到y(tǒng)和統(tǒng)一的管理數(shù)據(jù),收集各種類(lèi)型的數(shù)據(jù)并完成數(shù)據(jù)清除操作更加方便和可操作[20]。
用戶畫(huà)像的本質(zhì)是完成對(duì)用戶標(biāo)簽的描述,即對(duì)用戶進(jìn)行標(biāo)簽。在人為干預(yù)的前提下,放置一個(gè)用于標(biāo)記用戶肖像的系統(tǒng),可以對(duì)數(shù)據(jù)挖掘過(guò)程中創(chuàng)建的數(shù)據(jù)進(jìn)行排序并消除其偏差,并歸納和制定標(biāo)簽的特定特征的標(biāo)識(shí)。建立用戶標(biāo)簽系統(tǒng)的具體過(guò)程主要包括:獲取有關(guān)用戶數(shù)據(jù)的信息,提取信息要點(diǎn),將其與典型的,具有代表性的參考詞表進(jìn)行比較,形成用戶需要的標(biāo)簽對(duì)應(yīng)的詞表。
聚類(lèi)分析是一種根據(jù)事物的特征對(duì)個(gè)體進(jìn)行分類(lèi)的方法,將數(shù)據(jù)分為具有較大外部差異但內(nèi)部相似度較高的幾類(lèi),目前,聚類(lèi)分析研究領(lǐng)域主要涉及處理過(guò)程,模型識(shí)別和市場(chǎng)分析。K-均值算法和C-模糊工具的聚類(lèi)算法(FCM算法)是目前使用最廣泛的兩種分類(lèi)方法。聚類(lèi)后可以根據(jù)不同群體即本科生、碩士生、博士生以及教師的不同的行為偏好構(gòu)建用戶畫(huà)像[21]。
建立用戶畫(huà)像可為讀者的個(gè)性化服務(wù)打下良好基礎(chǔ)。用戶數(shù)據(jù)的來(lái)源和格式?jīng)Q定了推薦策略,推薦內(nèi)容及其呈現(xiàn)形式,并直接影響用戶對(duì)推薦內(nèi)容的關(guān)注和接受程度。在數(shù)字圖書(shū)館的個(gè)性化信息服務(wù)的過(guò)程中,通過(guò)分析用戶的來(lái)源來(lái)構(gòu)建和預(yù)測(cè)用戶畫(huà)像的具體模型。然后根據(jù)用戶可能需要的信息進(jìn)行深入的數(shù)據(jù)挖掘,完成對(duì)信息資源的推送服務(wù)。
4結(jié)語(yǔ)
數(shù)字圖書(shū)館的服務(wù)模式正在發(fā)生改變,隨著大數(shù)據(jù)技術(shù)的成熟發(fā)展,多種創(chuàng)新模式層出不窮。個(gè)性化信息服務(wù)作為數(shù)字圖書(shū)館未來(lái)的發(fā)展趨勢(shì),對(duì)它的深入研究有十分重要的意義。用戶畫(huà)像的概念多應(yīng)用于互聯(lián)網(wǎng)營(yíng)銷(xiāo)領(lǐng)域,將其借鑒于圖書(shū)館的個(gè)性化服務(wù)能夠促進(jìn)數(shù)字圖書(shū)館的發(fā)展,更好的服務(wù)于讀者。
參考文獻(xiàn)
[1]朝樂(lè)門(mén).信息資源管理理論的繼承與創(chuàng)新:大數(shù)據(jù)與數(shù)據(jù)科學(xué)視角[J].中國(guó)圖書(shū)館學(xué)報(bào),2019(02):26-42.
[2]鄭美玉.“互聯(lián)網(wǎng)+”時(shí)代高校數(shù)字圖書(shū)館服務(wù)模式創(chuàng)新研究[J].情報(bào)理論與實(shí)踐,2016,39(7):36-40.
[3]趙天昀.數(shù)字圖書(shū)館個(gè)性化信息服務(wù)中用戶隱私保護(hù)研究[J].圖書(shū)館理論與實(shí)踐,2018(2):101-103.
[4]余孟杰.產(chǎn)品研發(fā)中用戶畫(huà)像的數(shù)據(jù)模建——從具象到抽象[J].設(shè)計(jì)藝術(shù)研究,2014(6):60-64.
[5]徐恩,於志文,杜賀,郭斌.基于移動(dòng)感知數(shù)據(jù)的用戶畫(huà)像系統(tǒng)[J].鄭州大學(xué)學(xué)報(bào):理學(xué)版,2019,51(4):30-36.
[6]劉海,盧慧,阮金花,田丙強(qiáng),胡守忠.基于“用戶畫(huà)像”挖掘的精準(zhǔn)營(yíng)銷(xiāo)細(xì)分模型研究[J].絲綢,2015,52(12):37-42.
[7]黎小林,徐蘇,王海忠.在線平臺(tái)用戶畫(huà)像對(duì)品牌依戀的影響[J].廣東財(cái)經(jīng)大學(xué)學(xué)報(bào),2019(5):38-49.
[8]陳澤宇,黃勃.改進(jìn)詞向量模型的用戶畫(huà)像研究[J].計(jì)算機(jī)工程與應(yīng)用,2020,56(1):180-184.
[9]張壯,馮小年,錢(qián)鐵云.基于多模態(tài)融合技術(shù)的用戶畫(huà)像方法[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2020,56(1):105-111.
[10]蔣明會(huì),苗奪謙,羅晟,趙才榮.基于粒計(jì)算的多粒度用戶畫(huà)像[J].模式識(shí)別與人工智能,2019,32(8):691-698.
[11]徐恩,於志文,杜賀,郭斌.基于移動(dòng)感知數(shù)據(jù)的用戶畫(huà)像系統(tǒng)[J].鄭州大學(xué)學(xué)報(bào):理學(xué)版,2019,51(4):30-36.
[12]王雪峰.智慧圖書(shū)館知識(shí)服務(wù)場(chǎng)景構(gòu)建研究——以吉林藝術(shù)學(xué)院圖書(shū)館為例[J].情報(bào)科學(xué),2019,37(12):98-104.
[13]徐海玲,張海濤,張梟慧,魏明珠.基于概念格的高校圖書(shū)館群體用戶興趣畫(huà)像研究[J].情報(bào)科學(xué),2019,37(9):153-158.
[14]李丹,高建忠.基于用戶畫(huà)像的圖書(shū)館推薦服務(wù)初探[J].圖書(shū)館,2019(7): 66-71.
[15]過(guò)仕明.數(shù)字圖書(shū)館用戶畫(huà)像及場(chǎng)景重構(gòu)研究[J].情報(bào)科學(xué),2019,37 (12):11-18.
[16]胡迎義.高校圖書(shū)館個(gè)性化信息服務(wù)研究[J].蘭臺(tái)內(nèi)外,2018(12):38- 40.
[17]續(xù)遠(yuǎn)鳳.近十年我國(guó)圖書(shū)館信息服務(wù)研究綜述[J].圖書(shū)館界,2016(6):35 -39.
[18]劉素清,彭妍,惠中艷,等.面向決策支持的高校圖書(shū)館信息服務(wù)[J].中國(guó)中醫(yī)藥圖書(shū)情報(bào)雜志,2019,43(2):38-41.
[19]安蓓.基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館信息服務(wù)優(yōu)化策略[J].信息記錄材料,2019,20(4):198-199.
[20]潘宇光.高校智慧圖書(shū)館讀者信息需求的用戶畫(huà)像[J].合肥工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2018,32(2):113-119.
[21]譚浩,郭雅婷.基于大數(shù)據(jù)的用戶畫(huà)像構(gòu)建方法與運(yùn)用[J].包裝工程,2019,40(22):95-101.
作者簡(jiǎn)介
曹曉雅(1997—),女,漢,山東泰安,碩士,北京聯(lián)合大學(xué),研究方向:數(shù)字圖書(shū)館。