尹婷婷 曾憲玉
摘 要 文章針對用戶畫像技術(shù)在數(shù)字圖書館個性化信息服務領(lǐng)域的應用實踐及發(fā)展現(xiàn)狀進行研究與分析,基于用戶畫像技術(shù)建立由數(shù)據(jù)來源層、數(shù)據(jù)分析整合層及數(shù)據(jù)挖掘?qū)訕?gòu)成的三層數(shù)字圖書館個性化信息服務模型。最后,從預測用戶潛在閱讀需求、開展群體服務、關(guān)注用戶畫像與資源模型的匹配度等方面,對基于用戶畫像技術(shù)的數(shù)字圖書館個性化信息服務的應用模式進行探討與分析,為大數(shù)據(jù)背景下數(shù)字圖書館個性化信息服務提供支持與保障。
關(guān)鍵詞 用戶畫像 個性化信息服務 館藏資源
Abstract Firstly, this paper studies and analyzes the application and development of user profile technology in the field of personalized information service of digital library. Secondly, based on user profile technology, the three-layer digital library personalized information service model is established which is consisting of data source layer, data analysis integration layer and data mining layer. Finally, from the specific aspects of predicting users potential reading needs, developing group services and paying attention to the matching of user profile and library resource models, the application mode of digital library personalized information service is discussed and analyzed based on user profile technology, in order to provide support and guarantee for the digital library personalized information service under the background of big data.
Keywords User profile. Personalized information service. Library resources.
0 引言
在“互聯(lián)網(wǎng)+”信息時代背景下,信息化服務建設已經(jīng)成為社會各行各業(yè)轉(zhuǎn)型升級的發(fā)展重點。對于圖書館而言,隨著大數(shù)據(jù)技術(shù)的應用與發(fā)展,與用戶信息行為軌跡相關(guān)的數(shù)據(jù)信息越發(fā)全面與完備。目前,依據(jù)不同的用戶需求和知識需求,為不同用戶提供符合其需求標準的個性化信息內(nèi)容,已成為圖書情報和信息傳播領(lǐng)域日益關(guān)注的焦點與難點[1]??傮w而言,隨著智慧圖書館的建設與發(fā)展,圖書館館藏資源不斷增加,如何挖掘用戶感興趣的、有針對性的信息資源已成為目前圖書館亟待解決的重要問題,而用戶畫像技術(shù)作為一種在信息時代背景下能夠科學、快速、精準地實現(xiàn)資源信息推送及個性化服務的核心算法,為數(shù)字圖書館個性化信息服務提供了發(fā)展方向及技術(shù)支持。用戶畫像技術(shù)通過對用戶信息及其在圖書館網(wǎng)絡系統(tǒng)內(nèi)的行為痕跡進行深度數(shù)據(jù)挖掘,完成發(fā)現(xiàn)與提煉的過程,從而進一步描繪出用戶信息的完整面貌,深入揭示信息資源與用戶需求之間隱含的關(guān)聯(lián)關(guān)系,最終在龐雜、海量的數(shù)據(jù)信息庫中尋找、挖掘、提煉出用戶需要的準確資源信息。因此,本文借鑒已在計算機和電子商務等諸多領(lǐng)域取得了重大研究進展及成果的用戶畫像技術(shù)的實踐經(jīng)驗,在用戶畫像視角下構(gòu)建數(shù)字圖書館個性化信息服務模型,并對數(shù)字圖書館個性化信息服務的應用模式進行分析與研究,以期實現(xiàn)更加精準的個性化信息服務。
1 用戶畫像的概念
用戶畫像的概念最早是由美國軟件設計師阿蘭·庫珀(Alan Cooper)提出的,他認為通過用戶畫像構(gòu)建的用戶模型可以看作是真實用戶的虛擬代表,主要包括用戶基本屬性、生活習慣和消費行為等因素,在模型構(gòu)建過程中利用信息識別技術(shù)完成對用戶及用戶群組貼“標簽”的處理步驟(其中“標簽”主要指的是完整、準確的用戶特征屬性),隨后將獲得的“標簽”組合起來,即為完成用戶畫像的整個流程[2-3]。概括而言,用戶畫像技術(shù)主要是通過對用戶的屬性信息、行為痕跡等信息進行數(shù)據(jù)處理,精煉并提取出用戶個性化的標簽信息,從而達到識別用戶個性化信息需求的目的[4]。具體而言,王順箐通過對讀者的個人喜好和動態(tài)需求進行數(shù)理統(tǒng)計分析與數(shù)據(jù)挖掘,構(gòu)建基于用戶畫像的圖書館閱讀推薦系統(tǒng)模型[5]。單軫等基于文獻分析法,通過對大數(shù)據(jù)背景下用戶畫像技術(shù)的應用現(xiàn)狀進行分析,指出國內(nèi)圖書館領(lǐng)域用戶畫像的現(xiàn)實困境與發(fā)展路徑[6]。趙巖在分析大數(shù)據(jù)背景下數(shù)字圖書館用戶畫像的具體需求與應用現(xiàn)狀的基礎上,構(gòu)建基于用戶畫像的智慧閱讀資源推薦流程[7]。張若蘭通過用戶畫像技術(shù)主動關(guān)聯(lián)讀者和館藏資源,提出數(shù)字圖書館情景化知識推薦的服務流程[8]??v覽圖情界關(guān)于用戶畫像技術(shù)的已有應用研究可以發(fā)現(xiàn),研究主要集中在信息資源的精準推送、知識推薦服務等領(lǐng)域,而關(guān)于用戶畫像技術(shù)在數(shù)字圖書館個性化信息服務中的應用研究內(nèi)容較少,仍需要深入研究與分析。
2 數(shù)字圖書館個性化信息服務的研究概述
在大數(shù)據(jù)背景下,圖書館通過對數(shù)字資源進行收集、歸納、分析等處理,為讀者用戶提供個性化信息推薦服務。胡迎義總結(jié)了在互聯(lián)網(wǎng)背景下高校圖書館提供信息化服務的必要性及緊迫性,并提出改變提供信息服務的方式與方法[9];續(xù)遠鳳通過梳理近十年圖書情報領(lǐng)域信息服務的發(fā)展概況,提出“借助于現(xiàn)代化信息技術(shù)手段、挖掘信息技術(shù)潛力從而提高圖書館信息服務水平”的觀點[10];劉素清等通過對新媒體時代用戶對決策信息個性化需求進行分析,基于新媒體的具體特性提出高校數(shù)字圖書館信息服務的新方向[11];安蓓基于數(shù)據(jù)挖掘技術(shù)提出高校數(shù)字圖書館信息服務優(yōu)化策略,并對高校數(shù)字圖書館信息服務的策略進行了優(yōu)化[12]。
數(shù)據(jù)來源層提供的用戶基本數(shù)據(jù)和動態(tài)數(shù)據(jù)構(gòu)成了用戶畫像的所有數(shù)據(jù)信息,從數(shù)據(jù)的內(nèi)容而言,可以分為用戶基本信息、用戶興趣偏好及用戶互動數(shù)據(jù)等三類。其中,用戶互動數(shù)據(jù)主要指的是對個人使用過的資源進行推薦、評價、轉(zhuǎn)發(fā)、分享等。這三類數(shù)據(jù)信息可能來源于使用圖書館智慧管理系統(tǒng)、圖書館門戶網(wǎng)站、相關(guān)移動平臺及其他信息系統(tǒng)時的行為數(shù)據(jù)等,并依照不同存儲格式存儲于不同的異構(gòu)系統(tǒng)中。
數(shù)據(jù)分析整合層是實現(xiàn)用戶基本信息數(shù)據(jù)和動態(tài)行為數(shù)據(jù)獲取、整合的處理層,利用專業(yè)數(shù)據(jù)挖掘技術(shù)(主要包括數(shù)據(jù)分類、聚類、關(guān)聯(lián)、序列轉(zhuǎn)換、信息預測等)及數(shù)據(jù)預處理技術(shù)(主要包括數(shù)據(jù)集成、轉(zhuǎn)換、規(guī)約、清洗等)對獲取的數(shù)據(jù)進行處理、分析與加工,得到能夠用于后續(xù)用戶畫像技術(shù)處理流程的有效數(shù)據(jù)。
數(shù)據(jù)挖掘?qū)邮菢?gòu)建用戶畫像模型的關(guān)鍵層,通過利用前期得到的有效數(shù)據(jù)集合,結(jié)合包括資源搜索偏好、資源利用偏好、社會偏好、用戶關(guān)聯(lián)關(guān)系、活躍度、人群屬性、用戶資源評價等信息的用戶畫像標簽體系,采用數(shù)據(jù)挖掘等技術(shù)對用戶及用戶群組進行分析研究,建立用戶及用戶群體畫像庫,從而完成用戶畫像模型的建立過程,其中在數(shù)據(jù)挖掘?qū)舆M行數(shù)據(jù)分析處理的過程中,需要多層次、多角度、多維度進行數(shù)據(jù)處理,包括利用得到的預測模型對潛在用戶及用戶群組的資源需求進行分析與處理。模型構(gòu)建完成后,將獲得的用戶畫像模型處理數(shù)據(jù)以具體、生動、形象、用戶易于接受的形式呈現(xiàn)在智慧圖書館相應的交互平臺上,內(nèi)容包括對資源調(diào)度、個性化服務、可視化數(shù)據(jù)等具體信息展示,進一步加強圖書館與用戶之間的互動與交流,為用戶提供多層次、全方位的個性化信息服務。
4 基于用戶畫像技術(shù)的個性化信息服務模式分析與探討
通過對用戶及用戶群組的標簽化處理、構(gòu)建資源數(shù)據(jù)集合,建立用戶及用戶群組與資源數(shù)據(jù)集合之間的關(guān)聯(lián)、匹配規(guī)則,從而完成基于用戶畫像技術(shù)的數(shù)字圖書館個性化信息服務的完整過程。因此,本小節(jié)從分析用戶潛在資源需求、開展群體服務、關(guān)注用戶畫像與資源模型匹配度等方面入手,針對基于用戶畫像技術(shù)的數(shù)字圖書館個性化信息服務的應用模式進行詳細的探討與分析,為實現(xiàn)更加精準的個性化信息服務提供參考依據(jù)。
4.1 分析用戶資源需求,精準推送館藏資源數(shù)據(jù)
在數(shù)字圖書館個性化信息服務過程中,通過分析用戶資源需求,構(gòu)建用戶畫像的具體模型并預測用戶需要的資源信息,進而針對用戶可能需要的資源進行深度數(shù)據(jù)挖掘,完成館藏資源信息的推送服務,具體的操作流程主要有:依據(jù)用戶的特征信息,利用用戶標簽體系標記用戶的個性特征;對用戶及用戶群組可能需要的館藏資源需求進行數(shù)據(jù)挖掘,獲取館藏資源數(shù)據(jù)集,對獲取的數(shù)據(jù)信息進行分類、提煉,得到與之相對應的元數(shù)據(jù);科學、合理匹配用戶與館藏資源集合,建立兩者之間關(guān)聯(lián)規(guī)則,實現(xiàn)館藏資源數(shù)據(jù)精準推送[17]。
4.2 依據(jù)動態(tài)變化數(shù)據(jù)信息,開展用戶群組服務
依據(jù)得到的用戶群組標簽體系,對用戶群組標簽進行總結(jié)、分析與歸納,以便全方位、多層級對用戶群組進行客觀、科學、詳細的描述。由于用戶資源需求是實時變化的,圖書館需要及時更新并同步引用動態(tài)、實時變化的數(shù)據(jù)進行用戶資源需求的描述。在基于用戶畫像技術(shù)的信息資源應用模式中,基于用戶的相似個人屬性及相似興趣特征生成含有相似資源需求的用戶群組,從而實現(xiàn)對相似用戶群組的資源精準推送。因此,數(shù)字圖書館開展個性化信息服務過程中,可以進一步注重相似用戶群組的相似個人屬性及共同興趣特征,雖然用戶的信息需求是隨時變化的,但是用戶群組的共同興趣特征變化幅度相對較小,更加有利于圖書館根據(jù)動態(tài)變化的數(shù)據(jù)信息開展用戶群組服務。
4.3 提高用戶畫像與資源信息的匹配程度,優(yōu)化信息資源建設
將基于用戶畫像獲得的用戶對于資源需求的信息與館藏資源進行匹配,優(yōu)化、完善圖書館的信息資源建設進程,具體的實現(xiàn)流程主要包括:對描述用戶資源需求的數(shù)據(jù)進行標簽化處理;對館藏資源進行分類、提煉,提取館藏資源的特征標識和關(guān)聯(lián)數(shù)據(jù)信息;對獲取的單個用戶資源需求信息進行歸納、聚類、合并,生成用戶群組的相似集合;將用戶標簽映射到對應的資源主題中,并與類似的資源信息集合完成匹配[18]。因此,在“互聯(lián)網(wǎng)+”背景下,圖書館需要充分利用大數(shù)據(jù)等信息處理手段,通過準確分析用戶群組的興趣愛好,為用戶群組建立個性化信息資源數(shù)據(jù)庫,進一步優(yōu)化信息資源建設。
5 結(jié)語
在信息服務建設快速發(fā)展的時代背景下,用戶畫像的應用能夠精確的描述用戶個性化信息屬性,將這些數(shù)據(jù)信息經(jīng)過標簽化處理后挖掘用戶的館藏資源需求,并將其與已有館藏資源數(shù)據(jù)進行匹配,有助于對數(shù)字圖書館個性化信息服務的改進與完善做出準確判斷,為數(shù)字圖書館個性化信息服務發(fā)展提供科學依據(jù)。但是就用戶畫像在數(shù)字圖書館個性化信息服務方向的應用現(xiàn)狀來說,仍面臨很多挑戰(zhàn),如提高數(shù)據(jù)信息的利用問題、如何全面、精準的描繪用戶群組共性及特性等,仍需圖書館進一步研究用戶畫像技術(shù)在數(shù)字圖書館個性化信息服務中的具體應用,切實提高用戶及用戶群組數(shù)據(jù)信息轉(zhuǎn)化為有效數(shù)據(jù)信息的比例及轉(zhuǎn)化速率,精準預測潛在用戶的行為趨勢及資源需求,為個性化信息服務的精準實現(xiàn)提供技術(shù)支持與發(fā)展方向。