劉曉婷,楊 超,趙宇鵬
(河北北方學(xué)院,河北 張家口 075000)
隨著大數(shù)據(jù)、人工智能、云計(jì)算等技術(shù)的廣泛應(yīng)用,社會(huì)逐步向智能化方向發(fā)展。黨的十九大報(bào)告提出建設(shè)智慧社會(huì),這是對(duì)信息社會(huì)發(fā)展趨勢(shì)判斷的科學(xué)部署。圖書館應(yīng)當(dāng)牢牢把握信息化發(fā)展帶來的機(jī)遇,為圖書館智慧化發(fā)展以及為讀者提供更好的智慧化服務(wù)不斷開辟新路徑,從而更好地推進(jìn)智慧社會(huì)的建設(shè)。
近年來,用戶畫像在電子商務(wù)、醫(yī)療衛(wèi)生、旅游業(yè)、圖書館等領(lǐng)域都有應(yīng)用。相關(guān)研究表明,用戶畫像技術(shù)的運(yùn)用,對(duì)深入了解用戶需求,實(shí)現(xiàn)信息服務(wù)個(gè)性化和精準(zhǔn)化有顯著作用。用戶畫像最初在電商領(lǐng)域中得到應(yīng)用,當(dāng)前也是在電子商務(wù)領(lǐng)域的應(yīng)用最為成熟,主要體現(xiàn)在根據(jù)消費(fèi)習(xí)慣等用戶行為數(shù)據(jù),推薦個(gè)性化商品和服務(wù)信息,從而實(shí)現(xiàn)精準(zhǔn)營銷。在醫(yī)療衛(wèi)生領(lǐng)域,主要體現(xiàn)在根據(jù)用戶健康信息行為進(jìn)行健康信息推薦。在旅游行業(yè),主要應(yīng)用于旅游信息推薦。在圖書館行業(yè),當(dāng)前主要是應(yīng)用于精準(zhǔn)讀者服務(wù)方面,用戶畫像技術(shù)在圖書館領(lǐng)域尚屬起步階段。
用戶畫像的概念最早由Alan Cooper提出,是指構(gòu)建能夠反映目標(biāo)用戶真實(shí)數(shù)據(jù)信息情況的虛擬模型[1]。簡(jiǎn)單地說就是用戶信息標(biāo)簽化,是通過用戶的基本屬性信息、行為信息興趣偏好等特征性數(shù)據(jù),對(duì)用戶進(jìn)行聚類分析,形成并建立基于用戶需求的普遍性和差異性模型。
使用CNKI統(tǒng)計(jì)分析工具對(duì)檢索結(jié)果進(jìn)行分析發(fā)現(xiàn),國內(nèi)最早對(duì)用戶畫像技術(shù)在圖書館領(lǐng)域的研究是在2014年,從2017年開始發(fā)文量持續(xù)上升,2018年后的發(fā)文量占全部文獻(xiàn)的93%。文獻(xiàn)研究表明,用戶畫像已經(jīng)成為近年來國內(nèi)圖書館學(xué)、情報(bào)學(xué)領(lǐng)域的熱點(diǎn)研究方向。
通過對(duì)所收集的文獻(xiàn)全文進(jìn)行詳細(xì)的閱讀和分析,對(duì)當(dāng)前國內(nèi)用戶畫像技術(shù)在圖書館領(lǐng)域的研究進(jìn)行梳理。研究主要集中在4個(gè)方面,其中對(duì)用戶畫像模型構(gòu)建方面的研究最多。
1.2.1 用戶畫像模型的構(gòu)建
陳添源[2]基于高校移動(dòng)圖書館的特定情境,通過對(duì)高校師生進(jìn)行問卷調(diào)研的方式,對(duì)人口統(tǒng)計(jì)、使用行為、使用心理進(jìn)行統(tǒng)計(jì),并利用因子分析、聚類分析和判別分析法選取適宜的用戶畫像個(gè)數(shù),從而構(gòu)建其用戶畫像標(biāo)簽體系;李曉敏等[3]為實(shí)現(xiàn)智慧圖書館精準(zhǔn)實(shí)體圖書推薦,對(duì)讀者的自然屬性、興趣屬性、社交屬性與圖書的相似性進(jìn)行匹配,構(gòu)建智慧圖書館用戶畫像;于興尚等[4]以讀者基本信息、閱讀行為、心理特征、社交網(wǎng)絡(luò)、情境感知5個(gè)方面作為數(shù)據(jù)源,構(gòu)建用戶畫像。肖海清等[5]為促進(jìn)高校圖書館閱讀推廣,從數(shù)據(jù)采集層、數(shù)據(jù)處理層、標(biāo)簽抽取層、用戶交互關(guān)聯(lián)層及應(yīng)用實(shí)現(xiàn)層5個(gè)層面,構(gòu)建了基于閱讀推廣內(nèi)在循環(huán)為機(jī)制的參與式用戶畫像模型;楊群等[6]基于大學(xué)圖書館微知識(shí)服務(wù),規(guī)劃微知識(shí)服務(wù)流程,設(shè)計(jì)了基于用戶畫像的微知識(shí)服務(wù)體系模型。張宇等[7]基于圖書知識(shí)服務(wù)系統(tǒng),通過讀者基本信息、情境信息、內(nèi)容偏好信息和互動(dòng)會(huì)話信息4個(gè)方面對(duì)用戶畫像模型進(jìn)行構(gòu)建,為圖書館知識(shí)服務(wù)系統(tǒng)提升了效率和精度。
1.2.2 用戶畫像算法與技術(shù)
李偉等[8]基于經(jīng)典k-means算法,提出了一種基于馬氏距離的多視角二分k-means算法,優(yōu)化在多視角聚類中陷入局部最優(yōu)的缺陷,設(shè)計(jì)了高校圖書館用戶畫像框架;廖運(yùn)平等[9]將圖書館用戶畫像分成面向設(shè)計(jì)與面向營銷兩類,并分別探析二者的內(nèi)涵、特征、創(chuàng)建方法和創(chuàng)建步驟;吳智勤等[10]對(duì)當(dāng)前科研用戶畫像存在的算力算法不足、標(biāo)簽不全和不準(zhǔn)的問題進(jìn)行分析與改善,提出了基于社交網(wǎng)絡(luò)方法和知識(shí)圖譜技術(shù)的用戶畫像標(biāo)簽的構(gòu)建策略。朱會(huì)華等[11]運(yùn)用數(shù)據(jù)挖掘、知識(shí)聚類,創(chuàng)建基于用戶畫像的讀者薦購、學(xué)科薦購、采訪薦購模式。
1.2.3 圖書館精準(zhǔn)服務(wù)應(yīng)用
毛玉蘭[12]構(gòu)建圖書館用戶畫像,用以提升圖書館閱讀推廣精準(zhǔn)性,顯著提高閱讀推廣工作效果并提升讀者服務(wù)滿意度;李晶潔等[13]以天津商業(yè)大學(xué)圖書館為例,依托讀者數(shù)據(jù)并從多維度建立數(shù)據(jù)模型,構(gòu)建用戶畫像,并通過用戶畫像對(duì)優(yōu)化館藏結(jié)構(gòu)建設(shè)和服務(wù)提出建議;劉海鷗等[14]從用戶畫像大數(shù)據(jù)收集、處理、存儲(chǔ)和安全4個(gè)方面具體闡釋移動(dòng)圖書館大數(shù)據(jù)應(yīng)用策略,促進(jìn)用戶畫像在移動(dòng)圖書館知識(shí)發(fā)現(xiàn)、知識(shí)產(chǎn)權(quán)保護(hù)、精準(zhǔn)推送等方面的具體應(yīng)用;張若蘭[15]對(duì)于智慧圖書館情景化知識(shí)推薦服務(wù)方面,設(shè)計(jì)了基于用戶畫像服務(wù)的目標(biāo)與服務(wù)流程,并總結(jié)相關(guān)應(yīng)用經(jīng)驗(yàn)。
1.2.4 用戶畫像相關(guān)隱私問題研究
周林興等[16]剖析了圖書館用戶畫像在構(gòu)建和使用過程中存在的隱私問題,從意識(shí)、管理、技術(shù)和法制4個(gè)層面提出相應(yīng)策略,從而更好實(shí)現(xiàn)圖書館用戶畫像隱私治理。
用戶畫像建立在真實(shí)而復(fù)雜的眾多數(shù)據(jù)基礎(chǔ)上,其核心是用戶信息的標(biāo)簽化,需要將不同的用戶通過差異化的標(biāo)簽進(jìn)行描述,將用戶特征標(biāo)識(shí)出來。圖書館用戶畫像標(biāo)簽體系,基于高校圖書館用戶需求,用戶畫像標(biāo)簽首先需要包含讀者人口屬性,其中包括性別、專業(yè)、年級(jí)、身份類別(如教師或?qū)W生)。讀者心理屬性分為興趣屬性和社交屬性兩類。興趣屬性主要是指讀者線上和線下使用圖書館獲取文獻(xiàn)的偏好,涉及線上電子文獻(xiàn)的查詢、瀏覽、下載、閱讀和紙質(zhì)文獻(xiàn)查詢、借閱情況,包含電子書、論文、視頻和紙質(zhì)圖書與期刊。社交屬性主要是指讀者與圖書館相關(guān)事物的互動(dòng),如圖書館網(wǎng)站平臺(tái)的話題討論、微信公眾號(hào)發(fā)文的評(píng)論、相關(guān)學(xué)科內(nèi)容的關(guān)注與分享、圖書館推廣活動(dòng)的參與等。讀者行為屬性,主要是指讀者線上或線下使用圖書館的行為方式與特點(diǎn),如訪問的方式、訪問終端、經(jīng)常訪問的時(shí)間段、每次訪問耗用的時(shí)長、訪問的頻率等。構(gòu)建的高校圖書館用戶畫像標(biāo)簽體系,如圖1所示。
高校圖書館用戶畫像的構(gòu)建要遵循兩個(gè)原則:一是能夠代表讀者的全部特征,能夠?qū)⒆x者對(duì)圖書館資源的利用和圖書館服務(wù)的使用情況準(zhǔn)確地表述出來;二是能夠滿足高校圖書館業(yè)務(wù)需求,把圖書館開展的工作和服務(wù)所需的支持?jǐn)?shù)據(jù)盡可能全面涵蓋。構(gòu)建用戶畫像可按照以下流程進(jìn)行。
(1)基礎(chǔ)數(shù)據(jù)的采集。數(shù)據(jù)的獲取來源于圖書館管理系統(tǒng)、圖書館門禁系統(tǒng)、座位管理系統(tǒng)以及圖書館門戶網(wǎng)站的網(wǎng)絡(luò)日志等。圖書館管理系統(tǒng)保存讀者的基本信息,如專業(yè)、年級(jí)、年齡、性別、身份,還包括讀者借還書信息。圖書館門禁系統(tǒng)記錄了讀者入館頻次、入館時(shí)間及時(shí)長。座位管理系統(tǒng)記錄了讀者習(xí)慣使用的閱覽室、座位號(hào)、學(xué)習(xí)時(shí)間、頻次等。圖書館門戶網(wǎng)站記錄了讀者檢索、在線閱讀文獻(xiàn)、互動(dòng)留言等信息行為。涉及的讀者數(shù)據(jù)按照用戶畫像標(biāo)簽體系分為讀者人口屬性數(shù)據(jù)、讀者心理屬性數(shù)據(jù)、讀者行為屬性數(shù)據(jù),再根據(jù)這些特征對(duì)讀者進(jìn)行畫像。收集到的用戶畫像數(shù)據(jù)可分成兩類:一類是靜態(tài)數(shù)據(jù),另一類是動(dòng)態(tài)數(shù)據(jù)。不會(huì)實(shí)時(shí)變動(dòng)的數(shù)據(jù)是靜態(tài)數(shù)據(jù),如讀者人口屬性數(shù)據(jù),而會(huì)實(shí)時(shí)變動(dòng)的數(shù)據(jù)為動(dòng)態(tài)數(shù)據(jù),如讀者心理屬性數(shù)據(jù)、讀者行為屬性數(shù)據(jù)。根據(jù)用戶的靜態(tài)數(shù)據(jù)能夠了解用戶的基本需求,根據(jù)用戶的動(dòng)態(tài)數(shù)據(jù)可以為用戶提供精準(zhǔn)的個(gè)性化服務(wù)。
(2)數(shù)據(jù)預(yù)處理。其主要是對(duì)收集的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化和清洗,對(duì)存在噪聲和缺失、錯(cuò)誤、不規(guī)則的數(shù)據(jù),進(jìn)行清洗、去除、轉(zhuǎn)換等處理。由于高校圖書館的數(shù)據(jù)量很大,數(shù)據(jù)中包含很多冗余數(shù)據(jù),必須去除重復(fù)數(shù)據(jù)。
(3)用戶畫像構(gòu)建。用戶靜態(tài)數(shù)據(jù)主要來源于高校圖書館信息管理系統(tǒng)數(shù)據(jù)庫,從數(shù)據(jù)庫直接采集后,采用抽取、轉(zhuǎn)換、加載技術(shù)。而動(dòng)態(tài)數(shù)據(jù)是實(shí)時(shí)變化的,需要用權(quán)重來衡量數(shù)據(jù)的重要程度。根據(jù)用戶畫像標(biāo)簽體系,用一些較為成熟的大數(shù)據(jù)工具軟件構(gòu)建用戶畫像和畫像的權(quán)重。由于用戶畫像無法完全準(zhǔn)確地描述一個(gè)群體,要根據(jù)不斷變化的讀者數(shù)據(jù)進(jìn)行不斷的修改,更符合讀者的特征。
近年來,在高新技術(shù)的飛速發(fā)展下,高校圖書館逐漸向智慧圖書館轉(zhuǎn)型發(fā)展,要求圖書館服務(wù)更加個(gè)性化、精準(zhǔn)化、主動(dòng)化,服務(wù)內(nèi)容和服務(wù)方式也更加豐富多樣。將用戶畫像技術(shù)應(yīng)用到智慧圖書館的建設(shè)中,對(duì)資源精準(zhǔn)推薦、數(shù)據(jù)統(tǒng)計(jì)、館藏資源建設(shè)、學(xué)科服務(wù)等圖書館服務(wù)將會(huì)有很大幫助,從而更好的滿足讀者需求。
圖書館資源的精準(zhǔn)推薦,是指能夠按照高校師生的信息需求為讀者主動(dòng)推送館藏信息資源,包括館藏紙本圖書、期刊,電子圖書、期刊,數(shù)據(jù)庫信息等。以往無差別的資源推薦,對(duì)于圖書館來說往往是付出很多的勞動(dòng),但效果不理想。高校圖書館資源精準(zhǔn)推薦,對(duì)促進(jìn)高校閱讀推廣、提高資源利用率有重要的作用。
通過系統(tǒng)構(gòu)建師生用戶畫像,對(duì)圖書館讀者不同維度和不同層次的標(biāo)簽信息進(jìn)行組織與挖掘,將其與館藏資源包括館藏圖書和期刊相匹配,讀者人口屬性更能反映一類讀者的共性需求,讀者心理屬性和行為屬性更能體現(xiàn)每一讀者的個(gè)性需求,從而精準(zhǔn)地實(shí)現(xiàn)對(duì)讀者的資源推薦。在用戶畫像的技術(shù)支持下,圖書館能夠提高資源推薦的精準(zhǔn)性,促進(jìn)高校師生信息利用,為開展各項(xiàng)線下和線上閱讀推廣活動(dòng)提高成效。
高校圖書館每年都有較多的經(jīng)費(fèi)用于資源的采訪,對(duì)于一些經(jīng)費(fèi)不充足的高校,資金的利用率就顯得尤為重要。在每年圖書館資源采訪工作中,如何能將經(jīng)費(fèi)用在最能滿足師生需求的資源建設(shè)上,是各個(gè)高校資源建設(shè)方面都在深入研究的問題。
基于用戶畫像技術(shù),根據(jù)用戶人口屬性、心理屬性、行為屬性生成個(gè)人畫像和群體畫像,并對(duì)圖書信息資源按中圖法和學(xué)科進(jìn)行分類,對(duì)文獻(xiàn)信息資源和用戶數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、降噪,數(shù)據(jù)發(fā)掘、聚類等,最終結(jié)合本校圖書館采訪的基本方向和原則,將近幾年新出版的圖書信息資源和高校師生的畫像相匹配。以此在基于讀者資源需求、館藏資源利用率、學(xué)科建設(shè)需求的基礎(chǔ)上,為圖書采訪提供科學(xué)的、有依據(jù)的薦購。
高校教師承擔(dān)教學(xué)和科研的雙重任務(wù),科研往往是由團(tuán)隊(duì)合作來完成的,團(tuán)隊(duì)中的成員多數(shù)在人口屬性和興趣屬性上具有一定的相似性。與此同時(shí),每一個(gè)團(tuán)隊(duì)成員在讀者屬性、行為、偏好上也存在個(gè)體差異,從而有利于為不同的讀者制定不同的學(xué)科服務(wù)策略。
學(xué)校各個(gè)學(xué)科的重點(diǎn)研究領(lǐng)域,對(duì)研究團(tuán)隊(duì)及個(gè)人,在深入采集讀者屬性、行為、偏好數(shù)據(jù)的基礎(chǔ)上,通過數(shù)據(jù)挖掘與分析用戶數(shù)據(jù),構(gòu)建群體和個(gè)人用戶畫像,根據(jù)用戶畫像把握和預(yù)測(cè)用戶的科研興趣偏好,把握科研需求,分析用戶的研究領(lǐng)域熱點(diǎn)問題、研究趨勢(shì)、合作學(xué)者、學(xué)術(shù)影響力、研究成果分析等,并為科研團(tuán)隊(duì)成員推送個(gè)性化的科學(xué)情報(bào)服務(wù)。
用戶畫像能夠讓智慧圖書館掌握師生實(shí)際和潛在的信息需求特征,通過對(duì)圖書館業(yè)務(wù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,為圖書館未來發(fā)展決策提供支持和幫助。
例如,可以通過用戶畫像分析不同專業(yè)和年級(jí)的學(xué)生到圖書館進(jìn)行借閱、自習(xí)、參加讀者活動(dòng)、使用圖書館智慧空間等設(shè)施的需求;分析圖書館組織的各種讀者活動(dòng),每種活動(dòng)更吸引哪類讀者參與;按照學(xué)科對(duì)館藏資源進(jìn)行分類,分析用戶對(duì)各個(gè)學(xué)科的資源需求等。基于用戶畫像,智慧圖書館讀者需求得以全面呈現(xiàn),各項(xiàng)服務(wù)向精準(zhǔn)化發(fā)展,并為未來圖書館工作與發(fā)展提供方向指引,促進(jìn)圖書館服務(wù)水平和讀者滿意度的不斷提升。
當(dāng)前,各地高校圖書館逐漸向智慧圖書館轉(zhuǎn)型發(fā)展,從設(shè)備、技術(shù)、服務(wù)等方面進(jìn)行探索和實(shí)踐,為讀者提供更加智慧化的圖書館服務(wù)。從用戶畫像角度,深入結(jié)合圖書館工作內(nèi)容,探討通過提高服務(wù)精準(zhǔn)性來實(shí)現(xiàn)高校圖書館智慧服務(wù)的方法和策略,對(duì)提升高校圖書館服務(wù)水平和向智慧圖書館轉(zhuǎn)型發(fā)展有重要的理論與實(shí)踐意義。