陳劍 江中君 伍乙生
摘要:大數(shù)據(jù)時(shí)代的來(lái)臨,圖書館的服務(wù)模式也可能會(huì)出現(xiàn)的新的改變。將大數(shù)據(jù)的理念、大數(shù)據(jù)技術(shù)引入高校圖書館的資源評(píng)價(jià)、資源選擇和綜合管理中,建立大數(shù)據(jù)環(huán)境下的讀者服務(wù)體系,以便更好地服務(wù)讀者,特別是提升對(duì)專業(yè)讀者的服務(wù)。該文通過(guò)運(yùn)用大數(shù)據(jù)標(biāo)簽技術(shù),通過(guò)對(duì)專業(yè)讀者進(jìn)行“讀者畫像”,構(gòu)建數(shù)據(jù)挖掘模型,通過(guò)讀者專業(yè)分析、讀者借閱圖書喜好分析,對(duì)讀者推送個(gè)性化的借書指導(dǎo),并指導(dǎo)制定書籍采購(gòu)計(jì)劃、優(yōu)化書庫(kù)管理,提升圖書館服務(wù)品質(zhì)。
關(guān)鍵詞:高校圖書館;大數(shù)據(jù)技術(shù);客戶畫像;專業(yè)讀者;服務(wù)水平
中圖分類號(hào):F49 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)34-0215-02
隨著信息化時(shí)代的全面來(lái)臨,電子書籍與紙質(zhì)書籍的種類、數(shù)量都呈現(xiàn)爆發(fā)式增長(zhǎng)。同時(shí),隨著社會(huì)精細(xì)化分工的加劇,尤其是專業(yè)領(lǐng)域工作的超細(xì)分,專業(yè)讀者的數(shù)量急劇增加。圖書館作為讀者獲取知識(shí)點(diǎn)重要信息庫(kù),尤其是專業(yè)讀者獲取最新技術(shù)信息、科研成果的重要窗口,如何提升對(duì)讀者,特別是專業(yè)讀者的精細(xì)化服務(wù),是當(dāng)前圖書館品質(zhì)服務(wù)提升的關(guān)鍵部分。作為信息提供方,如何為專業(yè)讀者提供高品質(zhì)的圖書及期刊資源、避免專業(yè)讀者被海量的信息淹沒(méi)是服務(wù)核心。隨著大數(shù)據(jù)技術(shù)的產(chǎn)生和應(yīng)用,給圖書館工作提出了新的課題,傳統(tǒng)的IT架構(gòu)被改變、數(shù)據(jù)存儲(chǔ)方式被打破,圖書館要適應(yīng)信息生態(tài)的變化,需要運(yùn)用大數(shù)據(jù)技術(shù)研究用戶在新信息環(huán)境下的閱讀需求,提供更具個(gè)性化的知識(shí)服務(wù)。[1]本校圖書館通過(guò)運(yùn)用大數(shù)據(jù)技術(shù)中的“客戶畫像”技術(shù),根據(jù)預(yù)約圖書、借閱圖書及日常在圖書館網(wǎng)站上下載期刊的習(xí)慣,構(gòu)建“讀者畫像”,利用數(shù)據(jù)挖掘技術(shù)為讀者提供個(gè)性化服務(wù)[2],特別是為專業(yè)讀者推送高質(zhì)量的專業(yè)書籍,及時(shí)滿足讀者的需求。通過(guò)上述實(shí)踐,不但最大限度地滿足了讀者需求,而且也使圖書館圖書充分發(fā)揮了價(jià)值。通過(guò)應(yīng)用大數(shù)據(jù),既更好地服務(wù)了專業(yè)讀者,也提升了高校圖書館信息化水平。
1讀者畫像技術(shù)簡(jiǎn)介
什么是讀者畫像?讀者畫像是通過(guò)對(duì)讀者借閱書籍歸類、讀者職業(yè)分析、讀者借閱時(shí)長(zhǎng)及讀者在期刊上發(fā)表文章等信息進(jìn)行采集,通過(guò)打標(biāo)簽的方式描述出讀者的使用喜好。喜好使用多個(gè)讀者標(biāo)簽來(lái)組合,通過(guò)多標(biāo)簽組合,就形象地描繪出讀者的借閱喜好和研究喜好,更方便地為讀者進(jìn)行推薦。
為使計(jì)算機(jī)容易處理相關(guān)信息,我們要對(duì)讀者進(jìn)行打標(biāo)簽,這是圖書館讀者畫像工作中非常有必要的一環(huán),舉例,我們可做專業(yè)讀者分類的分類情況和專業(yè)讀者最喜歡的書有哪些等之類的分類和統(tǒng)計(jì)工作。接下來(lái),進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行挖掘分析:如研究臨床醫(yī)學(xué)的學(xué)者喜歡的期刊有哪些?這個(gè)可以通過(guò)關(guān)聯(lián)規(guī)則進(jìn)行計(jì)算和分析;研究臨床醫(yī)學(xué)的學(xué)者每周在圖書館的停留時(shí)間多久?這個(gè)可以通過(guò)聚類算法進(jìn)行計(jì)算和分析。大數(shù)據(jù)技術(shù)的實(shí)質(zhì)就是依靠計(jì)算機(jī)進(jìn)行計(jì)算,如何能讓計(jì)算機(jī)可以“懂人”,標(biāo)簽就是其中一種能使計(jì)算機(jī)可以程序化分析和處理相關(guān)信息的工具,再通過(guò)特定的數(shù)學(xué)建模和智能算法,讓計(jì)算機(jī)更加“懂人”。在計(jì)算機(jī)擁有“理解”人的技能后,就能對(duì)讀者,特別是專業(yè)讀者進(jìn)行貼心服務(wù)。
2讀者畫像技術(shù)詳細(xì)描述
運(yùn)用讀者畫像技術(shù),包括讀者信息采集、數(shù)據(jù)源分析、目標(biāo)分析、數(shù)據(jù)建模[3]、信息輸出五個(gè)步驟,以下詳細(xì)說(shuō)明。
2.1信息采集
信息采集是讀者畫像的第一步,信息采集的優(yōu)劣直接影響讀者畫像的準(zhǔn)確度。在進(jìn)行信息采集前,本校圖書館使用“專家評(píng)價(jià)法”并結(jié)合簡(jiǎn)單數(shù)據(jù)分析輸出了具體采集明細(xì)。專家評(píng)價(jià)法通過(guò)頭腦風(fēng)暴活動(dòng),采集到讀者畫像最重要的信息。例如:讀者的基本信息;檢索查詢、借閱記錄;館藏資源的使用頻率、使用方式及使用種類;讀者二次借閱圖書的時(shí)間間隔等。確定采集信息種類后,對(duì)這些信息進(jìn)行整合處理,形成客戶畫像分析數(shù)據(jù)源。
2.2數(shù)據(jù)源分析
構(gòu)建用戶畫像是為了還原用戶信息[3]。我們可以通過(guò)一種封閉性的分類方式來(lái)對(duì)讀者相關(guān)數(shù)據(jù)進(jìn)行分類,例如,對(duì)讀者可以分成兩類,第一類是學(xué)醫(yī)的,第二類是不學(xué)醫(yī)的;讀者分兩類:專業(yè)讀者和業(yè)務(wù)讀者。這樣對(duì)讀者進(jìn)行分類,能在后面不斷通過(guò)枚舉和迭代,從而填補(bǔ)和完善不完整的信息維度。從而減少因?qū)軜?gòu)上各層的分類沒(méi)有考慮周到而導(dǎo)致的維度缺漏,從而造成的可擴(kuò)展性的隱患。同時(shí),在選擇分類方式時(shí),要堅(jiān)持按需劃分的原則,可以根據(jù)業(yè)務(wù)和應(yīng)用場(chǎng)景的不同,選擇合適的分類方式。
在對(duì)讀者進(jìn)行畫像時(shí),可以把讀者數(shù)據(jù)分為兩類,動(dòng)態(tài)和靜態(tài)信息數(shù)據(jù)。
1)靜態(tài)信息數(shù)據(jù)
靜態(tài)信息數(shù)據(jù)是指讀者數(shù)據(jù)中人口自身屬性和閱讀屬性等能自成標(biāo)簽的信息,這些信息是不用通過(guò)建模和預(yù)測(cè)的,是真實(shí)存在的信息,只需要執(zhí)行數(shù)據(jù)清洗就可以。
2)動(dòng)態(tài)信息數(shù)據(jù)
讀者不斷變化的行為信息[4],廣義上講,一位讀者去了一趟圖書館,去之前在手機(jī)上查詢了需要借閱的期刊;讀者到圖書館尋找借閱到了期刊,借閱過(guò)程中又將相鄰的圖書借閱了一本;參考這些期刊,讀者發(fā)表了一篇論文。諸如此均可看作讀者的動(dòng)態(tài)信息數(shù)據(jù)。
2.3目標(biāo)分析
通過(guò)分析每個(gè)讀者的行為,并最終為每個(gè)讀者打上相應(yīng)標(biāo)簽及標(biāo)簽對(duì)應(yīng)的權(quán)重,這是為讀者畫像的目的。如,運(yùn)動(dòng)愛(ài)好者0.6、醫(yī)學(xué)工作者 0.8等。
什么是標(biāo)簽,標(biāo)簽表征了相應(yīng)的內(nèi)容,例如讀者對(duì)這個(gè)內(nèi)容是否有偏好和需求、是否有興趣等。
什么是權(quán)重,權(quán)重是通過(guò)指數(shù)來(lái)對(duì)可信度進(jìn)行量化,在對(duì)讀者畫像時(shí),是用來(lái)表征讀者用戶偏好和興趣的程度。
2.4數(shù)據(jù)建模
通過(guò)數(shù)據(jù)挖掘可以將采集后的數(shù)據(jù)進(jìn)行信息提煉,形成目標(biāo)知識(shí)信息。數(shù)據(jù)建模是根據(jù)對(duì)信息的分析,通過(guò)運(yùn)用數(shù)據(jù)模型,匹配讀者標(biāo)簽,發(fā)現(xiàn)信息之間的關(guān)聯(lián),為指導(dǎo)圖書館精準(zhǔn)讀者服務(wù)提供科學(xué)依據(jù)。圖書館讀者標(biāo)簽分析,常用的建模手段包括關(guān)聯(lián)分析建模、分類分析建模、聚類分析建模、序列分析建模等方式。其中,關(guān)聯(lián)分析建模最為常用。通過(guò)對(duì)讀者的靜態(tài)信息和動(dòng)態(tài)使用行為進(jìn)行關(guān)聯(lián)分析,運(yùn)用關(guān)聯(lián)規(guī)則(表現(xiàn)為標(biāo)簽之間的關(guān)聯(lián)規(guī)則,通常由貝葉斯分析和Apriori算法構(gòu)成),能夠協(xié)助圖書館管理者發(fā)現(xiàn)讀者與圖書、圖書與圖書、圖書與期刊、圖書大類之間的關(guān)系,并有效區(qū)分專業(yè)讀者和業(yè)余讀者。通過(guò)采用標(biāo)簽關(guān)聯(lián)分析,將讀者群體細(xì)分以清晰把握不同讀者群體間的信息需求,特別是專業(yè)讀者的信息需求。通過(guò)對(duì)讀者文獻(xiàn)需求的資源利用情況和讀者活躍度進(jìn)行關(guān)聯(lián)分析,合理優(yōu)化圖書館館藏資源配置,為讀者提供個(gè)性化的資源信息服務(wù),提升圖書館信息技術(shù)服務(wù)水平。
2.5信息輸出
信息輸出作為最終服務(wù)客戶的目標(biāo)指導(dǎo),通過(guò)運(yùn)用現(xiàn)代信息技術(shù),有不同的信息展現(xiàn)方式。
1)通過(guò)讀者個(gè)性化頁(yè)面進(jìn)行信息輸出。對(duì)于在圖書館借閱網(wǎng)上注冊(cè)的讀者,設(shè)置讀者個(gè)性化推薦專區(qū)。為讀者推薦感興趣的數(shù)據(jù),發(fā)表的文章等信息。
2)通過(guò)手機(jī)等智能終端進(jìn)行信息輸出。主要服務(wù)專業(yè)讀者,讀者可以在智能終端設(shè)置書籍或期刊需求,當(dāng)圖書館期刊到貨后,就能通過(guò)推送短信或App信息等方式提醒讀者,便于讀者第一時(shí)間就能查閱、借閱到相關(guān)資料。
3基于畫像技術(shù)的服務(wù)優(yōu)化措施
通過(guò)對(duì)圖書館資料倉(cāng)庫(kù)中的海量信息進(jìn)行梳理和挖掘,并運(yùn)用讀者畫像技術(shù)進(jìn)行精準(zhǔn)推薦,在高校圖書館的應(yīng)用范疇有以下幾個(gè)方面。
3.1個(gè)性化圖書、期刊推薦
圖書、期刊推薦是圖書館為讀者提供個(gè)性化服務(wù)的重要舉措,尤其是在信息爆發(fā)的時(shí)代,讀者選擇圖書往往不知所措,這就需要圖書館針對(duì)讀者的具體情況進(jìn)行精準(zhǔn)推薦。圖書館運(yùn)用客戶畫像和數(shù)據(jù)挖掘技術(shù),對(duì)讀者的借閱經(jīng)歷、職業(yè)背景、發(fā)表文章、閱讀興趣等進(jìn)行分析,向其推薦相關(guān)專題或?qū)I(yè)領(lǐng)域的最新資料。同時(shí),運(yùn)用數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則方法,為讀者檢索相關(guān)聯(lián)的借閱信息。例如,當(dāng)讀者借閱“心臟病學(xué)”相關(guān)的圖書時(shí),還能根據(jù)讀者身份,為讀者推薦“借閱過(guò)該圖書的會(huì)員還借閱了“心臟危重癥處理原則”之類的信息。從而節(jié)約讀者的時(shí)間和精力。 此外,對(duì)于業(yè)務(wù)讀者或缺少專業(yè)檢索學(xué)習(xí)的讀者來(lái)說(shuō),在面對(duì)浩瀚的圖書資源時(shí),這種方式可以有效地解決讀者“選什么,讀什么”的困惑。從而最大限度地提升讀者的閱讀水準(zhǔn),充分發(fā)揮圖書館的圖書價(jià)值。
3.2優(yōu)化圖書管理及采購(gòu)工作
傳統(tǒng)的圖書采購(gòu)工作主要采用“專家評(píng)判法”和“出版社推薦法”,采購(gòu)缺失讀者喜好反饋。由于讀者的多樣性,而館內(nèi)專家的知識(shí)范圍往往不能覆蓋所有讀者,因此這種采購(gòu)計(jì)劃容易受到專家主觀意識(shí)的判斷,采購(gòu)的圖書不能滿足讀者的需要。本校圖書館將讀者使用行為和客戶畫像標(biāo)簽融入圖書采購(gòu)過(guò)程中去。通過(guò)對(duì)讀者使用行為和專業(yè)進(jìn)行分析,及時(shí)補(bǔ)充專家評(píng)判法未能納入的圖書采購(gòu)需求。通過(guò)上述方法,圖書采購(gòu)就獲得了精準(zhǔn)的采購(gòu)需求,進(jìn)行有針對(duì)性的補(bǔ)充圖書并增加館藏復(fù)本。
針對(duì)圖書管理,目前多按照中圖分類法進(jìn)行圖書上架管理。由于藏書量大、種類繁多,對(duì)中圖分類法不是很熟悉的讀者尋找圖書往往比較困難。同樣,我們運(yùn)用數(shù)據(jù)挖掘方法和客戶畫像方式,對(duì)上架提數(shù)的借閱量變化趨勢(shì)、購(gòu)置時(shí)間和客戶借閱熱度進(jìn)行分析通過(guò)預(yù)留架位來(lái)避免頻繁倒架,將熱門書籍前置等方式進(jìn)行改善。從而減少了管理員不必要的工作量[5],同時(shí)優(yōu)化了讀者借閱體驗(yàn)。
4結(jié)束語(yǔ)
大數(shù)據(jù)時(shí)代,信息量的持續(xù)爆發(fā),讀者的多樣性都考驗(yàn)著圖書館的管理水平。圖書館想在大數(shù)據(jù)時(shí)代有所作為,需在對(duì)形勢(shì)有清醒的認(rèn)識(shí)基礎(chǔ)上,利用大數(shù)據(jù)創(chuàng)新圖書館服務(wù),提升圖書館的核心競(jìng)爭(zhēng)力[6]。本校圖書館審時(shí)度勢(shì),通過(guò)對(duì)讀者進(jìn)行客戶畫像,并引進(jìn)讀者標(biāo)簽,運(yùn)用數(shù)據(jù)挖掘理論不斷優(yōu)化圖書館信息化管理水平,提升讀者閱讀體驗(yàn),取得了較好的成果。可以預(yù)見(jiàn)的是,隨著大數(shù)據(jù)技術(shù)的不斷成熟,未來(lái)圖書館管理工作必將越來(lái)越精細(xì),讀者體驗(yàn)將不斷提升,這也將成為圖書館讀者服務(wù)工作中的重要手段和方法。
參考文獻(xiàn):
[1] 王玫.大數(shù)據(jù)在圖書館的應(yīng)用研究[J].圖書館學(xué)刊,2016,38(10):49-50.
[2] 宋麗花.數(shù)據(jù)挖掘技術(shù)在讀者服務(wù)優(yōu)化中的應(yīng)用[J].現(xiàn)代商貿(mào)工業(yè),2013,25(23):164-165.
[3] 錢露.基于iOS平臺(tái)的小型社交網(wǎng)絡(luò)的關(guān)鍵技術(shù)研究[D].北京:北京郵電大學(xué),2015:33.
[4] 席巖.基于大數(shù)據(jù)的用戶畫像方法研究綜述[C].第25屆媒體融合技術(shù)研討會(huì),2017.
[5] 游茂,劉立.以健康檔案為核心的社區(qū)衛(wèi)生服務(wù)外部數(shù)據(jù)交換方式探討[J].中國(guó)衛(wèi)生經(jīng)濟(jì),2009,28(10):62-65.
[6] 韓翠峰.大數(shù)據(jù)時(shí)代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.
【通聯(lián)編輯:謝媛媛】