亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向精準(zhǔn)服務(wù)的圖書館用戶畫像研究

        2021-11-10 09:46:28曹樹金岳文玉
        關(guān)鍵詞:畫像咨詢書籍

        曹樹金,岳文玉

        (中山大學(xué)信息管理學(xué)院,廣州 510006)

        1 引言

        在大數(shù)據(jù)智能化時代,信息技術(shù)的發(fā)展和社會需求的變化,為圖書館的服務(wù)創(chuàng)新提供了新技術(shù)和新思路。近年來,以人為本的服務(wù)理念成為當(dāng)代圖書館的重要議題[1],圖書情報領(lǐng)域的學(xué)者和工作人員越來越關(guān)注以用戶個性化需求為導(dǎo)向的圖書館精準(zhǔn)化服務(wù)水平的提升。圖書館既是海量信息資源的平臺,又產(chǎn)生各類大數(shù)據(jù)(包括業(yè)務(wù)數(shù)據(jù)、讀者軌跡數(shù)據(jù)、交互數(shù)據(jù)等),如何組織、管理和利用讀者數(shù)據(jù),準(zhǔn)確分析和預(yù)測讀者需求,使之應(yīng)用于圖書館的精準(zhǔn)化服務(wù)是當(dāng)前亟需解決的問題之一。

        讀者畫像利用各類用戶數(shù)據(jù)實現(xiàn)用戶屬性特征的揭示和組織,為圖書館的精準(zhǔn)化服務(wù)研究提供了具象化結(jié)果。本文從圖書館的多維度用戶數(shù)據(jù)出發(fā),選取某市圖書館的讀者作為研究對象,通過收集讀者的個人基本數(shù)據(jù)、借閱數(shù)據(jù)和讀者與客服在線問答過程中產(chǎn)生的各類交互數(shù)據(jù)為其構(gòu)建讀者畫像,挖掘讀者的現(xiàn)實需求及潛在需求,為精準(zhǔn)推薦和服務(wù)提供有效的科學(xué)依據(jù),提升圖書館服務(wù)的個性化與智慧化水平。

        2 相關(guān)研究

        2.1 圖書館精準(zhǔn)服務(wù)的相關(guān)研究

        當(dāng)前關(guān)于精準(zhǔn)服務(wù)比較有代表性的概念是:精準(zhǔn)服務(wù)是以用戶為導(dǎo)向的強(qiáng)調(diào)依據(jù)用戶個性化需求配置資源的服務(wù)模式[2]。在大數(shù)據(jù)時代,新思維和新技術(shù)推動圖書館服務(wù)模式創(chuàng)新并促進(jìn)圖書館服務(wù)能力提升[3]。為順應(yīng)大數(shù)據(jù)給圖書館信息服務(wù)帶來的影響,學(xué)者們紛紛就圖書館服務(wù)轉(zhuǎn)型提出了不同的見解。SIGUENZAGUZMAN 等[4]認(rèn)為,大數(shù)據(jù)技術(shù)為針對館藏開展個性化推薦與服務(wù)方面提供更多的可能性。利用數(shù)據(jù)挖掘和文獻(xiàn)計量工具對圖書館服務(wù)中產(chǎn)生的數(shù)據(jù)進(jìn)行處理和分析,輔助圖書館決策和評估服務(wù)[5]。此外,還有學(xué)者利用數(shù)據(jù)挖掘技術(shù)對圖書館收集的各種數(shù)據(jù)集進(jìn)行數(shù)字圖書館服務(wù)推薦[6,7]、圖書館服務(wù)質(zhì)量指標(biāo)[8]、圖書館的利用模式及對用戶的影響[9]、社交媒體關(guān)注者的組成及特征[10]等進(jìn)行研究。有不少學(xué)者探討了圖書館應(yīng)用大數(shù)據(jù)技術(shù)將對圖書館管理和服務(wù)模式具有重要影響。如蘇新寧[11]、陳傳夫等[12]、王云等[13]均強(qiáng)調(diào)了利用大數(shù)據(jù)技術(shù)進(jìn)行圖書館管理和服務(wù)轉(zhuǎn)型的重要性。

        2.2 用戶畫像及其在圖書館服務(wù)中的應(yīng)用

        用戶畫像是基于用戶的直接數(shù)據(jù)和間接數(shù)據(jù)建立的目標(biāo)用戶模型[14]。目前用戶畫像在模型構(gòu)建[15,16]、指標(biāo)體系[17,18]、方法應(yīng)用[19,20]等方面已有了大量研究。在圖書情報領(lǐng)域,學(xué)者們也展開了大量的研究,WU 等[21]基于用戶興趣和社交關(guān)系提出了一種共同演化模型以描述用戶畫像;曾群等[22]在構(gòu)建用戶畫像庫的基礎(chǔ)上,為不同類型的讀者制定個性化服務(wù);畢達(dá)天[23]基于空間向量模型,構(gòu)建移動圖書館的用戶畫像模型;ZAUGG[24]依據(jù)不同類別用戶群體的需求和行為的不同構(gòu)建用戶畫像。程秀峰等[25]從自然、情境等維度構(gòu)建了用戶畫像的指標(biāo)體系和智慧參考服務(wù)模式。

        2.3 基于短文本主題挖掘的LDA 建模研究

        進(jìn)行主題建模時常用的方法包括BTM[26,27](Biterm Topic Model)、狄利克雷多項式混合模型DMM[28]、word2vec[29]以及LDA[30]等。

        LDA 模型多用于處理海量的長文本數(shù)據(jù),交互式短文本由于內(nèi)容簡短和交互性強(qiáng)的特點,導(dǎo)致其在主題挖掘過程中的文本矩陣過于稀疏而無法分析,為了解決這一問題,學(xué)者們一般采用擴(kuò)充文本長度的方法進(jìn)行處理。部分學(xué)者通過引入外部數(shù)據(jù)集的方法進(jìn)行文本長度的擴(kuò)充,如引入外部搜索數(shù)據(jù)[31,32]、對短文本進(jìn)行定義和分類[33]等,但這種文本長度的擴(kuò)充方法在匹配合理性方面存在一定的障礙。因此,為了避免引入外部數(shù)據(jù)的弊端,部分學(xué)者采取了句子集群合并的方法。HONG[34]等通過拼接微博文本的方法,對微博文本進(jìn)行處理;NAKATA 等[35]將同一時間段出現(xiàn)的文本進(jìn)行合并,通過計算文本集合與主題的關(guān)聯(lián)度分析句子類型。上述學(xué)者從源文本角度進(jìn)行句子集群合并有效解決文本簡短導(dǎo)致的無法分析的障礙。

        目前,圖書館領(lǐng)域?qū)ψx者畫像的研究多以理論研究為主,而且屬性偏單一,不能對用戶進(jìn)行全面多維的描述。因此本文通過收集讀者的個人基本數(shù)據(jù)、借閱數(shù)據(jù)和讀者與客服在線問答過程中產(chǎn)生的各類交互數(shù)據(jù)為其構(gòu)建讀者畫像;在采用LDA 模型進(jìn)行主題分析時,采用會話切分的方式擴(kuò)充文本長度,解決文本簡短導(dǎo)致的矩陣過于稀疏而無法分析的問題。

        3 讀者畫像及其群像構(gòu)建的研究設(shè)計

        3.1 圖書館讀者畫像建??傮w框架

        圖書館讀者畫像主要對讀者借閱數(shù)據(jù)和在線交互數(shù)據(jù)進(jìn)行挖掘,深度揭示讀者需求?;赥F-IDF 算法和LDA 建模方法進(jìn)行讀者畫像總體框架的構(gòu)建。構(gòu)建讀者畫像的流程主要包括數(shù)據(jù)收集處理、單個/群體特征分析及讀者畫像這3 個過程,如圖1 所示。

        圖1 讀者畫像構(gòu)建總體框架Fig.1 The framework of reader profile construction

        3.2 研究方法與步驟

        在數(shù)據(jù)采集處理階段,為提高實驗結(jié)果準(zhǔn)確性,對采集到的文本數(shù)據(jù)進(jìn)行預(yù)處理。對在線咨詢交互文本進(jìn)行會話切分,并采用ICTCLAS 分詞工具進(jìn)行漢語分詞處理,添加用戶自定義詞典,再通過去停用詞和詞性篩選等流程,過濾文本中對分析沒有意義的部分。這一部分工作的目的在于將讀者借閱數(shù)據(jù)和在線交互數(shù)據(jù)轉(zhuǎn)化為能夠進(jìn)行主題建模的標(biāo)準(zhǔn)語料庫以提取讀者特征,降低模型計算的復(fù)雜度,提升模型的運(yùn)行效率,提高用戶特征標(biāo)簽的可解釋性。

        讀者畫像的構(gòu)建分為單個讀者畫像的構(gòu)建和群體讀者畫像的構(gòu)建兩個部分。主要采用TF-IDF 算法和LDA 模型對讀者畫像進(jìn)行文本特征分析。TF-IDF 可以用來評估一個字詞在一個語料庫中的重要程度,詞的重要性隨著它在文件中出現(xiàn)的次數(shù)增加而增加,但與它在語料庫中的出現(xiàn)頻率成反比,TF 表示字詞的頻率,IDF 表示逆文本頻率,TF 值和IDF 值相乘得到TF-IDF 值,具有較高詞頻和較低逆文本頻率的詞可作為該文檔的代表標(biāo)簽[36,37]。LDA 主題生成模型是三層貝葉斯概率模型,其生成主題詞的具體過程為面向語料庫中的文檔,從主題分布中抽取一個主題,并在該主題中抽取主題詞,直至遍歷所有文檔中的詞,形成從文本-主題-詞的多項式分布。計算每個詞在一篇文檔中出現(xiàn)的概率[38]公式為:p(特征詞| 文檔)=∑主題p(特征詞| 主題) ×p(主題| 文檔)。將LDA 模型運(yùn)用于交互文本主題的挖掘可以實現(xiàn)基于語義層面的文本建模。通過TF-IDF 算法尋找代表文本內(nèi)容的關(guān)鍵詞,實現(xiàn)對讀者文本數(shù)據(jù)的有效挖掘,分析出讀者偏好。LDA 主題模型可以排除主觀因素的影響,挖掘出各主題中相關(guān)詞項。

        單個讀者畫像需要基于讀者的所有數(shù)據(jù)進(jìn)行標(biāo)簽化。采用TF-IDF 算法對單個讀者畫像進(jìn)行借閱書籍文本特征和在線咨詢文本特征分析,構(gòu)建單個讀者畫像,并依據(jù)該畫像制定精準(zhǔn)化信息服務(wù)。群體讀者畫像的構(gòu)建,從性別、年齡和咨詢活躍度3 個不同的維度對讀者進(jìn)行分類,采用TF-IDF 算法對不同群體用戶進(jìn)行借閱書籍文本特征分析以及采用LDA 模型對不同群體在線交互文本進(jìn)行主題提取,同時對比不同維度讀者群體的交互數(shù)據(jù)文本特征以及借閱書籍文本特征,根據(jù)多視角聚類結(jié)果,更加精準(zhǔn)的給不同群體讀者進(jìn)行推薦和服務(wù)。

        需要說明的是,圖書館為了給讀者提供個性化精準(zhǔn)服務(wù),需要對海量的讀者個人信息、借閱偏好、交互記錄進(jìn)行充分的挖掘,這必然會涉及到用戶的隱私問題。因此,在進(jìn)行數(shù)據(jù)處理的過程中,需要保障讀者的知情權(quán)和選擇權(quán),降低對讀者個人隱私數(shù)據(jù)的關(guān)注度,禁止隱私數(shù)據(jù)的過度挖掘。同時,圖書館用戶數(shù)據(jù)的相關(guān)管理人員需要形成良好的職業(yè)道德修養(yǎng),保障讀者隱私數(shù)據(jù)不受侵犯。

        4 讀者畫像及其群像的構(gòu)建研究

        4.1 數(shù)據(jù)的收集和預(yù)處理

        數(shù)據(jù)主要由某市圖書館的讀者借閱和在線咨詢行為產(chǎn)生,這里按照數(shù)據(jù)所在維度的不同,分為讀者維度數(shù)據(jù)、圖書借閱維度和在線咨詢的數(shù)據(jù)。讀者維度數(shù)據(jù)集主要是反映讀者個人基本屬性的數(shù)據(jù),如讀者編號、性別、年齡、辦證日期等;圖書借閱數(shù)據(jù)主要收集了書名、作者以及借閱時間;讀者在線咨詢的數(shù)據(jù)主要包括咨詢時間、咨詢內(nèi)容。具體讀者畫像數(shù)據(jù)集包含的數(shù)據(jù)類型詳見圖2。

        圖2 讀者畫像數(shù)據(jù)集Fig.2 Reader profile data set

        本研究收集某市圖書館2019 年5 月15 日到2020年6 月04 日的數(shù)據(jù),包括300 名讀者的在線咨詢交互數(shù)據(jù)1 809 條以及圖書借閱數(shù)據(jù)168 217 條。在數(shù)據(jù)預(yù)處理階段,利用ICTCLAS 分詞工具將會話文本轉(zhuǎn)化為多個詞向量,添加用戶自定義詞典,并依據(jù)停用詞典過濾掉高頻無意義的助詞、介詞以及標(biāo)點符號,如“謝謝”“好的”“個”等,通過規(guī)范數(shù)據(jù)格式和去除冗余數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理和清洗以保證數(shù)據(jù)質(zhì)量。經(jīng)過預(yù)處理,本文最終保留了292 名有效讀者的1 801 條在線咨詢交互數(shù)據(jù)和圖書借閱數(shù)據(jù)14 609 條。對在線咨詢文本進(jìn)行會話切分,即按照會話交互的時間間隔進(jìn)行文本合并,形成多集合的文本數(shù)據(jù)。再對這些文本進(jìn)行分詞處理、添加用戶自定義詞典以及停用詞過濾,使得文本結(jié)構(gòu)符合LDA 模型的分析要求。

        4.2 單個讀者畫像構(gòu)建

        單個讀者畫像需要基于讀者的所有數(shù)據(jù)進(jìn)行標(biāo)簽化。通過標(biāo)簽化實現(xiàn)對讀者的特征揭示,并為后續(xù)的數(shù)據(jù)挖掘工作進(jìn)行鋪墊。表1 和表2 給出了某讀者在借還書以及在線咨詢過程中產(chǎn)生的主要數(shù)據(jù)。

        表1 某讀者借閱數(shù)據(jù)示例(部分)Table 1 An example of a reader's borrowing data(part)

        表2 某讀者在線咨詢數(shù)據(jù)示例Table 2 An example of online consultation data of a reader

        對該讀者借閱書籍?dāng)?shù)據(jù)以及在線咨詢文本數(shù)據(jù)進(jìn)行特征分析,即對這些數(shù)據(jù)進(jìn)行向量化表示,向量的每一維由特征項及其權(quán)重組成,權(quán)重用TF-IDF 的方法來計算,計算公式如下:

        其中w(ti,d)是ti的權(quán)重,d為全部信息數(shù)據(jù)的集合,tf(ti,d)為ti在全部信息數(shù)據(jù)中的詞頻,N為全部信息數(shù)據(jù)的總數(shù),ni是數(shù)據(jù)集中出現(xiàn)ti的文本數(shù)量。輸出該讀者借閱書籍文本特征以及在線咨詢文本特征,為讀者實現(xiàn)精準(zhǔn)化的信息服務(wù)提供依據(jù)。

        該讀者的借閱書籍文本特征和在線咨詢文本特征如圖3 和圖4 所示,圖中字體的大小和粗細(xì)反應(yīng)重要程度的高低。讀者個人畫像示例及讀者分析報告如圖5、表3 所示。

        表3 單個讀者分析報告Table 3 Single reader analysis report

        圖3 讀者借閱書籍文本特征Fig.3 Text features of books borrowed by readers

        圖4 讀者在線咨詢交互文本特征Fig.4 Interactive text features of readers'online consultation

        圖5 個人讀者畫像示例Fig.5 An example of reader profile

        4.3 多維度群體讀者畫像構(gòu)建與分析

        單個讀者畫像可以全面地揭示出某個獨立讀者的特征,但在圖書館具體的精準(zhǔn)化信息服務(wù)中,還需要對不同類型群體的讀者屬性進(jìn)行研究。用戶群體畫像的研究目的就是為了了解各類群體內(nèi)某些共同的特征和需求,從不同的維度對讀者進(jìn)行分類,能夠更加精準(zhǔn)的為讀者進(jìn)行推薦和服務(wù),同時對比不同維度的讀者的交互數(shù)據(jù)文本特征以及借閱書籍文本特征,能夠有效的借鑒數(shù)據(jù),在用戶群體內(nèi)總結(jié)提煉出共性指標(biāo)作為推薦的依據(jù),有助于更好地了解讀者,進(jìn)而能夠幫助圖書館為讀者提供精準(zhǔn)服務(wù)。為了更好地掌握不同維度的讀者特征,下面將從讀者咨詢活躍度維度、

        年齡維度、性別維度對讀者畫像進(jìn)行分析。

        4.3.1 讀者咨詢活躍度維度分析

        讀者咨詢活躍度最直觀的表現(xiàn)了讀者對圖書館的需求,將讀者咨詢活躍度t定義為在一段時間內(nèi)讀者的在線咨詢次數(shù),通過統(tǒng)計在同一周期內(nèi)讀者的在線咨詢次數(shù)將讀者進(jìn)行分層?;谕恢芷趦?nèi)訪問次數(shù)計算出平均值A(chǔ)之后,將訪問次數(shù)大于0 次并小于0.5A的讀者定義為低咨詢活躍度,訪問次數(shù)大于0.5A小于A的讀者定義為中咨詢活躍度,將訪問次數(shù)大于A的讀者定義為高咨詢活躍度。得到咨詢活躍度范圍定級表,如表4 所示。

        表4 咨詢活躍度范圍定級表Table 4 Activity range grading table

        依據(jù)咨詢活躍度等級將292 名讀者劃分為3 個讀者群體,分析這3 個群體借閱書籍文本特征,并結(jié)合讀者在線交互數(shù)據(jù)揭示不同群體讀者屬性特征,為其實現(xiàn)更為精準(zhǔn)化的信息服務(wù)。

        低咨詢活躍度讀者群、中咨詢活躍度讀者群以及高咨詢活躍度讀者群的借閱書籍文本特征如圖6、圖7和圖8 所示,文本字體的大小和粗細(xì)反應(yīng)重要程度的高低。

        圖6 低咨詢活躍度讀者借閱書籍文本特征Fig.6 Text features ofbooks borrowed byreaders with low activity

        圖7 中咨詢活躍度讀者借閱書籍文本特征Fig.7 Text features ofbooks borrowed bymoderatelyactive readers

        圖8 高咨詢活躍度讀者借閱書籍文本特征Fig.8 Text features ofbooks borrowed byhighlyactive readers

        低咨詢活躍度讀者借閱書籍文本特征:《三國演義》 《伯羅奔尼撒戰(zhàn)爭史》 《大禹治水》 等歷史類的書籍以及張嘉驊編著少年讀史記系列的叢書受到歡迎?!兜静萑恕?《偷影子的人》 以及邢卓著的 《數(shù)學(xué)王國游樂園:數(shù)字王國的秘密》 系列叢書等適合少年兒童閱讀的書籍受到歡迎;中咨詢活躍度讀者借閱書籍文本特征:楊紅櫻、敖幼祥以及 《暴走漫畫》 創(chuàng)作部編繪的漫畫深受讀者喜愛,《老人與海》 《廖若晨星》《父》 以及 《落花生》 等小說散文類也是讀者熱衷的讀物;高咨詢活躍度讀者借閱書籍文本:由中國青年出版社出版的 《青年文摘》 和上海文藝出版社出版的《故事會》 這類青年雜志受到歡迎,天蠶土豆、唐家三少所著的玄幻小說以及 《山本》 《浮生六記》 等小說類文學(xué)受到讀者喜愛。另外,《托德先生的故事》 和(英)畢翠克絲·波特編繪的繪本類讀物也深受歡迎。

        為了得出低咨詢活躍度讀者的在線咨詢交互文本的主題特征,采用LDA 模型方法進(jìn)行主題挖掘工作。在試驗階段,本研究預(yù)將主題設(shè)置為2~6 類,對各類詞項的隸屬概率進(jìn)行實驗。研究發(fā)現(xiàn)將主題分為2~4類時,每一類中的詞項概率隨著分類數(shù)量的增加而上升,但各個主題間的區(qū)分度不夠明顯,當(dāng)主題數(shù)設(shè)置為4 時,實驗結(jié)果較為理想,在分為5 類時詞項的分布概率下降。因此,將主題數(shù)目設(shè)置T=4,超參數(shù)設(shè)置為α=0.01,β=0.05,迭代1 000 次,抽取各主題下概率最高的前20 個術(shù)語,利用Gibbs Sampling 進(jìn)行參數(shù)估計和推斷。同理將中咨詢活躍度讀者主題數(shù)T設(shè)為4,高咨詢活躍度讀者主題數(shù)T設(shè)為5,擇優(yōu)選取概率較高的10 項特征詞進(jìn)行展示,如表5、表6 和表7所示。

        表5 低咨詢活躍度讀者在線咨詢文本主題分布情況表Table 5 Topic distribution of online consultation texts of low activity readers

        表6 中咨詢活躍度讀者在線咨詢文本主題分布情況表Table 6 Topic distribution of online consultation texts of active readers

        表7 高咨詢活躍度讀者在線咨詢文本主題分布情況表Table 7 Topic distribution of online consultation texts of highly active readers

        可以發(fā)現(xiàn)低咨詢活躍度讀者較為關(guān)心圖書的逾期歸還、還書續(xù)借、預(yù)約以及密碼修改問題;中咨詢活躍度讀者較為關(guān)心違約金的繳納、各聯(lián)合圖書館的地址以及開館時間、辦證問題、東西丟失如何找回的問題;預(yù)約進(jìn)館、館藏書目查詢、還書形式、館內(nèi)WIFI連接以及圖書丟失問題是高咨詢活躍度讀者較為關(guān)心的問題。

        對這3 個群體的讀者特征進(jìn)行分析,發(fā)現(xiàn)低咨詢活躍度讀者在圖書館的主要活動為書籍借閱,屬于經(jīng)常在圖書館借書的人群。但是這類讀者的咨詢活躍度不是很高,因此可以具體分析原因進(jìn)行改善,從而能夠吸引更多的讀者。中咨詢活躍度讀者對圖書館的資源使用主要集中在公共資源方面,從咨詢的問題來看,該類讀者屬于經(jīng)常來館的讀者群體,屬于圖書館的忠實讀者。這類讀者對圖書館的研究價值最高,可以對這類讀者進(jìn)行調(diào)研,從而了解圖書館需改進(jìn)之處;高咨詢活躍度讀者在圖書館的主要活動為館藏資源的閱讀和公共資源的使用,屬于經(jīng)常在圖書館讀書的人群,這類讀者對圖書館的館藏資源比較感興趣且經(jīng)常使用公共資源進(jìn)行自修。依據(jù)讀者特征的分析結(jié)果,為精準(zhǔn)服務(wù)提供依據(jù),具體服務(wù)策略詳見表8。

        表8 咨詢活躍度維度讀者服務(wù)策略分析表Table 8 Analysis of reader service strategies in the dimension of consultation activity

        4.3.2 讀者年齡維度分析

        年齡維度也是推薦時需要參考的重要因素,不同年齡段的讀者感興趣的圖書以及關(guān)心的問題不同,因此周期性參考年齡維度的書籍變化以及咨詢問題的主題變化情況,可以及時有效地為讀者進(jìn)行更精準(zhǔn)化的服務(wù)。本次數(shù)據(jù)來源的讀者年齡在4 歲至61 歲之間,依據(jù)聯(lián)合國世界衛(wèi)生組織提出年齡分段[39],我們將讀者年齡維度劃分為4~17 歲少兒及青少年讀者、18~45歲青年讀者以及46~61 歲中年讀者。3 個年齡段讀者的借閱書籍文本特征如圖9、圖10 和圖11 所示,3 個年齡段讀者在線咨詢文本主題分布情況如表9、表10和表11 所示,對3 個年齡段的讀者進(jìn)行特征分析,可得到3 個年齡段讀者群體特征和相應(yīng)服務(wù)策略,如表12 所示。

        表9 少兒及青少年讀者在線咨詢文本主題分布情況表Table 9 Topic distribution of online consultation texts of children and young readers

        表10 青年讀者在線咨詢文本主題分布情況表Table 10 Topic distribution of online consultation texts of young readers

        表11 中年讀者在線咨詢文本主題分布情況表Table 11 Topic distribution of online consultation texts of middle-aged readers

        圖9 少兒及青少年讀者借閱書籍文本特征Fig.9 Text features of books borrowed by children and young readers

        圖10 青年讀者借閱書籍文本特征Fig.10 Text features of books borrowed by young readers

        圖11 中年讀者借閱書籍文本特征Fig.11 Text features of books borrowed by middle aged readers

        可以發(fā)現(xiàn)該市圖書館制作的蜂蜂書包深受少兒及青少年讀者喜愛,楊紅櫻、張嘉驊、朱斌、孫幼軍等兒童類書籍的作家和漫畫家受到歡迎,中國青年出版社出版的讀物受到少兒及青少年讀者歡迎;《青年文摘》 和 《故事會》 等青年雜志受到青年讀者歡迎,三毛、余非魚等編著的浪漫言情小說受到讀者喜愛,同時,天蠶土豆和天下霸唱所著玄幻推理類小說也較受歡迎;《父》 《落花生》 以及 《故事會》 等散文和民間故事集受到中年讀者的喜愛,《一千零一夜》 《天生一對》 等兒童文學(xué)作品以及楊紅櫻、崔鐘雷編著的兒童作品也受到關(guān)注。

        從在線咨詢文本主題來看,少兒及青少年讀者較為關(guān)心預(yù)約、開館閉館時間、圖書館活動以及圖書丟失等問題;青年讀者讀者較為關(guān)心還書續(xù)借、開館閉館時間、預(yù)約以及自修室的問題;中年讀者較為關(guān)心還書續(xù)借、密碼以及開館閉館時間的問題。

        對這3 個群體的讀者特征進(jìn)行分析,發(fā)現(xiàn)少兒及青少年群體讀者在圖書館的主要活動為進(jìn)館閱讀和參加活動,而且年齡較小,對新奇的活動和設(shè)備興趣會比較大;青年群體讀者在圖書館的主要活動為借閱書籍以及公共資源的使用;中年群體讀者的主要活動為在館閱讀書籍,說明這類讀者對圖書館的館藏資源比較感興趣。依據(jù)讀者特征的分析結(jié)果,為精準(zhǔn)服務(wù)提供依據(jù),具體服務(wù)策略詳見表12。

        4.3.3 讀者性別維度分析

        從性別維度對讀者的分析可以揭示出不同性別的讀者對書目以及圖書館公共資源使用的偏好,從而更精準(zhǔn)的為讀者提供信息服務(wù)。對男性讀者和女性讀者分別做借閱書籍文本特征分析和在線咨詢交互文本分析,兩個性別讀者的借閱書籍文本特征如圖12 和13所示,在線咨詢交互文本的主題分析采用LDA 模型的方法,擇優(yōu)選取概率較高的10 項特征詞進(jìn)行展示,如表13 和表14 所示。最終可得到不同性別讀者群體特征,并據(jù)此提出服務(wù)策略,如表15 所示。

        表13 女性讀者在線咨詢文本主題分布情況表Table 13 Topic distribution of online consultation texts of female readers

        表14 男性讀者在線咨詢文本主題分布情況表Table 14 Topic distribution of online consultation texts of male readers

        圖12 女性讀者借閱書籍文本特征Fig.12 Text features of books borrowed by female readers

        表12年齡維度讀者服務(wù)策略對比表Table 12 Comparison of reader service strategies in age dimension

        從借閱書籍文本特征來看,中國青年出版社出版的 《青年文摘》 受到女性讀者歡迎?!读稳舫啃恰贰对?jīng)滄?!?等愛情小說,天蠶土豆、唐家三少所著的玄幻類小說也備受歡迎,《一千零一夜》 《天生一對》以及楊紅櫻編著的書籍等適合少年兒童閱讀的書籍受到歡迎;《偽裝者》 《薄冰》 《猛士》 和 《遠(yuǎn)大前程》等歷史諜戰(zhàn)類軍事類小說是男性讀者熱衷的讀物,《三國演義》 是借閱次數(shù)最多的書籍。

        圖13 男性讀者借閱書籍文本特征Fig.13 Text features of books borrowed by male readers

        從在線咨詢文本主題來看,女性讀者較為關(guān)心違約金、館藏、預(yù)約以及辦證等問題;男性讀者較為關(guān)心預(yù)約、館內(nèi)資源的使用、還書以及登錄密碼的問題。

        對這兩個群體的讀者特征進(jìn)行分析,發(fā)現(xiàn)女性讀者在圖書館較為關(guān)注違約金的繳納以及館藏書籍;男性讀者對圖書館的資源使用主要集中在公共資源方面,包括WIFI 以及自修室的使用。依據(jù)讀者特征的分析結(jié)果,為精準(zhǔn)服務(wù)提供依據(jù),具體服務(wù)策略詳見表15。

        表15 基于兩性讀者群特征分析的服務(wù)策略Table 15 Service strategy based on the analysis of the characteristics of male and female readers

        5 結(jié)語

        本文以某市圖書館的讀者基本數(shù)據(jù)、圖書借閱數(shù)據(jù)和在線咨詢數(shù)據(jù)為基礎(chǔ),結(jié)合TF-IDF 模型和LDA模型進(jìn)行分析,得到讀者借閱書籍文本特征和在線咨詢文本特征,組成單個讀者畫像和群體讀者畫像,并依據(jù)讀者畫像提出針對性服務(wù)策略的建議。

        本研究具有一定的理論意義,以往學(xué)者多采用引入外部數(shù)據(jù)的方法進(jìn)行交互式短文本的主題挖掘。本文加入會話切分的預(yù)處理方法進(jìn)行LDA 建模,優(yōu)化LDA 模型結(jié)果,可以實現(xiàn)針對讀者在線咨詢數(shù)據(jù)這類交互式短文本的主題抽取,挖掘出讀者關(guān)注的問題。

        本文構(gòu)建的多維圖書館讀者畫像分析框架,實現(xiàn)了讀者屬性特征的揭示與組織,為圖書館的精準(zhǔn)化服務(wù)研究提供了新思路。從不同維度讀者群體畫像的分析來看,不同群體咨詢的主題內(nèi)容側(cè)重點存在差異。圖書館應(yīng)在準(zhǔn)確挖掘用戶潛在需求的基礎(chǔ)上,向特定讀者提供所需的智慧型知識產(chǎn)品和服務(wù)[40],實現(xiàn)精準(zhǔn)化服務(wù)的最終目標(biāo)。

        本研究的數(shù)據(jù)覆蓋面有限,對數(shù)據(jù)所蘊(yùn)含讀者特征的揭示還不夠深入,未來可以沿著這個方向開展更全面具體的研究。

        猜你喜歡
        畫像咨詢書籍
        魯迅與“書籍代購”
        威猛的畫像
        “00后”畫像
        畫像
        AOS在書籍編寫的應(yīng)用
        書籍
        咨詢聯(lián)盟大有可為
        書籍是如何改變我們的
        潛行與畫像
        健康咨詢
        祝您健康(1987年2期)1987-12-30 09:52:28
        国产乱子伦一区二区三区| 日本午夜剧场日本东京热| 好吊妞视频这里有精品| 日产无人区一线二线三线乱码蘑菇 | 欧美精品一区二区精品久久| 日本在线免费一区二区三区| 免费一区二区高清不卡av| 中文字幕aⅴ人妻一区二区| 国产精品美女久久久久久2018| 亚洲成av人片一区二区| XXXXBBBB欧美| 富婆叫鸭一区二区三区| 成人爽a毛片免费网站中国| 国产人成视频在线视频| 日韩制服国产精品一区| 亚洲中文字幕在线爆乳| 免费黄网站永久地址进入| 精品人妻系列无码人妻漫画| 成av免费大片黄在线观看| 中文字幕在线观看国产双飞高清| 久久老熟女乱色一区二区| 老鸭窝视频在线观看| 毛片24种姿势无遮无拦| 在线观看av国产自拍| 国产精品髙潮呻吟久久av| 成人免费无码大片a毛片| 国产乱子伦精品免费无码专区 | 久国产精品久久精品国产四虎 | 国产精品原创巨作AV女教师| 男人的天堂av一二三区| 中文字幕人妻在线少妇| 在线成人一区二区| 亚洲男女免费视频| 久久精品国产亚洲不卡| 久久久久久久亚洲av无码| 久久这里只精品国产免费10| 亚洲AV无码成人精品区H| 国产精品熟女一区二区三区 | 国产精品人成在线观看免费| 性一交一乱一伦一色一情孩交| 亚洲一区二区在线视频播放|