殷建文
(珠海市圖書(shū)館,廣東 珠海 519000)
在新媒體時(shí)代背景下,圖書(shū)館的閱讀形式不再僅僅是以文本和圖像等形式的閱讀,取而代之的是集文字、圖像與視頻于一體的立體化閱讀形式[1]。在閱讀媒介上,也不再僅僅是紙質(zhì)媒介,而是更多地采用數(shù)字閱讀終端以及移動(dòng)閱讀終端。在交流方式上,也由傳統(tǒng)的淺顯交流,到如今的充分體現(xiàn)動(dòng)態(tài)性、共享性、社會(huì)性以及參與性的多位一體的深入交流。隨著圖書(shū)館的閱讀形式發(fā)生變化,圖書(shū)館的閱讀服務(wù)也要隨之變革。閱讀服務(wù)在圖書(shū)館的整體運(yùn)營(yíng)中應(yīng)處于主導(dǎo)地位,其關(guān)鍵點(diǎn)在于有效地組織和開(kāi)展閱讀服務(wù),以提升圖書(shū)館的社會(huì)地位,讓更多的讀者參與到閱讀中來(lái)。因此構(gòu)建圖書(shū)館的閱讀社區(qū)勢(shì)在必行,也符合圖書(shū)館閱讀服務(wù)發(fā)展的潮流。
目前,國(guó)內(nèi)圖書(shū)館讀者閱讀社區(qū)的構(gòu)建主要研究點(diǎn)在于構(gòu)建網(wǎng)上閱讀社區(qū),有學(xué)者認(rèn)為,閱讀社區(qū)是一種以交流為主要導(dǎo)向的網(wǎng)絡(luò)閱讀討論組織系統(tǒng)[2]。構(gòu)建圖書(shū)館的閱讀社區(qū)有利于加強(qiáng)讀者與圖書(shū)館之間的互動(dòng),通過(guò)讀者與作者之間互動(dòng),讀者與讀者之間的互動(dòng),以更方便的網(wǎng)絡(luò)形式開(kāi)展閱讀討論,引導(dǎo)更多的讀者進(jìn)行深入的閱讀和交流,從而有效地提升圖書(shū)館對(duì)于讀者的吸引力和凝聚力。有學(xué)者研究認(rèn)為,如今的閱讀更多的是社交性閱讀、個(gè)性化閱讀;以閱讀作為媒介,強(qiáng)調(diào)在閱讀過(guò)程中的分享、傳播和社交,通過(guò)社會(huì)化閱讀創(chuàng)造更大的閱讀價(jià)值。
國(guó)內(nèi)外到目前為止已經(jīng)有一些流行的閱讀社區(qū)[3],如國(guó)外的ZITE、FLIPBOARD、FPO等閱讀社區(qū),以及國(guó)內(nèi)的超星閱讀社區(qū)、當(dāng)當(dāng)讀書(shū)以及網(wǎng)易云閱讀等閱讀社區(qū)。與傳統(tǒng)的圖書(shū)館閱讀方式相比,基于閱讀社區(qū)的閱讀方式更加注重讀者之間的聚合,通過(guò)高效的互動(dòng)體驗(yàn),讓讀者在移動(dòng)終端能夠隨時(shí)閱讀,享受個(gè)性化服務(wù),然而現(xiàn)有的讀者閱讀社區(qū)還存在較多的問(wèn)題。第一,每個(gè)閱讀社區(qū)中的閱讀資源有限,都含有較高的同質(zhì)化閱讀信息,缺少優(yōu)質(zhì)的閱讀資源,現(xiàn)有閱讀社區(qū)都偏向于盈利性質(zhì),所以其涵蓋的閱讀資源在文學(xué)、娛樂(lè)和資訊范圍內(nèi),缺少自然科學(xué)、工程技術(shù)等工科類別的閱讀資源。第二,現(xiàn)有的數(shù)據(jù)挖掘技術(shù)僅僅只是挖掘閱讀流程中的前端資源,挖掘的資源有限,對(duì)于讀者閱讀行為數(shù)據(jù)都缺少必要的挖掘,而這些行為數(shù)據(jù)恰恰能夠解決很多專業(yè)性的問(wèn)題。第三,現(xiàn)有閱讀社區(qū)在互動(dòng)流程上還不夠完善,由于每個(gè)讀者都有自己的觀點(diǎn),都可以通過(guò)系統(tǒng)進(jìn)行交流,意見(jiàn)雜亂無(wú)章且沒(méi)有經(jīng)過(guò)充分考慮和驗(yàn)證,在社區(qū)的交流中有大量的低質(zhì)量無(wú)意義的錯(cuò)誤信息,導(dǎo)致交流的效率不高,交流的成本較大。
知識(shí)傳承是圖書(shū)館的歷史使命,需要全面構(gòu)建基于讀者需求的閱讀社區(qū)系統(tǒng),通過(guò)閱讀社區(qū)系統(tǒng)能夠更好地推廣閱讀,營(yíng)造良好的閱讀氛圍,激發(fā)讀者的閱讀興趣。另外,良好的閱讀社區(qū)文化還能夠傳承文明,構(gòu)建知識(shí)體系,升華民族的文化素質(zhì)[4]。如今的傳統(tǒng)圖書(shū)館存在缺少數(shù)字化的讀者閱讀社區(qū)系統(tǒng)、閱讀活動(dòng)單調(diào)、閱讀資源不足、缺乏整體的系統(tǒng)規(guī)劃、讀者體驗(yàn)較差、缺乏深度交流等問(wèn)題?,F(xiàn)有問(wèn)題在一定程度上影響圖書(shū)館推廣全民閱讀,也不利于新興媒體對(duì)于電子圖書(shū)館的閱讀推廣。在新興媒體的時(shí)代背景下,讀者的閱讀文化素養(yǎng)與習(xí)慣正伴隨著閱讀方式和閱讀形式改變,因此圖書(shū)館構(gòu)建基于數(shù)據(jù)挖掘的讀者閱讀社區(qū)勢(shì)在必行。基于數(shù)據(jù)挖掘的圖書(shū)館讀者閱讀社區(qū)可以利用微博、微信等新興媒體平臺(tái),引領(lǐng)讀者大眾進(jìn)行閱讀,讓讀者有機(jī)會(huì)了解更多的優(yōu)秀作品,并能夠及時(shí)解決讀者在閱讀中的疑惑。
圖書(shū)館讀者閱讀社區(qū)能夠在閱讀服務(wù)的基礎(chǔ)上進(jìn)行深入數(shù)據(jù)挖掘,再通過(guò)新興媒體平臺(tái)對(duì)讀者的各項(xiàng)數(shù)據(jù)進(jìn)行挖掘。根據(jù)數(shù)據(jù)挖掘的結(jié)果向用戶推薦各種閱讀資源,也可以進(jìn)一步豐富圖書(shū)館的圖書(shū)藏書(shū)量[5]。筆者認(rèn)為基于數(shù)據(jù)挖掘的圖書(shū)館讀者閱讀社區(qū)構(gòu)建框架包括5個(gè)要素,分別是讀者、推廣主體、圖書(shū)載體、推薦渠道和品牌活動(dòng)。圖書(shū)館閱讀社區(qū)的5個(gè)要素中,讀者是社區(qū)的核心,在圖書(shū)館閱讀過(guò)程中要強(qiáng)調(diào)讀者與讀者之間的交流;推廣主體是閱讀社區(qū)的另一個(gè)主要功能點(diǎn),包括對(duì)圖書(shū)資源的推廣以及構(gòu)建社會(huì)公眾志愿推廣活動(dòng);圖書(shū)資源是閱讀社區(qū)構(gòu)建的基礎(chǔ)條件和保障,圖書(shū)館圖書(shū)資源包括紙質(zhì)版和電子版資源;推薦渠道是讀者閱讀社區(qū)賴以生存的主要功能,通過(guò)對(duì)圖書(shū)館讀者的各項(xiàng)數(shù)據(jù)挖掘結(jié)果進(jìn)行針對(duì)性的推薦,保障了閱讀社區(qū)的良好生態(tài);品牌活動(dòng)是閱讀社區(qū)活躍度的有力保障,通過(guò)構(gòu)建品牌社區(qū)文化并擴(kuò)展到全民閱讀生態(tài),能夠保障圖書(shū)館的閱讀社區(qū)獲得良好的效果。
圖1 圖書(shū)館讀者閱讀社區(qū)構(gòu)建框架
圖書(shū)館讀者閱讀社區(qū)的5個(gè)關(guān)鍵要素是在一定范圍內(nèi)進(jìn)行組合和配置的,通過(guò)關(guān)鍵要素之間的相互作用,能夠提高圖書(shū)館讀者相互分享知識(shí)的意識(shí),升華讀者的閱讀境界,讓讀者在獲得知識(shí)的同時(shí)能夠愉悅身心[6]。在新媒體時(shí)代背景下,圖書(shū)館閱讀過(guò)程是一個(gè)復(fù)雜的網(wǎng)狀結(jié)構(gòu),讀者不再是一個(gè)個(gè)單獨(dú)的閱讀者,而急需在閱讀過(guò)程中利用社交平臺(tái)進(jìn)一步理解、分享各自的閱讀內(nèi)容,提升閱讀的效率,分享閱讀的知識(shí)。圖2給出了一個(gè)圖書(shū)館閱讀社區(qū)的三層架構(gòu)模型。
圖2 圖書(shū)館讀者閱讀社區(qū)的三層架構(gòu)模型
該模型分為3個(gè)層次,頂層的應(yīng)用界面構(gòu)建了讀者操作系統(tǒng),是面向讀者的應(yīng)用界面;中間層則是核心業(yè)務(wù)層,包括了閱讀社區(qū)的主要業(yè)務(wù)流程,以及支撐圖書(shū)館閱讀社區(qū)的數(shù)據(jù)挖掘的主要業(yè)務(wù)流程;底層是數(shù)據(jù)存儲(chǔ)區(qū),通過(guò)關(guān)聯(lián)數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù),方便進(jìn)行數(shù)據(jù)挖掘。在該架構(gòu)模型中,讀者通過(guò)統(tǒng)一的平臺(tái)結(jié)構(gòu)進(jìn)入到讀者閱讀社區(qū)中,在閱讀社區(qū)中讀者可以通過(guò)一站式的方式對(duì)圖書(shū)館的圖書(shū)資源進(jìn)行檢索、借閱和評(píng)價(jià)交流,讀者的所有檢索行為、借閱行為以及評(píng)價(jià)交流內(nèi)容都會(huì)被記錄下來(lái),并存儲(chǔ)在底層數(shù)據(jù)庫(kù)中;其次,閱讀社區(qū)系統(tǒng)將會(huì)根據(jù)讀者的閱讀行為,從閱讀主題、著者、閱讀題材和閱讀系列4個(gè)主要方面進(jìn)行數(shù)據(jù)挖掘和關(guān)聯(lián),并將挖掘結(jié)果推薦給不同的用戶;與此同時(shí),數(shù)據(jù)挖掘還會(huì)挖掘用戶在社會(huì)網(wǎng)絡(luò)上的自媒體內(nèi)容,從挖掘結(jié)果中推斷出不同用戶的活動(dòng)情景特征,并根據(jù)活動(dòng)情景特征推薦相應(yīng)的圖書(shū)資源。根據(jù)該系統(tǒng)的實(shí)踐與應(yīng)用,圖書(shū)館可以在對(duì)讀者用戶的閱讀、偏好以及行為數(shù)據(jù)挖掘的基礎(chǔ)上,為讀者用戶推送符合其閱讀需求的閱讀資源,并提高圖書(shū)館資源的閱讀量。
雖然圖書(shū)館逐漸朝著數(shù)字化、智能化發(fā)展,但是紙質(zhì)資源仍然是社區(qū)圖書(shū)資源的基礎(chǔ)數(shù)據(jù)。筆者分別對(duì)紙質(zhì)圖書(shū)和電子圖書(shū)構(gòu)建了獨(dú)立的數(shù)據(jù)庫(kù),兩個(gè)數(shù)據(jù)庫(kù)之間缺乏數(shù)據(jù)上的關(guān)聯(lián)。為了實(shí)現(xiàn)對(duì)讀者進(jìn)行紙質(zhì)電子資源的一體化推送服務(wù),需要整合現(xiàn)有的數(shù)據(jù)庫(kù),構(gòu)建數(shù)據(jù)關(guān)聯(lián)規(guī)則,以補(bǔ)充館藏的不足并為讀者提供豐富的圖書(shū)資源。在構(gòu)建數(shù)據(jù)關(guān)聯(lián)規(guī)則上,主要構(gòu)建兩個(gè)部分,一是構(gòu)建本地紙質(zhì)電子圖書(shū)數(shù)據(jù),二是構(gòu)建網(wǎng)絡(luò)閱讀社區(qū)的圖書(shū)數(shù)據(jù)。
圖3 讀者社區(qū)圖書(shū)資源的數(shù)據(jù)關(guān)聯(lián)規(guī)則
在構(gòu)建本地紙質(zhì)電子圖書(shū)數(shù)據(jù)中,指導(dǎo)思想是構(gòu)建異構(gòu)系統(tǒng)之間的數(shù)據(jù)關(guān)聯(lián)服務(wù),而不能簡(jiǎn)單地復(fù)制所有的數(shù)據(jù)。構(gòu)建數(shù)據(jù)關(guān)聯(lián)規(guī)則的具體方法是通過(guò)圖書(shū)唯一識(shí)別號(hào)ISBN將兩個(gè)數(shù)據(jù)庫(kù)中的圖書(shū)資源合并起來(lái),然后分別為紙質(zhì)圖書(shū)和電子圖書(shū)的ISBN號(hào)給出對(duì)應(yīng)的ID號(hào),最后記錄圖書(shū)的各項(xiàng)基礎(chǔ)信息[7]。該方法能夠極大地減少兩個(gè)數(shù)據(jù)庫(kù)合并過(guò)程中的冗余性,又能夠有效地構(gòu)建紙質(zhì)電子圖書(shū)的關(guān)聯(lián)規(guī)則。當(dāng)某個(gè)讀者需要對(duì)應(yīng)的數(shù)目字段時(shí),可以通過(guò)“ISBN+ID”號(hào)來(lái)獲得其喜愛(ài)的圖書(shū)資源以及圖書(shū)形式。
在構(gòu)建網(wǎng)絡(luò)閱讀社區(qū)的圖書(shū)數(shù)據(jù)中,同樣可以采用ISBN號(hào)來(lái)構(gòu)建關(guān)聯(lián)規(guī)則,并將網(wǎng)絡(luò)圖書(shū)資源的ID號(hào)保存在本地?cái)?shù)據(jù)庫(kù)中。針對(duì)網(wǎng)絡(luò)的不同社區(qū),需要采用不同社區(qū)提供的批量檢索資源的接口,對(duì)同關(guān)鍵詞的檢索結(jié)果進(jìn)行存儲(chǔ)和編號(hào)。紙質(zhì)和電子圖書(shū)數(shù)據(jù)庫(kù)的重要作用一般是體現(xiàn)在關(guān)聯(lián)分屬于不同異構(gòu)系統(tǒng)的圖書(shū)數(shù)據(jù)上,雖然圖書(shū)資源有不同的形式,但是可以為讀者構(gòu)建統(tǒng)一的圖書(shū)檢索、瀏覽和借閱的入口。
讀者社區(qū)的閱讀環(huán)境構(gòu)建包括線下的圖書(shū)館環(huán)境構(gòu)建和線上的社區(qū)環(huán)境構(gòu)建。隨著泛在知識(shí)環(huán)境的到來(lái),讀者對(duì)圖書(shū)館的環(huán)境需求更加多樣化和縱深化。新興媒體時(shí)代背景下的用戶希望能夠隨時(shí)隨地根據(jù)需求,通過(guò)多種途徑、多種渠道,以低成本、更可靠地獲取高質(zhì)量的信息資源。因此,針對(duì)讀者社區(qū)閱讀環(huán)境的構(gòu)建勢(shì)在必行。
在對(duì)線下圖書(shū)館的環(huán)境構(gòu)建上,主要是對(duì)圖書(shū)館員的再培養(yǎng)。因?yàn)殡S著圖書(shū)館網(wǎng)絡(luò)社區(qū)化的實(shí)施,圖書(shū)館的角色迫切需要從僅僅提供圖書(shū)服務(wù)和數(shù)據(jù)庫(kù)等資源服務(wù),轉(zhuǎn)化到提供更具有信息附加效果的服務(wù)。這就需要圖書(shū)館的館員不斷學(xué)習(xí)新的知識(shí),將自己培養(yǎng)成為具有豐富知識(shí)的復(fù)合型圖書(shū)館員,為更多的讀者解決疑難問(wèn)題。同時(shí)圖書(shū)館方應(yīng)該定期開(kāi)展培訓(xùn)講座,聘請(qǐng)行業(yè)專家傳授互聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘的知識(shí)。
在對(duì)線上社區(qū)環(huán)境的構(gòu)建上,主要是構(gòu)建閱讀流程上的社區(qū)服務(wù)流程,包括檢索流程、篩選流程、評(píng)價(jià)流程和反饋流程。檢索流程是讀者在使用閱讀社區(qū)時(shí)通過(guò)各種方式從信息源處查詢并挑選相關(guān)圖書(shū)資源給讀者,閱讀社區(qū)服務(wù)還能提供信息加工服務(wù),為讀者刪除一些不必要的信息。篩選流程則是對(duì)讀者從各個(gè)信息源獲取到的圖書(shū)資源進(jìn)行信息的相關(guān)性、可靠性以及適用性的判斷,并從圖書(shū)資源中篩選出有價(jià)值的信息傳遞給用戶。評(píng)價(jià)流程則是對(duì)經(jīng)過(guò)篩選之后的資源進(jìn)行進(jìn)一步篩選,讓讀者能夠更進(jìn)一步了解到圖書(shū)資源的價(jià)值。反饋流程則為讀者提供圖書(shū)資源的梳理,虛化重組,并幫讀者判斷圖書(shū)資源是否偏離閱讀目標(biāo)。
在圖書(shū)館讀者閱讀社區(qū)中,讀者的閱讀行為一般包括資源檢索、圖書(shū)瀏覽、借閱和評(píng)價(jià)等行為。為了有效地記錄讀者在社區(qū)中的閱讀行為,首先要求讀者登陸閱讀社區(qū),然后根據(jù)讀者在社區(qū)中的操作將讀者的行為都記錄在數(shù)據(jù)庫(kù)中,再通過(guò)數(shù)據(jù)挖掘技術(shù)將相關(guān)圖書(shū)資源信息推薦給讀者。在對(duì)社區(qū)讀者閱讀行為數(shù)據(jù)挖掘過(guò)程中,主要包括兩個(gè)方面,一是記錄讀者的閱讀行為,二是通過(guò)閱讀行為挖掘并分析讀者的關(guān)注資源。
在記錄讀者的閱讀行為上,每個(gè)讀者在閱讀社區(qū)中的圖書(shū)檢索、借閱和評(píng)價(jià)行為應(yīng)該被跟蹤和記錄。然而,由于讀者在圖書(shū)檢索中將會(huì)產(chǎn)生大量的無(wú)關(guān)日志數(shù)據(jù),檢索信息重要性比圖書(shū)借閱和評(píng)價(jià)的重要性低得多。所以,在記錄讀者閱讀行為上僅僅記錄讀者產(chǎn)生的圖書(shū)借閱和評(píng)價(jià)數(shù)據(jù)。其中,圖書(shū)借閱數(shù)據(jù)包括兩個(gè)方面,一方面是紙質(zhì)圖書(shū)的借閱數(shù)據(jù),另一方面是電子圖書(shū)的全文閱覽數(shù)據(jù)。針對(duì)紙質(zhì)圖書(shū)的借閱,可以通過(guò)訪問(wèn)圖書(shū)館集成管理系統(tǒng)來(lái)獲得讀者各個(gè)圖書(shū)資源的外借記錄,而電子圖書(shū)館的借閱數(shù)據(jù)字可以通過(guò)跟蹤讀者是否點(diǎn)擊全文閱覽電子圖書(shū)鏈接的行為來(lái)獲取。圖書(shū)評(píng)價(jià)數(shù)據(jù)一般分為圖書(shū)評(píng)分、自定義分類和自由書(shū)評(píng)3種模式。其中,圖書(shū)評(píng)分太直觀沒(méi)有記錄價(jià)值,自定義分類信息有深度且內(nèi)容主題突出,可以用于挖掘分析,自由書(shū)評(píng)的信息量太大難以挖掘,可以僅僅記錄其中的關(guān)鍵詞。因此,在記錄圖書(shū)評(píng)價(jià)數(shù)據(jù)上需要記錄自定義分類信息和自由書(shū)評(píng)關(guān)鍵詞。
在對(duì)閱讀行為數(shù)據(jù)挖掘過(guò)程中,主要從4個(gè)方面進(jìn)行數(shù)據(jù)挖掘,分別是主題偏好、作者偏好、題材偏好和系列偏好。其中,主題偏好是需要從閱讀行為中挖掘出讀者對(duì)于圖書(shū)主題內(nèi)容的喜愛(ài)程度,以及讀者關(guān)注和閱讀的該主題以外的其他圖書(shū)。一般采用讀者在撰寫(xiě)自由書(shū)評(píng)時(shí)的關(guān)鍵詞來(lái)分析讀者對(duì)于某個(gè)主題的偏好。粉絲偏好是從閱讀行為數(shù)據(jù)中挖掘出讀者對(duì)于某些著作的作者的喜愛(ài)程度,通過(guò)分析并統(tǒng)計(jì)讀者的借閱數(shù)據(jù)即可完成對(duì)作者偏好的挖掘。題材偏好則是從閱讀行為數(shù)據(jù)中挖掘出讀者關(guān)注和閱讀過(guò)程中比較相似的一些圖書(shū)題材,由于圖書(shū)的題材并不是以主題內(nèi)容劃分的,所以在挖掘過(guò)程中需要統(tǒng)計(jì)圖書(shū)的功能類型,來(lái)確定讀者真正喜愛(ài)的圖書(shū)類型和功能。系列偏好是從閱讀行為數(shù)據(jù)中挖掘出讀者對(duì)于某個(gè)圖書(shū)出版系列的喜愛(ài)程度,挖掘讀者對(duì)于圖書(shū)系列的偏好需要結(jié)合讀者的自由書(shū)評(píng)和圖書(shū)系列信息共同挖掘。為了更形象化地展示4種偏好挖掘的作用,圖4給出了閱讀深度和閱讀廣度上的4種偏好的分布。
圖4 閱讀深度和閱讀廣度上的4種偏好的分布
互聯(lián)網(wǎng)和智能技術(shù)的普及,還可以分析讀者在社交網(wǎng)絡(luò)中的自媒體內(nèi)容數(shù)據(jù),而這些內(nèi)容數(shù)據(jù)已經(jīng)成為了社區(qū)平臺(tái)推薦系統(tǒng)的重要發(fā)展方向。在社區(qū)讀者自媒體內(nèi)容數(shù)據(jù)挖掘中,主要采用文本分析的方式對(duì)自媒體內(nèi)容進(jìn)行分析,針對(duì)社區(qū)讀者應(yīng)該分析文中的隱含主題詞,主要包含4個(gè)階段的分析流程,分別是下載字典、分詞、刪除停用詞、構(gòu)建詞云。在下載詞典的過(guò)程中,本系統(tǒng)采用R語(yǔ)言進(jìn)行,該語(yǔ)言的相關(guān)軟件為開(kāi)源免費(fèi)軟件,可以從官方網(wǎng)站上下載,并安裝該語(yǔ)言提供的字典包。字典包是對(duì)應(yīng)行業(yè)的專業(yè)詞庫(kù),在對(duì)自媒體內(nèi)容分析時(shí)可以通過(guò)字典包對(duì)內(nèi)容完成分詞。在對(duì)自媒體內(nèi)容進(jìn)行分詞時(shí),采用R語(yǔ)言提供的Rwordseg工具包,該工具支持中文的分詞過(guò)程,且功能強(qiáng)大,使用方法簡(jiǎn)單。社區(qū)平臺(tái)可以直接為讀者提供該工具包,讀者并不需要了解該工具包的具體原理,只需要按照說(shuō)明調(diào)用該工具包,即可完成對(duì)相應(yīng)自媒體內(nèi)容的分詞。
一般來(lái)說(shuō),由于自媒體文本內(nèi)容屬于自然語(yǔ)言文本,所以在文本當(dāng)中包含有大量的虛詞,而這些虛詞沒(méi)有任何的實(shí)際意義,只是為了語(yǔ)句通順而添加的輔助詞,這些輔助虛詞都與主題內(nèi)容無(wú)關(guān),所以需要在數(shù)據(jù)挖掘之前將這些詞清洗掉,通過(guò)R語(yǔ)言提供的常用的虛詞包將虛詞清洗掉后,剩下的實(shí)詞將作為文本挖掘的輸入完成詞云的構(gòu)建。詞云是一種場(chǎng)景的文本分析結(jié)構(gòu)圖,其運(yùn)行方式是將所有的詞語(yǔ)放在同一張圖中并根據(jù)詞語(yǔ)在文本中出現(xiàn)的次數(shù)來(lái)顯示詞語(yǔ)的大小,從而完成對(duì)文本的分析。在社區(qū)讀者自媒體內(nèi)容數(shù)據(jù)挖掘中,通過(guò)詞云的排序即可統(tǒng)計(jì)出每個(gè)詞出現(xiàn)的頻次,進(jìn)而從排在前面的詞獲取讀者在自媒體內(nèi)容中的主題詞。
為了應(yīng)對(duì)日益發(fā)展的圖書(shū)館數(shù)字化、互聯(lián)網(wǎng)化、智能化,筆者對(duì)基于數(shù)據(jù)挖掘的圖書(shū)館讀者閱讀社區(qū)構(gòu)建進(jìn)行了研究。從圖書(shū)館閱讀社區(qū)的內(nèi)涵和現(xiàn)有問(wèn)題分析了構(gòu)建讀者閱讀社區(qū)的背景,給出了構(gòu)建讀者閱讀社區(qū)的思路與設(shè)計(jì),分別從數(shù)據(jù)關(guān)聯(lián)、閱讀環(huán)境、行為挖掘和自媒體內(nèi)容挖掘4個(gè)方面進(jìn)行了構(gòu)建研究。展望未來(lái),在今后的圖書(shū)館讀者閱讀社區(qū)的構(gòu)建上,還應(yīng)該結(jié)合云計(jì)算與大數(shù)據(jù)分析等方法,朝著更智能、更有個(gè)性化的圖書(shū)館讀者閱讀社區(qū)方向發(fā)展。