亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶數據挖掘的圖書采購模式研究*

        2020-06-08 08:31:58廖宇峰
        科技與創(chuàng)新 2020年10期
        關鍵詞:數據挖掘圖書館用戶

        廖宇峰

        基于用戶數據挖掘的圖書采購模式研究*

        廖宇峰

        (廣東食品藥品職業(yè)學院,廣東 廣州 510520)

        國內圖書館人對基于用戶數據挖掘的圖書采購模式方面的研究做了一些探索。圖書采購決策過程中用戶數據挖掘的全過程包括收集數據、數據預處理、建立模型和結果調整。探討如何引入數據挖掘技術,深入挖掘用戶數據,為圖書采購決策、管理和服務提供決策支持。

        用戶數據;數據挖掘;圖書采購;采購模式

        1 前言

        作為學校的文獻信息交流和儲存中心,圖書館一直為學校的教學和科研提供服務。因此,高校圖書館的發(fā)展必須與學校的發(fā)展保持一致,除了專業(yè)教育,通識教育和終身學習習慣也是高校人才培養(yǎng)戰(zhàn)略的重要培養(yǎng)目標。圖書館的館藏資源建設必須與學校的專業(yè)設置、教學計劃緊密結合,在為學校提供專業(yè)文獻資源保障的同時,也為通識教育和終身學習習慣提供保障。

        目前,圖書館的館藏資源建設所遇到的需要重點探討的問題,主要集中在怎樣構建快速、真實反映館藏結構分布、用戶實際需求和圖書利用率的動態(tài)圖書采購決策方案。

        利用目前方興未艾的數據挖掘技術,可以在海量數據中迅速獲取到有價值的信息。本文將探討引入數據挖掘技術,深入挖掘用戶數據,以期幫助館藏文獻資源的建設,充分掌握館藏文獻資源的建設動態(tài),更好地開展圖書采購業(yè)務,充分保障用戶的知識獲取權益。

        2 目前高校圖書館圖書采購的主要工作方式

        2.1 專業(yè)采編部門組織采購

        部門內部的采編工作人員按照采購計劃,根據各個渠道獲取書目,按照館藏建設制度,挑選合適的書目。由于多個工作人員的知識結構不同,一定程度上增加了選書的多樣性,但因為人員素質不盡相同,可能導致效率低下、選書標準差異分化嚴重。此外,因長期沒接觸一線流通工作,導致采編工作人員與用戶溝通不多,不能完全理解用戶的需求。

        2.2 用戶薦購方式

        用戶薦購也稱為PDA 模式(Patron-Driven Acquisition),用戶可依據圖書館給出的清單挑選圖書,也可以自選書目,利用現場填寫書單,電子郵箱、電話、微信和QQ等方式告知采購工作者完成圖書推薦過程。目前有條件的圖書館也開始推廣“圖書薦購系統(tǒng)”,用戶可以隨時隨地在系統(tǒng)中選擇圖書,后臺也可以隨時獲取用戶需求清單。

        “用戶薦購方式”在很大程度上可以滿足用戶的需求,但是一般用戶只是按照自己的想法來選擇圖書,具有一定的片面性、隨機性和偶發(fā)性。此外用戶薦購數量無法與館藏建設規(guī)劃相比,只能作為圖書館采購圖書的一種補充。

        2.3 館配會和書展現場采購

        書展一般展示的是熱門書籍和暢銷書籍,而館配會現場的圖書數量也有限制。圖書館組織人員參加書展和館配會,是對紙質館藏的一種有益補充,但是無法解決專業(yè)性強、全面而且有深度的圖書采購。同時,因為經費的問題,參與現場采購的人員不可能數量太多,因受限于各自的知識面,因此也只能滿足少部分用戶的需求。

        3 采購決策相關因素

        3.1 流通借閱數據

        正常情況下,用戶一般都會按需借閱,因此本館的用戶借閱數據基本能反映用戶的實際需求。后臺工作人員可以根據歷史借閱數據,統(tǒng)計分析出用戶的偏好和興趣,為圖書的采購工作提供一定的科學依據。

        3.2 主管機構的戰(zhàn)略規(guī)劃

        對于高校圖書館而言,圖書館的紙書采購必須與學校的長遠規(guī)劃和專業(yè)設置相匹配,一旦學校開設了新專業(yè),高校圖書館也必須增加相關的專業(yè)書籍;而如果高校希望增加學生的通識教育,圖書館也理應增加相關的書籍,以配合學校教學、科研和全面育人的戰(zhàn)略規(guī)劃。

        而對于公共圖書館而言,圖書采購必須充分考慮當地監(jiān)管部門的發(fā)展戰(zhàn)略和規(guī)劃,例如廣州致力于新一代信息技術、人工智能、生物醫(yī)藥和新能源、新材料等新興產業(yè)的發(fā)展,因此相關地區(qū)的公共圖書館應該適當增加相應的藏書,以配合廣州的發(fā)展規(guī)劃,促進相關知識的廣泛傳播。

        3.3 圖書出版時間及價格因素

        根據市面上紙質圖書的出版規(guī)律,紙書的價值一般會隨著時間的推移而降低,這在一些發(fā)展迅猛的高新技術類圖書上更為明顯。圖書出版時間是采購人員需要重要考量的因素。同時因為經費有限,所以大多數圖書館也會將圖書的價格考慮進去,以達到效益最大化。

        隨著信息技術如火如荼的發(fā)展,圖書館獲取和挖掘用戶的數據變得越來越科學和便利。深度挖掘用戶數據,可以全方位獲取到用戶的真正需求,因此,用戶數據已經成為越來越多圖書館制訂采購書單時的重要決策依據。

        通過對用戶數據進行深入挖掘,進而形成重要的報告,不僅可以事前為圖書采購提供依據,同時在事后可以作為圖書采購質量的評判標準。在對用戶數據進行深入挖掘分析之后,制定圖書采購計劃,確定圖書的類型比例,同時在過程中可以糾正偏差,有效提高所購圖書的針對性,充分保障用戶的需求,同時保持館藏資源建設的動態(tài)平衡。因此,基于用戶數據挖掘的采購模式已經越來越受到廣大圖書館采購工作者的關注。

        4 用戶數據挖掘對圖書館圖書采購決策的驅動

        4.1 本館電子資源使用記錄

        目前大部分高校圖書館都會自建具有學校特色的專業(yè)數據庫或者購買知網、萬方、超星之類的學術數據庫,這些數據庫內容豐富,囊括了電子報刊、電子書、試題庫和學習庫等電子資源。用戶利用此類數據庫的記錄,可以在很大程度上反映需求狀況和閱讀偏好。

        4.2 用戶借閱數據

        用戶的借閱數據,例如用戶借閱類目、借閱時間、借閱偏好和借閱數量等借閱數據,為圖書館館藏結構的科學性和合理性提供一定的依據。

        4.3 用戶需求信息

        用戶需求信息包括用戶通過“薦購系統(tǒng)”、圈選清單或者QQ、微信發(fā)送給圖書館的實際圖書需求。因此必須發(fā)動師生用戶,積極參與到館藏資源建設中,圖書館準確地掌握用戶的真實需求。特別是學校的學科專家、科研人員提交的圖書需求信息,館內工作人員應該特別加以關注。此外,也應該注意收集用戶與館員在溝通交流中產生的一些隱含需求信息。高校教師獲取館藏文獻資源主要用于教學和科研,而科研需求在研究型院校中尤為明顯。對于學生用戶而言,低年級學生獲取館藏文獻資源主要是為了了解與專業(yè)相關的知識,或者通過課外學習增加全方面的知識儲備,而碩士、博士借閱圖書主要是希望有助于開展科研。

        4.4 學校專業(yè)建設數據

        學科建設數據主要通過全校專業(yè)設置情況、重點專業(yè)、各專業(yè)師生數量等數據進行描述。重點專業(yè)是學校學科建設的重中之重,一定程度上體現了一所大學的辦學傳統(tǒng)和優(yōu)勢,而新增專業(yè)是各個大學專業(yè)建設新的突破口和新的增 長點。

        4.5 圖書流通記錄

        在圖書館的自動化管理系統(tǒng)中,保存著圖書館全部的圖書流通記錄,包括各專業(yè)相關的圖書借閱情況、按分類號統(tǒng)計的各類圖書借閱情況、每種圖書的續(xù)借情況、各學科館藏占比(各個不同的學科與圖書館所有的館藏數量的比例)、某圖書的借閱率與該圖書所在學科的平均借閱率的比較數據,該數據可以充分反映某學科內的熱門和冷門圖書,從而反映用戶的需求。

        4.6 OPAC檢索信息

        OPAC檢索信息中包含著非常龐大的用戶需求,此類信息包含用戶檢索字段的頻率、檢索時間、點擊瀏覽具體類目情況,甚至還有用戶的所屬專業(yè)、性別和年級等信息。此類數據能夠全方位地了解檢索者的需求和借閱偏好,非常有助于對用戶需求進行深度挖掘。

        4.7 其他相關數據

        除上述數據以外,圖書館的整體館藏數據、大型出版社信息、供應商信息、著者信息和新書書目數據對于數據挖掘也具有重要的意義。例如著者信息,不同著者知識結構、職稱和科學人文素養(yǎng)不盡相同,名家經典、權威專業(yè)人士的質量總體會更高一點,因此,著者信息也是必不可少的因素之一;而新書書目數據需要盡量做到覆蓋面廣、保證時效、書目信息完整,否則會影響到數據挖掘的效果。

        5 圖書采購決策過程中用戶數據挖掘的模式

        收集圖書館的大數據尤其是用戶數據,包括本館電子資源使用記錄、用戶借閱數據、用戶需求信息、學校專業(yè)建設數據、圖書流通記錄、OPAC檢索信息和其他相關數據等數據,然后導入到SQLServer數據庫中開始數據預處理[3],刪除冗余、不完整和噪聲較多的不科學、不準確的數據;同時剔除已經失效的用戶信息,最后將預處理后的數據表導入到SPSS Clementine軟件中建立模型;最后依據導出的結果,反饋給用戶,進行結果調整。用戶數據挖掘模式如圖1所示。

        圖1 用戶數據挖掘模式

        5.1 大數據的采集

        圖書館在館藏資源信息化建設過程中,產生了大量蘊藏著對于圖書館來說價值連城的數據,包括結構化、半結構化和非結構化數據,包括本館電子資源使用記錄、用戶借閱數據、用戶需求信息、學校專業(yè)建設數據、圖書流通記錄、OPAC檢索信息和其他相關數據等數據。

        5.2 數據預處理

        收集本館電子資源使用記錄、用戶借閱數據、用戶需求信息、學校專業(yè)建設數據、圖書流通記錄、OPAC檢索信息和其他相關數據。這些數據可以通過圖書館自動化管理系統(tǒng)以標準格式導出,然后導入到SQLServer 數據庫中進行數據預處理,刪除冗余缺漏、不完整和噪聲較大的不準確數據。

        數據預處理過程中,應對所獲取數據進行統(tǒng)一處理,刪除其中的異常數據,同時進行填補缺漏,確保數據格式的一致性;因數據來源各不相同,所以需要將數據格式進行相應統(tǒng)一轉換;合并重復的數據,確保關鍵數據的準確性、完整性和有序性。

        5.3 建立模型

        決策樹算法通過標引數據中的獨特、顯著特征,并根據這些特征進一步縮小數據集,直到建立清晰、完整的相關性。該算法可以對源數據中的信息做出科學、明確預測;聚類能夠查找多維空間中數據的自然分組,為用戶呈現數據更直觀的一般分組[4]。

        SPSS可將用戶各種相關的數據嚴格地按照要求進行全方位、多角度的整體綜合分析,從而深入挖掘用戶對館藏圖書的真實需求,最后根據反饋結果調整本館圖書采購策略,豐富、完善整體館藏結構,進一步提高圖書資源的利用率,更好地實現用戶的需求和完成本館的工作目標。

        在SPSS工具中利用分類和回歸樹(C&RT)算法來構建決策樹,對之前預處理過的用戶信息進行深入地數據挖掘。具體操作路線:將預處理后的結果導入到SPSS Clementine軟件中建立模型;然后將各個數據源節(jié)點、導出節(jié)點、過濾節(jié)點、類型節(jié)點、分布圖節(jié)點和C&RT節(jié)點依次連接起來,按照既定方針配置各個參數;最后執(zhí)行數據分析處理程序。

        5.4 結果調整

        按照之前的部署,將各個相關數據導入并進行數據挖掘后,導出完整的結果報表,這份價值連城的結果報表可為工作人員提供科學、嚴瑾和全面的采購決策。

        系統(tǒng)不僅能通過決策樹方法為圖書采購工作提供決策依據,而且還設計出新書書目,同時可以吸引潛在的用戶群。圖書采購工作人員可以把導出的新書目發(fā)送給學校的師生用戶,讓這些用戶再次挑選、評估新書目。根據用戶們的反饋,工作人員可以對決策結果進行人工干預和修正。系統(tǒng)不僅能夠提供科學工具分析后的決策,而且還能讓廣大用戶群體直接參與到采購評估工作中,兩者相輔相成,進一步提高新書采購的科學性和合理性。

        數據挖掘是圖書館信息化決策系統(tǒng)的重要組成部分,如何充分利用信息技術、發(fā)揮圖書館工作人員的主觀能動性和創(chuàng)造性,構建科學而高效的數據挖掘系統(tǒng)是一個現代化的圖書館必須面對和研究的課題。越來越多的案例證明,利用數據挖掘技術為圖書采購提供決策依據,不僅可以顯著地提高新書采購質量,同時也有助于圖書館能夠采購到學校和用戶都需要的圖書。本文探討了基于用戶數據挖掘的圖書采購模式,為圖書采購決策、管理和服務提供決策支持,是信息技術在圖書采購領域的一次有益嘗試。

        [1]宋宇.基于數據挖掘的圖書采購模型研究[J].圖書館學研究,2014(17):53-55.

        [2]王芙蓉.大數據環(huán)境下基于讀者決策的圖書館文獻資源采購模型研究[J].圖書館學研究,2017(12):54-59.

        [3]廖宇峰.基于用戶數據挖掘的圖書館圖書采購模式研究[J].情報探索,2017(4):31-34.

        [4]孫元軍,鄭新奇.基于SQL Server的城市地籍空間數據挖掘探討[J].計算機工程與應用,2007(13):200-202.

        2095-6835(2020)10-0118-03

        G253.1

        A

        10.15913/j.cnki.kjycx.2020.10.052

        廖宇峰,男,碩士,廣東食品藥品職業(yè)學院圖書館館員。

        2016年廣東省圖書館科研課題“基于用戶數據挖掘的圖書采購模式研究”(編號:GDTK1611)的研究成果之一

        〔編輯:嚴麗琴〕

        猜你喜歡
        數據挖掘圖書館用戶
        探討人工智能與數據挖掘發(fā)展趨勢
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        基于并行計算的大數據挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        飛躍圖書館
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        一種基于Hadoop的大數據挖掘云服務及應用
        如何獲取一億海外用戶
        去圖書館
        亚洲av永久无码精品三区在线 | 亚洲自拍偷拍色图综合| 精品无人码麻豆乱码1区2区| 国产成人一区二区三区在线观看 | 亚洲AV永久天堂在线观看 | 亚洲色AV性色在线观看| 一区二区三区精品婷婷| 久久伊人最新网址视频| 午夜无码伦费影视在线观看| 亚洲七七久久综合桃花| 大屁股流白浆一区二区 | 宅男久久精品国产亚洲av麻豆| 天堂av网手机线上天堂| 亚洲精品成人av在线| 国产精品久免费的黄网站| 国产一区二区三区四区色| 一本色道久久88—综合亚洲精品| 亚洲色大成网站www久久九九| 亚洲色成人网站www观看入口| 亚洲国产精品一区亚洲国产| 色佬精品免费在线视频| 男男受被攻做哭娇喘声视频 | 亚洲av人片在线观看调教| 亚洲av日韩一卡二卡| 无码少妇精品一区二区免费动态| 国产中文aⅴ在线| 亚洲一区二区三区麻豆| 97久久婷婷五月综合色d啪蜜芽 | 日韩少妇激情一区二区| www.五月激情| 国产激情综合五月久久| 人妻夜夜爽天天爽三区麻豆av网站| 麻豆第一区MV免费观看网站| 一本色道久久88综合| 亚洲欧洲免费无码| 久久人人玩人妻潮喷内射人人 | 日本高清人妻一区二区| 一边做一边说国语对白| 午夜无码片在线观看影院| 日韩有码中文字幕第一页| 男女真人后进式猛烈视频网站|