亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高校圖書館OPAC 讀者檢索行為數(shù)據(jù)挖掘與分析

        2022-07-11 02:13:02牛蘭金曲淑敏
        科技視界 2022年13期
        關鍵詞:列表館藏數(shù)據(jù)挖掘

        牛蘭金 曲淑敏 姚 震

        (山東農(nóng)業(yè)大學圖書館,山東 泰安 271018)

        0 引言

        聯(lián)機公共目錄查詢系統(tǒng)(Online Public Access Cata logue,簡稱OPAC)是圖書館為讀者提供館藏書刊目錄信息檢索和個人借閱信息查詢的在線系統(tǒng),它是讀者利用圖書館紙質(zhì)文獻資源的網(wǎng)上第一入口,在圖書館的網(wǎng)絡服務中一直占有重要的地位。讀者借閱圖書之前一般都要先在OPAC 系統(tǒng)中做檢索查詢,所以檢索詞能反映出讀者對于紙質(zhì)或電子圖書的閱讀需求,而讀者行為數(shù)據(jù)反映出讀者的使用習慣和規(guī)律,也反映出OPAC 系統(tǒng)功能的友好程度及使用效果,這些方面都值得圖書館的工作人員進行研究。

        山東農(nóng)業(yè)大學圖書館使用的是匯文OPAC 系統(tǒng),百度統(tǒng)計云平臺能夠記錄讀者使用OPAC 的詳細數(shù)據(jù)并按天進行了初步的匯總,其中讀者進行書目檢索的數(shù)據(jù)記錄每年大約有20 余萬條, 對這些讀者檢索行為數(shù)據(jù)進行分析與挖掘, 可以了解讀者使用OPAC的基本情況,了解讀者的借閱需求、閱讀傾向,以及讀者使用OPAC 系統(tǒng)的習慣和規(guī)律等,進而可以為圖書館的館藏建設、讀者服務等工作提供具有一定參考價值的數(shù)據(jù)和結(jié)論。

        1 讀者檢索行為數(shù)據(jù)挖掘與分析研究設計

        1.1 程序編寫與數(shù)據(jù)文件格式

        本文研究使用Python 語言作為編程和數(shù)據(jù)挖掘工具,使用Excel、Json 作為數(shù)據(jù)文件格式,按照功能需要共計編寫Python 小程序近20 個。

        1.2 數(shù)據(jù)獲取與整理

        利用統(tǒng)計系統(tǒng)提供的數(shù)據(jù)下載API 編寫程序下載所需原始數(shù)據(jù),本文研究按日下載數(shù)據(jù),每天的數(shù)據(jù)保存為一個文件, 下載的數(shù)據(jù)是Json 格式, 編寫Python程序?qū)⑵滢D(zhuǎn)換為Excel 文件,方便直觀瀏覽和處理。

        1.3 OPAC 總體使用情況的統(tǒng)計分析

        統(tǒng)計系統(tǒng)已經(jīng)將網(wǎng)站的多項總體使用情況進行了統(tǒng)計,形成了數(shù)據(jù)列表和簡單圖表,利用這些通用型的數(shù)據(jù)列表, 結(jié)合OPAC 的實際需要進行數(shù)據(jù)提取、組合、合并和統(tǒng)計分析。

        1.4 檢索行為與檢索詞數(shù)據(jù)挖掘與分析

        把讀者檢索相關的數(shù)據(jù)記錄從下載的原始數(shù)據(jù)中提取出來,根據(jù)特征字符串區(qū)分出不同的檢索方式并加以研究,其次將檢索詞從檢索式URL 中提取出來作為單獨的字段,再經(jīng)過數(shù)據(jù)處理和分組聚合形成檢索詞列表并進行數(shù)據(jù)分析和數(shù)據(jù)挖掘研究。

        1.5 數(shù)據(jù)可視化

        對多個數(shù)據(jù)集合根據(jù)其特點和需要選擇不同的圖形類別進行可視化處理, 利用圖形進行概況了解、數(shù)據(jù)分析和規(guī)律發(fā)現(xiàn)。

        2 讀者檢索行為數(shù)據(jù)挖掘與分析研究結(jié)果

        2.1 會話時長統(tǒng)計分析

        讀者的每次訪問從開始到結(jié)束都可以視為一次會話,一次會話中可能會包含多項操作,本文以2021年1月至6月的數(shù)據(jù)為例進行分析,半年中總的訪問次數(shù)為15 014 次,按會話時長分段統(tǒng)計出各段的總訪問次數(shù)繪制成圖1,其具體數(shù)據(jù)顯示,有6 318 次訪問會話時長少于1 分鐘, 占比為42.08%,72.75%的訪問在3 分鐘內(nèi)完成。另外,筆者在詳細數(shù)據(jù)中發(fā)現(xiàn)時長少于等于9 秒鐘的訪問會話有2 997 次, 占比19.96%,為了驗證這部分數(shù)據(jù)的有效性, 筆者進行了多次模擬,發(fā)現(xiàn)在2-3 秒鐘內(nèi)完成一次簡單的檢索任務是完全可行的,這部分數(shù)據(jù)完全可以作為有效數(shù)據(jù)來進行分析。從數(shù)據(jù)來看,大多數(shù)讀者都在較短的時間內(nèi)完成了檢索,這反映出大部分讀者都希望盡快結(jié)束搜索過程,也與讀者大量使用圖書館門戶首頁的快捷綜合檢索框進行書目檢索有關。

        圖1 會話時長分段與其總訪問次數(shù)統(tǒng)計圖

        2.2 訪問頁數(shù)統(tǒng)計分析

        訪問頁數(shù)統(tǒng)計的是讀者每次訪問會話一共瀏覽了本網(wǎng)站多少個頁面,訪問頁數(shù)的多少反應了讀者需求獲得滿足的效率,如讀者只需要檢索到一種圖書的館藏位置, 在理想狀態(tài)下只需要在OPAC 中訪問1~2個頁面就完成檢索離開了。表1 是2021年1月至6月的訪問頁數(shù)分段與對應的總訪問會話次數(shù)統(tǒng)計表,數(shù)據(jù)顯示,51.82%的讀者只訪問了1 到2 個頁面就離開了,不超過4 個頁面的總計占68.28%,訪問5 個頁面以上的占31.72%,總體上看大多數(shù)讀者是在已經(jīng)有了基本明確的意圖的情況下使用OPAC, 比如查詢某書有沒有可借復本或是查詢館藏地點和位置信息,而在OPAC 中探索性發(fā)現(xiàn)有用圖書的行為不多。

        表1 訪問頁數(shù)分段與其總訪問次數(shù)統(tǒng)計表

        2.3 讀者檢索行為數(shù)據(jù)分析

        基于對多個因素的綜合考慮, 本文選用2018年的數(shù)據(jù)為研究對象,首先從每天的數(shù)據(jù)文件中把讀者檢索相關的所有數(shù)據(jù)記錄提取出來并合并成一個Excel 文件,經(jīng)過數(shù)據(jù)處理、分組聚合,形成可分析的數(shù)據(jù)集。

        2.3.1 檢索方式的分析

        統(tǒng)計系統(tǒng)記錄的是讀者每次檢索生成的檢索結(jié)果列表頁的URL 以及其訪問次數(shù)、 平均停留時長等多項統(tǒng)計數(shù)據(jù),每種檢索方式生成的URL 不相同,所以可以簡單使用Python 的df1=df.loc [df[‘name’].str.contains(“**”)]語句把某種檢索方式的所有數(shù)據(jù)提取出來,其中name 為URL 字段的名稱,“**”為某種檢索方式區(qū)別于其他方式的特征字符串。

        OPAC 的檢索方式包括簡單檢索、多字段檢索、綜合檢索框檢索、二次檢索,具體數(shù)據(jù)表明,讀者基本忽略了所謂高級檢索即多字段組合檢索的存在,只有96條檢索URL, 總檢索次數(shù)不到300, 而簡單檢索的URL 條數(shù)則達到17 439 條數(shù),總檢索次數(shù)達到20 余萬次。在圖書館門戶網(wǎng)站首頁的綜合檢索框進行OPAC 檢索和在檢索結(jié)果列表頁上的二級檢索界面進行檢索本質(zhì)上也是簡單檢索,綜合檢索框產(chǎn)生的URL有8244 條,總檢索次數(shù)有54 770 次,二次檢索產(chǎn)生的URL 共計8 826 條,總檢索次數(shù)20 261。讀者的行為數(shù)據(jù)表明,讀者都傾向于簡單方便的檢索方式而不是去構(gòu)造復雜的檢索式。

        2.3.2 生成完整的年度檢索詞統(tǒng)計列表

        在統(tǒng)計系統(tǒng)記錄的URL 中含有檢索詞, 提取出檢索詞作為一個字段,使用Python 分組聚合函數(shù)將相同檢索詞記錄合并為一條,本文的原則是,無論是題名檢索還是著者檢索,只要檢索詞相同的記錄就合并為一條,刪除不合理數(shù)據(jù)后,形成檢索詞的統(tǒng)計列表,2018年度共計產(chǎn)生21 406 條數(shù)據(jù)。列表的字段包括檢索詞、檢索次數(shù)、檢索結(jié)果頁的平均瀏覽時長、訪客數(shù)、訪問IP 數(shù)、檢索結(jié)果頁跳轉(zhuǎn)其他頁面的次數(shù),等等。通過瀏覽、統(tǒng)計、分析此列表,可以比較精確的了解全部的讀者檢索情況,本列表的生成是一個重要研究步驟和成果,有了它可以從多個角度和層面展開數(shù)據(jù)分析和挖掘。

        2.3.3 檢索頻次排行榜

        將檢索詞列表按檢索頻次排序生成排行榜,其中“東野圭吾”的檢索頻次最高,達到2 116 次,是2018年度的最熱門檢索詞。檢索頻次排名前20 位的檢索詞中與熱門小說和經(jīng)典文學相關的有13 個、 思政類檢索詞共計5 個、基礎課程類檢索詞共計2 個,這基本反映了讀者最關注的熱點。在匯文OPAC 系統(tǒng)的檢索界面上僅提供了30 天熱門檢索詞列表, 統(tǒng)計顯示30 天熱門檢索詞列表也具有較高的使用率,所以可以推定:整理并選取一定數(shù)量的熱門檢索詞在OPAC 檢索界面發(fā)布年度熱門檢索詞排行榜,對于讀者的檢索會更加有幫助,也更有參考價值,對于讀者閱讀推廣也有協(xié)助作用。

        2.3.4 檢索頻次分段統(tǒng)計分析

        2018年全年搜索量大于1 000 次的檢索詞共有13 個,這些檢索詞平均每天被檢索3 次以上,其相關的圖書理應受到重點關注。年度檢索頻次未超過9 次的檢索詞個數(shù)占據(jù)了檢索詞個數(shù)總量的75.24%,雖然數(shù)量達到16 106 個,但僅完成了57 171 次檢索,檢索頻次大于等于10 次的檢索詞共計5 300 個,累計檢索次數(shù)為228 364 次,80%的檢索是由這不到25%的檢索詞來完成的,這些檢索詞無疑應該是分析研究的重點, 而檢索頻次較低的檢索詞里面可能會存在新興的、潛在的知識和圖書熱點。

        2.3.5 對檢索詞進行分類研究

        對檢索詞進行分類,既可以參照中圖法也可以根據(jù)讀者課程學習或是生活娛樂的需求來進行,還可以按檢索頻次分段來分類,針對不同類型的檢索詞可以采用不同的策略來分別進行研究。對于檢索頻次較高的與各學科課程密切相關的這一類檢索詞需要長期關注,如“高等數(shù)學”和“生物化學”等,研究相關分類圖書的種數(shù)、出版日期、館藏量、館藏分配、借閱量、檢索頻次的動態(tài)變化以及各個數(shù)據(jù)之間的相互關系,從多個層面進行研究并落實,確保讀者的學習需求得到滿足并提高相關圖書的借閱率。

        3 結(jié)語

        本文通過對2018年度的OPAC 讀者檢索行為數(shù)據(jù)進行研究,比較系統(tǒng)、全面、精確的了解了OPAC 系統(tǒng)的讀者使用情況,同時也探索了研究方法,積累了經(jīng)驗, 并為后續(xù)年份的研究提供了可行的思路方法和整套的程序。另一方面,由于OPAC 的檢索訪問不需要用戶登錄,而且大部分訪問是在公用查詢端上進行的,無法取得讀者個性化特征數(shù)據(jù)來進行關聯(lián)性研究,因此本文的研究具有一定的局限性。后續(xù)年份的數(shù)據(jù)分析還將繼續(xù)開展,再結(jié)合館藏量、借閱量等相關數(shù)據(jù)來增加數(shù)據(jù)的維度, 通過不斷對相關數(shù)據(jù)的分析和挖掘,全面了解讀者的閱讀需求和行為特點,一定能為資源建設、流通和閱讀推廣等工作提供一定的幫助。

        猜你喜歡
        列表館藏數(shù)據(jù)挖掘
        巧用列表來推理
        館藏
        學習運用列表法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        擴列吧
        博物館的生存之道:館藏能否變賣?
        藝術品鑒(2019年11期)2019-12-27 09:06:18
        知還印館藏印選——古印篇
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        介紹兩件館藏青銅器
        文物春秋(2014年2期)2014-12-24 21:23:05
        亚洲一区二区三区久久不卡| 亚洲av综合av一区二区三区| 日本女优禁断视频中文字幕| 日本视频一中文有码中文| 国产97色在线 | 国产| 欧洲熟妇色xxxx欧美老妇性| 97无码免费人妻超级碰碰夜夜| 国产av无码专区亚洲av| 色偷偷88888欧美精品久久久| 久久国产精品超级碰碰热| 日日噜噜夜夜狠狠久久av| 东京道一本热码加勒比小泽| 亚洲黄色av一区二区三区| 亚洲国产一二三精品无码 | 在线免费午夜视频一区二区| 女同重口味一区二区在线| 亚洲精品中文字幕91| 中文字幕亚洲精品在线| 亚洲爆乳精品无码一区二区三区| 熟妇人妻av中文字幕老熟妇| 亚洲无码夜夜操| 精品国产三级国产av| 美女用丝袜脚玩我下面| 97色伦图片97综合影院| 国产v片在线播放免费无码| 无码av免费一区二区三区| 国农村精品国产自线拍| 欧美综合自拍亚洲综合百度| 少妇高潮太爽了免费网站| 亚洲国产中文字幕一区| 成人乱码一区二区三区av| 国产三级在线观看免费| 国产杨幂AV在线播放| 一区二区三区视频免费观看在线 | 精品久久一品二品三品| 东北少妇不戴套对白第一次| 国产一女三男3p免费视频| 偷拍区亚洲区一区二区| 中文字幕人妻一区二区二区| 国产精品午夜夜伦鲁鲁| 亚洲熟妇久久国产精品|