亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)環(huán)境下智慧圖書館智能推薦系統(tǒng)設(shè)計及其在高職教育中的應(yīng)用研究

        2019-10-08 05:35:32盛銓
        新世紀(jì)圖書館 2019年8期
        關(guān)鍵詞:高職院校圖書館推薦系統(tǒng)智慧圖書館

        盛銓

        摘 要 在探討如何創(chuàng)建大數(shù)據(jù)環(huán)境下的智慧圖書館,感知學(xué)生閱讀與學(xué)習(xí)需求,使之成為高職教育重要的組成部分的基礎(chǔ)上,論文設(shè)計了一種能夠用以收集、分析、處理和可視化呈現(xiàn)多種來源數(shù)據(jù)的大數(shù)據(jù)系統(tǒng),以及專門適用于高職院校的智慧圖書館智能推薦系統(tǒng)。該系統(tǒng)能夠較好地滿足高職學(xué)生需求,為其搜尋和推薦個性化的內(nèi)容資源,促進數(shù)據(jù)驅(qū)動決策理念在圖書館服務(wù)與高職教育中的應(yīng)用。

        關(guān)鍵詞 高職院校圖書館 高職教育 大數(shù)據(jù) 推薦系統(tǒng) 智慧圖書館

        分類號 G258

        DOI 10.16810/j.cnki.1672-514X.2019.08.010

        Abstract This paper explores how to create a smart library in a big data environment, and make the smart library an important part of higher vocational education by sensing the reading and learning needs of students. Then it designs a big data system that can collect, analyze, process, and visualize data from multiple sources, as well as an intelligent recommendation system for smart library that is specifically designed for higher vocational colleges. The research results show that the intelligent recommendation system can better meet the needs of higher vocational students, search and recommend personalized content resources for them, and promote the application of data-driven decision-making concepts in library services and higher vocational education.

        Keywords Higher vocational college library. Higher vocational education. Big data. Recommendation system. Smart library.

        0 引言

        智慧圖書館所倡導(dǎo)的智慧化理念始于2008年11月IBM總裁兼首席執(zhí)行官Samuel J. Palmisano提出的“智慧地球”概念[1]。“智慧地球”旨在將依托數(shù)字化與網(wǎng)絡(luò)化的智能技術(shù)應(yīng)用于所有物品,以便對這些物品進行感知、度量、互聯(lián)和深入分析,為社會提供高度智能化的服務(wù),最終推動社會經(jīng)濟走向新的發(fā)展歷程。而智慧圖書館則將物聯(lián)網(wǎng)、云計算技術(shù)及其設(shè)備引入到圖書館,以建設(shè)能夠進行智慧化管理、個性化智能推薦、實現(xiàn)知識有效共享與精準(zhǔn)感知讀者需求的圖書館。其中,智慧化推送是智慧圖書館的核心功能之一,主要目標(biāo)在于通過對讀者需求、收益及其滿意度的感知與預(yù)測,為讀者提供高精準(zhǔn)度、智慧化的資源與服務(wù)。國內(nèi)有些高職院校也積極進行了智慧圖書館建設(shè),在運用信息采集、處理與分析數(shù)據(jù)等技術(shù)方面提升了服務(wù)能力,但在感知學(xué)生閱讀與學(xué)習(xí)需求方面還有待進一步深入研究,使大數(shù)據(jù)技術(shù)在處理海量信息、多樣類型、高價值、快速處理方面成為高職院校建設(shè)智慧圖書館的重要保障,以便能夠為讀者提供高質(zhì)量的智能推薦服務(wù)。

        綜觀國內(nèi)研究,目前對智慧圖書館及其智慧服務(wù)的研究以理論研究為主,而較少以特定的實踐需求對智能推薦服務(wù)進行具體系統(tǒng)設(shè)計與實證研究。因此本文擬在大數(shù)據(jù)環(huán)境下以高職院校智慧圖書館智能推薦服務(wù)及其在高職教育中的具體應(yīng)用作為研究問題,探討如何整合高職院校圖書館內(nèi)外的多個來源大數(shù)據(jù),構(gòu)建大數(shù)據(jù)環(huán)境下智慧圖書館智能推薦系統(tǒng)模型,根據(jù)學(xué)生興趣推薦圖書館資源,以實現(xiàn)智慧圖書館智能推薦服務(wù)與高職教育的結(jié)合。

        1 大數(shù)據(jù)環(huán)境下智慧圖書館與智能服務(wù)研究

        近年來,學(xué)術(shù)界針對智慧圖書館與智能服務(wù)進行了大量研究。陳衛(wèi)靜將大數(shù)據(jù)環(huán)境下智慧圖書館的智慧分析歸為三種類型,分別是基于用戶行為數(shù)據(jù)、科研數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)的智慧分析[2]。祝森生認(rèn)為,大數(shù)據(jù)時代智慧圖書館著重應(yīng)當(dāng)解決的問題是如何有效滿足用戶與社會發(fā)展需求,確保其互聯(lián)、高效與便利[3]。陳臣從讀者的智慧閱讀需求出發(fā),探討了圖書館智慧服務(wù)體系的構(gòu)建及其各服務(wù)層的功能,認(rèn)為該體系能夠較好地根據(jù)讀者需求開展智慧化定制服務(wù)及個性化智慧閱讀服務(wù)[4]。馬曉亭提出了基于大數(shù)據(jù)的圖書館個性化智慧服務(wù)質(zhì)量保證策略,用以解決圖書館在開展個性化智慧服務(wù)過程中存在的問題[5]。李欣改進了強關(guān)聯(lián)規(guī)則算法,并將其應(yīng)用到圖書借閱和查詢數(shù)據(jù)分析之中,以提高智慧圖書館個性化推送服務(wù)的效率[6]。陳臣以大數(shù)據(jù)時代用戶行為數(shù)據(jù)分析為基礎(chǔ),提出了圖書館個性化智慧服務(wù)模式[7]。柳益君提出了基于大數(shù)據(jù)挖掘和Hadoop平臺的圖書館智慧服務(wù)模型,并探討了該模型在知識推薦服務(wù)與微知識自動問答服務(wù)中的應(yīng)用[8]。洪亮等構(gòu)建了大數(shù)據(jù)驅(qū)動的圖書館智慧信息服務(wù)體系及其發(fā)展策略[9]。宋維維等通過對Spark和HadoopMapReduce兩種大數(shù)據(jù)處理技術(shù)進行比較,提出了基于Spark大數(shù)據(jù)處理技術(shù)的圖書館智慧服務(wù)框架、服務(wù)流程及其應(yīng)用實踐[10]。

        2 大數(shù)據(jù)環(huán)境下高職院校智慧圖書館與智能服務(wù)目標(biāo)

        在大數(shù)據(jù)環(huán)境下,高職院校智慧圖書館智能推薦服務(wù)所要達到的目標(biāo)在于精準(zhǔn)識別和滿足學(xué)生興趣需求的同時,能夠提高圖書館的資源使用率和服務(wù)效率,實現(xiàn)圖書館與高職教育的結(jié)合。這也是本文所要研究的目的。

        智慧圖書館的主要目的是通過集成各個數(shù)據(jù)源的數(shù)據(jù)信息,構(gòu)建精確和有效的推薦系統(tǒng),為讀者提供個性化推薦服務(wù)。數(shù)據(jù)來源包括高職院校信息門戶系統(tǒng)、高職院校教學(xué)管理平臺、社交媒體網(wǎng)絡(luò)、個人圖書館和圖書館物聯(lián)網(wǎng)等主要模塊,如圖1中所示。在推薦系統(tǒng)中,各類數(shù)據(jù)源之間的交互以全新的方式進行呈現(xiàn),且不同數(shù)據(jù)源在整合之后的可訪問性與互操作性也將得到極大提升。

        4.2 智慧圖書館數(shù)據(jù)集

        智慧圖書館連接、組合以下來源的數(shù)據(jù):教學(xué)管理平臺上學(xué)生學(xué)習(xí)周期內(nèi)選定的課程及其在線課程開放平臺論壇中的交流信息;學(xué)生在教務(wù)信息管理系統(tǒng)中選課偏好及其相關(guān)的教材與教輔圖書信息;從社交媒體網(wǎng)絡(luò)收集的學(xué)生相關(guān)信息(綁定智慧圖書館相關(guān)平臺的學(xué)生社交媒體賬號);高職院校圖書館OPAC系統(tǒng)服務(wù)器日志文件,包含讀者屬性特征及借閱信息,以及讀者的圖書查詢、薦購等日志信息;從圖書館物聯(lián)網(wǎng)傳感器收集的圖書位置及在館和使用信息;讀者通過“我的圖書館”鏈接到第三方電子圖書數(shù)據(jù)庫(如超星電子書等)的電子書搜索、閱讀及下載日志信息。

        通過連接上述各類數(shù)據(jù)源,即可得到相應(yīng)的數(shù)據(jù)集。我們選取某高職院校的教學(xué)活動作為研究數(shù)據(jù),數(shù)據(jù)集包含120個課程、5個學(xué)習(xí)課程和約1750名學(xué)生信息。根據(jù)其所選修的課程和可借閱的圖書,每個學(xué)生在當(dāng)前學(xué)年從圖書館數(shù)據(jù)庫中下載的電子圖書大約為3~10種圖書,總計共有1000萬多條記錄。圖書館數(shù)據(jù)集包含80 571個用戶和2955冊圖書。圖書薦購系統(tǒng)包含約3900個圖書薦購信息文件、450個用戶和1495條有效的數(shù)據(jù)記錄。該校要求每個學(xué)生都通過教學(xué)管理平臺進行選課活動,以了解學(xué)生在本學(xué)年所選擇的課程,每年度的課程數(shù)量介于10到12門課程之間。

        4.3 智能推薦系統(tǒng)流程

        對各種來源的數(shù)據(jù)集,我們將通過大數(shù)據(jù)處理系統(tǒng)進行加載、集成到HCatalog中,進行收集、處理和分析,以及對最終內(nèi)容進行實現(xiàn)和可視化呈現(xiàn),即基于讀者的興趣為其提供個性化的內(nèi)容推薦。用戶每次訪問教務(wù)信息系統(tǒng)平臺時,Hadoop系統(tǒng)都將分析以下內(nèi)容:(1)用戶所使用(查詢、借閱和下載等) 的圖書屬性信息;(2)教學(xué)管理平臺中本學(xué)年選課數(shù)據(jù)信息;(3)OPAC系統(tǒng)中讀者的圖書借閱、薦購歷史和讀者個人屬性等信息;(4)對多個數(shù)據(jù)的操作日志信息。

        系統(tǒng)在對現(xiàn)有數(shù)據(jù)進行處理后,將根據(jù)讀者的興趣需求,為其提供以下建議:一是在高職院校圖書館中已入藏相關(guān)圖書的情況下,系統(tǒng)會根據(jù)圖書的ID在讀者指定的借閱期限內(nèi)為其預(yù)約該圖書;二是將讀者感興趣的圖書信息發(fā)送給圖書館的采編部門和圖書薦購系統(tǒng)。具體流程示意見圖2 。

        我們在實施中所選的開源軟件平臺是Apache HadoopHortonworks。Apache Hadoop是一種被廣泛采用的,也是最成熟的大數(shù)據(jù)軟件平臺之一,支持分布式數(shù)據(jù)密集型應(yīng)用程序和MapReduce計算范例,允許并行處理大量異構(gòu)數(shù)據(jù)。MapReduce和Hadoop被認(rèn)為是最有效的大數(shù)據(jù)管理框架[11]。

        在系統(tǒng)中,數(shù)據(jù)存儲在提供可擴展和容錯存儲的HDFS中,HDFS檢測并補償集群錯誤,將傳入的文件拆分為塊,并將它們?nèi)哂嗟卮鎯υ诩荷?。文件被分塊(每塊的大小為64MB或128MB)復(fù)制在多個節(jié)點上,因而具有較大的容錯性,若其中一個節(jié)點丟失,并不會破壞文件以及對數(shù)據(jù)讀取性能產(chǎn)生影響。此系統(tǒng)模型中的HDFS通過持續(xù)監(jiān)視集群中的節(jié)點及其管理的塊,用以確保數(shù)據(jù)的可用性。各個塊都受到檢查和控制,在以塊進行讀取后,確定正確性(記錄值是否正確)。MapReduce提供了并行計算功能和在集群中可共享的大型數(shù)據(jù)集,使得主節(jié)點能夠?qū)⑷蝿?wù)分配給子節(jié)點,再收集計算結(jié)果。

        5 智慧圖書館智能推薦系統(tǒng)模型的實現(xiàn)

        圖3顯示了創(chuàng)建大數(shù)據(jù)智慧圖書館所需的重要模塊及其Hadoop技術(shù)堆棧。系統(tǒng)中的MapReduce編程由Hive模塊執(zhí)行,該模塊允許在大型數(shù)據(jù)集上執(zhí)行查詢命令,并提供數(shù)據(jù)結(jié)構(gòu)投影機制。該層的突出特征是能夠借助于并行化的結(jié)構(gòu),管理系統(tǒng)中的大數(shù)據(jù)集,將現(xiàn)有的數(shù)據(jù)集已加載到HCatalog中,以便在系統(tǒng)管理層上展開進一步處理,再將數(shù)據(jù)分發(fā)和傳輸?shù)紿Base模塊,從而進行搜索、下載和分析。

        對智慧圖書館數(shù)據(jù)執(zhí)行的查詢主要目的是顯示在給定時間段內(nèi)借閱特定圖書的讀者,并準(zhǔn)備數(shù)據(jù)集以供進一步處理,其程序如下:

        SELECT debit.person_id,book.title.

        COUNT(debit.person_id) OVER (PARTITION BY debit.person_id ORDER BY debit.person_id ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING)

        FROM debit JOIN book ON(debit.book_id 1/4 book.row)

        WHERE debit.taking_date>“2017-01-01”AND debit.return_date<“2017-06-14”

        執(zhí)行程序主要根據(jù)以下6個步驟搜索和選擇最合適的項目:

        步驟1:執(zhí)行查詢結(jié)果顯示書名和在指定日期范圍內(nèi)借閱次數(shù)最多的讀者ID;

        步驟2:Ambari模塊執(zhí)行系統(tǒng)中的監(jiān)控和管理模塊,該模塊可以安裝、管理和監(jiān)控集群中的Hadoop服務(wù)。該集成模塊的主要任務(wù)是協(xié)調(diào)分布式應(yīng)用程序、同步和集中集群中的服務(wù),并協(xié)調(diào)和監(jiān)控相互獨立的Hadoop作業(yè)流程;

        步驟3:系統(tǒng)內(nèi)外部來源(高職院校及其圖書館、高職院校OPAC系統(tǒng)和教務(wù)信息管理平臺)讀者ID鏈接到電子郵件帳戶;

        步驟4:讀者在我的圖書館中,可以通過使用他們的個人帳號下載電子書,每位讀者當(dāng)前學(xué)年下載的電子書大致介于3到10冊之間;

        步驟5:每當(dāng)讀者對我的圖書館及圖書薦購系統(tǒng)進行任何新的訪問時,系統(tǒng)都會分析該讀者的查詢、借閱、下載和薦購歷史,以及讀者的個人屬性和個性化偏好,生成推薦列表和感興趣的內(nèi)容。系統(tǒng)會根據(jù)這些信息,對相關(guān)圖書與之進行相似性排序與比對,再形成基于相似性的圖書推薦列表;

        步驟6:在讀者新登錄教學(xué)管理平臺時,大數(shù)據(jù)推薦系統(tǒng)將對多個來源的數(shù)據(jù)進行處理以生成推薦信息,其算法基于不同數(shù)據(jù)來源的單獨系統(tǒng)中所有項目計算相似性,以確定哪些項目最適合讀者,計算項目之間相似性的代碼如下:

        HCatalog 1/4 union(ProductCatalog1, ProductCatalog2, ProductCatalog3, ProductCatalog4 [...])。

        其中,ProductCatalog1是實體館的圖書數(shù)據(jù);

        ProductCatalog2是學(xué)校教學(xué)管理平臺數(shù)據(jù);ProductCatalog3是在線薦購系統(tǒng)的數(shù)據(jù);ProductCatalog4是“我的圖書館”服務(wù)器的日志數(shù)據(jù)。所選取的數(shù)據(jù)項目有:圖書館借閱數(shù)據(jù)項目、電子圖書下載數(shù)據(jù)項目、圖書薦購系統(tǒng)的薦購信息、讀者的個人偏好及行為信息。根據(jù)現(xiàn)有數(shù)據(jù),系統(tǒng)將列出大數(shù)據(jù)處理系統(tǒng)為根據(jù)讀者ID為其推薦的3冊圖書,讀者可以進行以下選擇:在高職院校圖書館中保留推薦的圖書,或者由圖書館采編部門從合作書商直接購買推薦的圖書。

        6 智慧圖書館智能推薦系統(tǒng)評估

        評估所選取的樣本是2016—2017學(xué)年冬季學(xué)期某專業(yè)大二的220名學(xué)生。

        系統(tǒng)的評估首先通過系統(tǒng)大數(shù)據(jù)進行分析,確定Hadoop系統(tǒng)中最受歡迎的圖書,以便發(fā)現(xiàn)這些圖書的借閱頻次是否比去年同期有所增加。大數(shù)據(jù)分析用于確定以下內(nèi)容:評估系統(tǒng)最常向用戶推薦哪些書籍;2016年和2017年從高職院校圖書館借閱推薦圖書的次數(shù)分別是多少。分析的目的是評估基于Hadoop的推薦系統(tǒng)是否有助于改善提升圖書館服務(wù)水平的潛力,以及增加讀者對系統(tǒng)的使用和信任。其次通過在線調(diào)查問卷來評估已實施的原型系統(tǒng),以確定基于多數(shù)據(jù)來源的Hadoop推薦是否比高職院校在線薦購系統(tǒng)更適合讀者。所設(shè)計的問卷被整合到學(xué)校的教務(wù)信息系統(tǒng)中,以確定基于Hadoop的多數(shù)據(jù)源推薦是否更適合讀者(基于他們的印象)。問卷包括十個問題,每個問題均有多個選擇或真?zhèn)未鸢福渲袃蓚€重要問題以五點李克特量表進行設(shè)問。

        大數(shù)據(jù)分析結(jié)果顯示,在原型系統(tǒng)測試期間,從基于Hadoop的系統(tǒng)上被推薦得最多的圖書列表中借閱的圖書總量增加了269.5%。

        問卷調(diào)查結(jié)果顯示,在參與在線調(diào)查問卷的學(xué)生中,有40%的學(xué)生未曾借閱、下載或薦購任何圖書。在沒有圖書使用信息情況下,系統(tǒng)無法確定讀者的偏好,因此無法創(chuàng)建用戶模型進行圖書推薦,因而這些學(xué)生在最終的研究對象中被剔除。其他學(xué)生選擇從圖書館數(shù)字圖書館下載電子書,在圖書薦購系統(tǒng)中薦購相關(guān)圖書,或從高職院校圖書館借閱推薦的圖書,符合調(diào)查評估的要求。我們通過問卷調(diào)查發(fā)現(xiàn),有24.6%的學(xué)生認(rèn)為基于Hadoop的多數(shù)據(jù)源推薦完全足夠,平均得分為3.38,標(biāo)準(zhǔn)差為1.25,而有21.1%的學(xué)生認(rèn)為圖書館傳統(tǒng)的圖書推薦服務(wù)完全足夠,平均成績?yōu)?.17,標(biāo)準(zhǔn)差為1.28。顯然學(xué)生們認(rèn)為大數(shù)據(jù)系統(tǒng)的推薦略微優(yōu)于圖書館以往的圖書推薦服務(wù)。

        參考文獻:

        張之滄,閭國年.“智慧地球”概念解析[J].自然辯證法研究,2015(11):117-122.

        陳衛(wèi)靜.智慧圖書館在大數(shù)據(jù)環(huán)境下的智慧分析[J].圖書情報工作,2015(2):49-52.

        祝森生.大數(shù)據(jù)時代關(guān)于智慧圖書館的幾個研究問題探討[J].圖書與情報,2013(5):126-128.

        陳臣.基于大數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的智慧圖書館構(gòu)建[J].現(xiàn)代情報,2017,37(8):85-91.

        馬曉亭.大數(shù)據(jù)時代圖書館個性化智慧服務(wù)QOS保障研究[J].現(xiàn)代情報,2014,34(12):69-73.

        李欣.強關(guān)聯(lián)規(guī)則挖掘在智慧圖書館個性化推送服務(wù)中的應(yīng)用研究[J].情報科學(xué),2018,36(4):95-99.

        陳臣.大數(shù)據(jù)時代一種基于用戶行為分析的圖書館個性化智慧服務(wù)模式[J].圖書館理論與實踐,2015(2):96-99.

        柳益君,何勝,熊太純,等.大數(shù)據(jù)挖掘視角下的圖書館智慧服務(wù):模型、技術(shù)和服務(wù)[J].現(xiàn)代情報,2017,37(11):81-86.

        洪亮,周莉娜,陳瓏綺.大數(shù)據(jù)驅(qū)動的圖書館智慧信息服務(wù)體系構(gòu)建研究[J].圖書與情報, 2018(2): 8-15.

        宋維維,夏紹模,李贊.基于SPARK大數(shù)據(jù)處理平臺的圖書館智慧服務(wù)探索與實踐[J].情報科學(xué),2018,36(6):45-49.

        KHAN S, LIU X, SHAKIL K A, et al. A survey on scholarly data: from big data perspective[J].Information Processing & Management,2017,53(4):923-944.

        猜你喜歡
        高職院校圖書館推薦系統(tǒng)智慧圖書館
        基于用戶偏好的信任網(wǎng)絡(luò)隨機游走推薦模型
        基于個性化的協(xié)同過濾圖書推薦算法研究
        淺議讀者協(xié)會參與高職院校圖書館管理工作
        價值工程(2016年32期)2016-12-20 20:41:48
        個性化推薦系統(tǒng)關(guān)鍵算法探討
        淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
        Beacon技術(shù)在圖書館信息服務(wù)中的應(yīng)用研究
        基于微信公眾平臺的閱讀推廣案例研究
        智慧圖書館項目建設(shè)的應(yīng)用實踐
        淺談高職院校圖書館思想政治教育功能及實施路徑
        論智慧圖書館的三大特點
        久久影院午夜理论片无码| 最新国产精品精品视频| 色综合久久精品中文字幕| 蜜桃视频在线免费观看| 性欧美videofree高清精品| 欧美在线综合| 色婷婷久久99综合精品jk白丝 | 亚洲成av人最新无码| 免费观看视频在线播放| 日本久久精品福利视频| 性色av免费网站| 亚欧AV无码乱码在线观看性色 | 尤物视频一区二区| 少妇被搞高潮在线免费观看| 九一免费一区二区三区偷拍视频 | 日日av拍夜夜添久久免费| 欧洲国产精品无码专区影院| 日本一区二区三区丰满熟女| 亚洲人成电影网站色| 无遮挡边吃摸边吃奶边做| 精品久久久久久99人妻| 国产亚洲成人精品久久久| 巨大巨粗巨长 黑人长吊| 热の国产AV| 亚洲精品一区二区三区国产| 漂亮人妻被强了完整版| 蜜臀av 国内精品久久久| 国产精品国产三级国产专播| 丝袜美腿一区在线观看| 中国老太婆bb无套内射| 五十路熟女一区二区三区| 国产精品一区二区日韩精品| 日本视频一区二区三区一| 午夜无码片在线观看影视| 女同av在线观看网站| 少妇被粗大的猛进69视频| 免费看男女做羞羞的事网站| 精品久久久久久久久免费午夜福利| 国产在线拍91揄自揄视精品91| 国精产品一区一区三区有限在线 | 国产网红一区二区三区|