亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        公共圖書館智能圖書采購探索

        2023-09-15 01:56:08
        數(shù)字通信世界 2023年8期
        關(guān)鍵詞:圖書館內(nèi)容模型

        楊 瀟

        (首都圖書館,北京 100021)

        “推進文化自信自強,鑄就社會主義文化新輝煌”[1]是二十大報告中對文化工作的綱領(lǐng)性指導(dǎo)和對文化工作者的新要求。作為公共文化服務(wù)主陣地之一,圖書館的主要職能是為群眾提供更多、更好、更具時代特色的精神文化資源。圖書的選擇是保障這一職能發(fā)揮的基礎(chǔ),直接決定著圖書館館藏質(zhì)量和服務(wù)水平。然而,當(dāng)前國內(nèi)公共圖書館的圖書采購多以采購人員個人的主觀意愿和經(jīng)驗為主要依據(jù)。將新的信息技術(shù)、采購模式和管理模式融入采購決策過程,已成為公共圖書館未來的建設(shè)方向。

        1 圖書智能采購模型相關(guān)研究

        早期智能化采購的代表性模型是拉斯氏選書模型。國內(nèi)學(xué)者結(jié)合圖書館實際情況,提出了許多改進方案[1]。例如,王積和提出了重點藏書和一般藏書兩個選書模型[2],胡修琦等人將選書標準分為6項,讀者需求劃分為三級,構(gòu)建了選書模型[3]。隨著大數(shù)據(jù)時代的到來,新的技術(shù)和算法被引入,圖書智能采購決策系統(tǒng)逐漸細化和深入,并從單一算法模式研究轉(zhuǎn)向多算法結(jié)合。例如,劉鴻雁等學(xué)者提出了以消費者均衡理論為核心的資金按類分配模型[4],趙研科利用Apriori算法和決策樹等數(shù)據(jù)挖掘算法[5],通過對用戶歷史行為記錄的挖掘,開發(fā)了圖書采購輔助決策系統(tǒng)。此外,許多學(xué)者利用人工智能技術(shù),如BP神經(jīng)網(wǎng)絡(luò)智能算法[6-8]、貝葉斯網(wǎng)理論[9-10]和隨機森林[11],建立不同側(cè)重點的采購模型。周志強等學(xué)者將BP神經(jīng)網(wǎng)絡(luò)算法和SVM算法與遺傳算法GA相結(jié)合,搭建了混合智能采購模型[12]。

        目前,智能圖書采購模型的研究主要集中在高校圖書館領(lǐng)域,公共圖書館的采購模型研究相對較少。然而,高校圖書館和公共圖書館在文獻資源館藏建設(shè)方向、讀者構(gòu)成、服務(wù)宗旨、經(jīng)費構(gòu)成等方面存在顯著差異。如果簡單地將高校圖書館的采購模式應(yīng)用于公共圖書館,可能會導(dǎo)致選書方向上的偏差。因此,本文選擇首都圖書館2018—2022年的中文圖書采購數(shù)據(jù)作為實驗基礎(chǔ)源數(shù)據(jù),探索一種新的采購模式,以信息技術(shù)為主,主觀經(jīng)驗為輔,對公共圖書館的智能化采購進行探索。

        2 構(gòu)建適應(yīng)公共圖書館中文圖書采購模型的準備

        2.1 書目數(shù)據(jù)資源信息的建立

        為了實現(xiàn)批量化智能操作,我們與供貨商和出版社進行了多次溝通和反復(fù)修改,最終確定了書目數(shù)據(jù)提供的格式規(guī)范和著錄內(nèi)容的標準化。我們統(tǒng)一了書目模板,其中包括ISBN、題名、副題名、分卷號、分卷名、叢編項、頁數(shù)、尺寸、分類號、讀者對象和圖書簡介?;诖?,我們結(jié)合本館的館藏資源建設(shè)方針,對供貨商提供的原始書目數(shù)據(jù)進行初步分類智能篩選。我們制定了流程圖(見圖1),以便更好地比對和分析數(shù)據(jù)信息。

        圖1 圖書采購流程圖(前期部分)

        經(jīng)過對數(shù)據(jù)的分類篩選,可將館配商所提供的原始書目劃分成5 個新書目表。將新書目表1導(dǎo)出,以便日后定期對高碼洋圖書采購進行有針對性的采訪小組內(nèi)部討論。對新書目表2則按照館藏政策進行預(yù)訂購,導(dǎo)出預(yù)訂購數(shù)據(jù)表,采購人員確認后下訂。對新書目表3中的圖書按每種1冊預(yù)訂購,導(dǎo)出數(shù)據(jù)表格由采購人員確認后下訂。新書目表4 作為連續(xù)出版物書目,其情況相對復(fù)雜,可分為兩種情況進行處理(見圖2)。最后,將新書目4處理形成的新書目表6與新書目表5進行匯總,形成一份書目信息表格,以便進行下一步只能采購演算。

        表1 程序?qū)С龅?00本推薦分數(shù)最高的圖書

        圖2 新書目表4的處理流程圖

        2.2 圖書采購?fù)扑]算法

        圖書采購?fù)扑]算法是公共圖書館中的一個重要算法。由于缺乏用戶行為數(shù)據(jù),傳統(tǒng)的協(xié)同過濾推薦算法無法直接應(yīng)用于圖書館的新書采購。因此,基于內(nèi)容的推薦算法和基于知識圖譜的推薦算法成為圖書館推薦系統(tǒng)中常用的兩種算法?;趦?nèi)容的推薦算法可以根據(jù)圖書的屬性(如書名、作者、出版社、分類等)來計算它們之間的相似性,然后推薦與歷史購買的圖書相似的新圖書。基于知識圖譜推薦算法則通過建立圖書之間的關(guān)系來推薦相應(yīng)的圖書。例如,如果歷史購買中有很多計算機科學(xué)類的圖書,那么可以推薦其他與計算機科學(xué)相關(guān)的圖書。

        本文將基于內(nèi)容的推薦算法和基于知識圖譜的推薦算法相結(jié)合(見式(1)),可以進一步提高推薦的準確性和個性化程度。在綜合推薦分數(shù)的計算中,可以通過調(diào)整權(quán)重因子來平衡兩種算法的影響力。例如,當(dāng)需要強調(diào)基于內(nèi)容的推薦算法時,可以將權(quán)重因子α設(shè)定為較大的值;反之,當(dāng)需要強調(diào)基于知識圖譜的推薦算法時,可以將權(quán)重因子α設(shè)定為較小的值。式中,表示第本新圖書的推薦分數(shù);表示第 個新圖書與歷史采購書目中的圖書的相似度;表示第個新圖書與歷史采購書目中的圖書的關(guān)聯(lián)度;為調(diào)節(jié)參數(shù),用于平衡兩種算法的推薦分數(shù)。

        3 公共圖書館中文圖書采購智能模型的搭建

        3.1 基于內(nèi)容的推薦算法

        為了使用基于內(nèi)容的推薦算法推薦新的圖書列表,可以使用TF-IDF算法來提取每本圖書的特征向量。首先,將歷史MARC數(shù)據(jù)中的330字段和新書目中的圖書介紹內(nèi)容作為文本數(shù)據(jù),使用TF-IDF算法計算每個關(guān)鍵詞在文檔中的重要性,方法是將關(guān)鍵詞在文檔中的詞頻和逆文檔頻率相乘。然后,選取N個關(guān)鍵詞作為每本圖書的特征向量。最后,使用余弦相似度來計算每本圖書之間的相似度,余弦相似度值越大,表示兩本圖書越相似。因此,通過基于歷史書目的屬性和特征,可以從新書目中挑選出具有類似屬性和特征的圖書。

        vectorizer = TfidfVectorizer(max_features=5000)

        book_descriptions = history_data['book_description'].fillna('')

        book_names = history_data['book_name']

        book_name_and_descriptions = book_names+ ' ' + book_descriptions

        book_features = vectorizer.fit_transform(book_

        name_and_descriptions)

        new_book_names = new_data['book_name']

        new_book_descriptions = new_data['book_description'].fillna('')

        new_book_name_and_descriptions = new_book_names + ' ' + new_book_descriptions

        new_book_features = vectorizer.transform(new_book_name_and_descriptions)

        similarity_matrix = cosine_similarity(new_book_features, book_features)

        recommendations = {}

        for i, new_book in enumerate(new_book_names):

        similarity_scores = similarity_matrix[i]

        recommendation_score = sum(similarity_scores) / len(similarity_scores)

        recommendations[new_book] = recommendation_score

        sorted_recommendations = sorted(recommendations.items(), key=lambda x: x[1], reverse=True)

        3.2 基于知識圖譜的推薦算法

        基于知識圖譜的推薦算法通過構(gòu)建一個包含每本書、其作者和出版商的圖形結(jié)構(gòu)來遴選采購新書。與傳統(tǒng)的推薦算法不同,該算法不需要對用戶行為進行跟蹤或收集,而是利用圖書的元數(shù)據(jù)構(gòu)建一個整體的知識圖譜。具體而言,每本圖書作為一個節(jié)點,使用圖書的元數(shù)據(jù)作為節(jié)點的屬性,并通過圖書之間的關(guān)系(如作者、出版社、主題詞、分類號等),尤其是采用相鄰歷史書籍之間的關(guān)聯(lián)來連接節(jié)點,形成一個半結(jié)構(gòu)化的圖形數(shù)據(jù)庫。利用構(gòu)建好的知識圖譜,我們可以計算每本新書與歷史書籍之間的關(guān)聯(lián)度,從而推薦相關(guān)的圖書。例如,在推薦新書時,我們可以根據(jù)新書的作者、出版商等屬性在圖譜中找到其鄰居節(jié)點,并通過計算它們之間的邊權(quán)重來得到與新書相關(guān)的推薦書目。該算法可以幫助用戶發(fā)現(xiàn)與其喜好相關(guān)的新書,同時確保用戶的隱私不受侵犯。

        graph = build_knowledge_graph(history_data)

        new_books = set(new_data['book_name'])

        recommendations2 = {}

        for book in new_books:

        if book not in graph:

        continue

        for neighbor in graph.neighbors(book):

        if neighbor != book and neighbor not in new_books:

        weight = graph[book][neighbor]['weight']

        if neighbor not in recommendations2:

        recommendations2[neighbor] = 0

        recommendations2[neighbor] += weight

        sorted_recommendations2 = sorted(recommendations2.items(), key=lambda x: x[1], reverse=True)

        def build_knowledge_graph(data):

        # 創(chuàng)建知識圖譜

        graph = nx.Graph()

        # 添加節(jié)點

        for _, row in data.iterrows():

        book = row['book_name']

        author = row['author']

        publisher = row['publisher']

        graph.add_node(book, bipartite='book')

        graph.add_node(author, bipartite='author')

        graph.add_node(publisher, bipartite='publisher')

        # 添加邊

        graph.add_edge(book, author, weight=1)

        graph.add_edge(book, publisher, weight=1)

        return graph

        3.3 綜合推薦分數(shù)

        綜合基于內(nèi)容的推薦算法和基于知識圖譜的推薦算法,可以為采購人員提供更全面和準確的推薦服務(wù)。為了得到綜合推薦分數(shù),我們使用加權(quán)平均法,其中權(quán)重參數(shù)α為0.8。該值是根據(jù)實驗結(jié)果得到的最優(yōu)值,但對于不同的數(shù)據(jù)集,可能需要進行調(diào)整。

        首先對基于內(nèi)容的推薦算法得到的推薦結(jié)果進行加權(quán)平均,其中權(quán)重為0.8,然后對基于知識圖譜的推薦算法得到的推薦結(jié)果進行加權(quán)平均,其中權(quán)重為0.2。最終,將兩者得到的推薦分數(shù)加和,得到綜合推薦分數(shù)。

        combined_recommendations = {}

        for book, score in sorted_recommendations:

        if book not in combined_recommendations:

        combined_recommendations[book] ={'book_score': 0.8 * score}

        else:

        combined_recommendations[book]['book_score'] += 0.8 * score

        for book, score in sorted_recommendations2:

        if book in combined_recommendations:combined_recommendations[book]['graph_score'] = 0.2 * score

        sorted_combined_recommendations =sor ted(combi ned_recom mend ations.items(),key=lambda x: x[1]['book_score'] + x[1].get('graph_score', 0), reverse=True)

        3.4 實驗結(jié)果

        本實驗使用了最近5年的圖書采購數(shù)據(jù),并給定了一個新的圖書列表。基于此,我們開發(fā)了一個推薦程序,采用基于內(nèi)容和知識圖譜的推薦方法,對給定的新書列表進行推薦。具體而言,程序計算了每本書基于內(nèi)容和知識圖譜的推薦分數(shù),并采用加權(quán)α值為0.8的方法對兩種推薦分數(shù)進行綜合評分,以得到最終的推薦分數(shù)。最后,程序?qū)⑺型扑]的圖書按照推薦分數(shù)進行排序,輸出前100本推薦分數(shù)最高的圖書(見表格1)。

        通過本實驗的結(jié)果可以發(fā)現(xiàn),該推薦程序能夠找到那些與給定書籍具有相似主題和內(nèi)容的書籍,同時還能考慮到知識圖譜中的關(guān)聯(lián)性。這表明,當(dāng)推薦系統(tǒng)利用基于內(nèi)容和知識圖譜的推薦方法進行綜合評估時,能夠為讀者提供更加個性化和精準的推薦服務(wù)。值得一提的是,該推薦系統(tǒng)還具有一定的健壯性(Robustness),能夠在不同的α值下表現(xiàn)出不錯的推薦效果。為了驗證推薦系統(tǒng)的性能,我們還進行了一些額外的實驗。具體來說,我們分別在不同的α值下進行實驗,發(fā)現(xiàn)在α值為0.8時,推薦系統(tǒng)的性能最佳。這進一步證實了該程序的有效性和實用性。

        4 結(jié)束語

        隨著人工智能技術(shù)的不斷發(fā)展,它為圖書館各項業(yè)務(wù)的創(chuàng)新升級提供了新的思路與方式。作為一名新時代的圖書館采購人員,我們需要緊跟時代的發(fā)展,不斷加深對人工智能的學(xué)習(xí)與研究,并結(jié)合圖書館的圖書采購流程,探索其應(yīng)用的結(jié)合點和突破點,助力傳統(tǒng)圖書采購工作的轉(zhuǎn)型。同時,隨著用戶行為數(shù)據(jù)的引入,我們可以應(yīng)用更多的智能算法,如協(xié)同過濾、深度學(xué)習(xí)等,從而進一步提高推薦算法的準確性和可靠性。在未來,我們可以逐步引入各大權(quán)威圖書榜單的實時數(shù)據(jù)等內(nèi)容,使圖書采購更具綜合性與時效性,推動智能圖書館的不斷發(fā)展。通過人工智能技術(shù)與圖書館采購流程的結(jié)合,我們可以更好地滿足讀者需求,提高圖書的利用率和借閱量,從而為圖書館的可持續(xù)發(fā)展做出貢獻?!?/p>

        猜你喜歡
        圖書館內(nèi)容模型
        一半模型
        內(nèi)容回顧溫故知新
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        飛躍圖書館
        3D打印中的模型分割與打包
        主要內(nèi)容
        臺聲(2016年2期)2016-09-16 01:06:53
        去圖書館
        国产99久久久国产精品免费| 在教室伦流澡到高潮hgl视频| 亚洲一区二区三区偷拍女厕 | 极品美女高潮喷白浆视频| 久久伊人中文字幕有码久久国产| 一区二区三区在线视频观看 | 五月婷婷开心六月激情| 无码aⅴ精品一区二区三区浪潮| 高中生粉嫩无套第一次| 久久久久成人精品免费播放网站| 亚洲精品456在线播放狼人| 中文字幕乱码日本亚洲一区二区| 久久97久久97精品免视看 | 亚洲AV成人无码国产一区二区| 国产自产在线视频一区| 亚洲av天堂在线视频| 国产在视频线精品视频| 色爱无码A V 综合区| 亚洲精品综合久久国产二区| 色欲av永久无码精品无码蜜桃| 亚洲自偷自拍熟女另类| 久久久久久久久久免免费精品| 国产成人精品一区二区三区av| 五月天国产成人av免费观看| 免费的成年私人影院网站| 激情人妻中出中文字幕一区| 国产黑色丝袜在线看片| 国产精品_国产精品_k频道| 成人无码视频在线观看网站| 日本岛国大片不卡人妻| 中文字字幕在线中文乱码解| 小说区激情另类春色| 久久久久亚洲精品天堂| AV中文字幕在线视| 那有一级内射黄片可以免费看| 久久久久久人妻一区精品| 97色偷偷色噜噜狠狠爱网站97| 精品日韩在线观看视频| 久久99国产综合精品| 成人国产精品999视频| 一区二区三区少妇熟女高潮|