亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        疫情背景下圖書館輿情感知與監(jiān)控策略探析

        2022-02-08 10:24:33王海川
        內(nèi)蒙古科技與經(jīng)濟 2022年1期
        關(guān)鍵詞:圖書館文本疫情

        王海川

        (河北工程大學,河北 邯鄲 056038)

        在信息化的時代,社交網(wǎng)絡(luò)的飛速發(fā)展給人們的生活與學習帶來了深刻影響,人們在身處現(xiàn)實世界的同時,普遍熱衷于在虛擬世界尋求“身體在場”與“精神在場”的空間秩序的體驗,虛擬的社交網(wǎng)絡(luò)是對現(xiàn)實世界的投射,又不可避免地對現(xiàn)實世界產(chǎn)生影響。因此,各行業(yè)特別是服務(wù)行業(yè)非常重視用戶在社交網(wǎng)絡(luò)中的相關(guān)評價。圖書館從本質(zhì)上來說也是一類服務(wù)行業(yè),其服務(wù)品質(zhì)的優(yōu)劣直接影響到讀者對于知識的獲取、內(nèi)化的水平。2020年,一場席卷全世界范圍的新型冠狀病毒肺炎疫情至今沒有停息,該種病毒極具傳染性,這一特性甚至重塑了人們在線下公共場所活動的規(guī)則與秩序,產(chǎn)生了深遠的現(xiàn)實影響。在這一背景下,圖書館應(yīng)當給予線上用戶評價同樣的重視,即應(yīng)當對網(wǎng)絡(luò)用戶相關(guān)評價進行監(jiān)測。

        1 概念及研究現(xiàn)狀

        圖書館的網(wǎng)絡(luò)監(jiān)測分為兩個部分,即公眾形象感知和突發(fā)事件監(jiān)測。前者代表用戶的日常評價所形成的圖書館認知體系,后者代表了圖書館在突發(fā)事件時在網(wǎng)絡(luò)中的檢測、預(yù)警和化解的能力。這是圖書館輿情監(jiān)控系統(tǒng)的兩個重要組成部分。

        對于前者,陽玉堃在社交文本海量采集的基礎(chǔ)上,從基礎(chǔ)設(shè)施、館員服務(wù)、機構(gòu)管理、館藏文獻等方面對文本進行剖析,并結(jié)合了關(guān)鍵詞、高頻詞、語義網(wǎng)絡(luò)等技術(shù),將對于圖書館不同方面的印象進行了可視化的展示,這為讀者感知研究提供了新的途徑[1]。

        對于圖書館的突發(fā)事件,張偉認為應(yīng)當建立輿情信息預(yù)警平臺,要主動收集,分析涉及圖書館公共安全方面的信息,對于危機事件要能夠及時了解,分析和預(yù)警,以保證館舍的安全[2]。但是該文對于系統(tǒng)架構(gòu)技術(shù)論述較少。馬益勇則認為應(yīng)當設(shè)立圖書館輿情崗位,建立圖書館館外合作機制,并且做好輿情監(jiān)測的統(tǒng)籌角色,集思廣益,提高圖書館在各個領(lǐng)域的角色價值。

        總體來看,對于圖書館輿情監(jiān)測方面的研究還較少,且未結(jié)合疫情這一新的背景形勢。因此,筆者的選題具有一定的現(xiàn)實與研究價值。

        2 疫情給圖書館輿情監(jiān)測工作帶來的挑戰(zhàn)

        首先是圖書館在決策層面上需要給予足夠的重視,要充分認識到疫情情況下,任何公共事件的發(fā)生都具有更大的危險性,不僅會影響到正常的工作秩序,更會在網(wǎng)絡(luò)上引發(fā)較大的事件漲落,因此如何處理、如何防范、如何善后,這是新問題帶來的新挑戰(zhàn)。

        疫情的流行改變了人們在圖書館等公共場所的活動規(guī)則,即在正常情況下可以開展的閱讀推廣、講座、會議等必須改為在線上進行,這意味著會后更多的圖書館用戶也會傾向于在網(wǎng)絡(luò)中針對圖書館的服務(wù)、管理、館藏文獻水平以及館舍硬件好壞發(fā)表感想,進行討論,同時對圖書館在線服務(wù)水平進行評價,這會使得相關(guān)的關(guān)鍵詞大幅增加。

        在疫情期間,由于人們的心理狀態(tài)處于相對敏感時期,各項線下防疫措施較為嚴格,各項活動安排會受防疫工作影響,因此相應(yīng)的,在圖書館這類公共區(qū)域,突發(fā)事件的發(fā)生概率也會較高。那么就意味著,在社交網(wǎng)絡(luò)中,相關(guān)事件漲落發(fā)生的概率也較大。事實上,即使在平時,圖書館相關(guān)的網(wǎng)絡(luò)熱點事件也是存在的。例如在2018年12月份,安徽某學院的一位學生在圖書館大廳背書,因為聲音較大而與管理員發(fā)生口角,并進而發(fā)展為摔杯子事件。這一事件在社交網(wǎng)絡(luò)上被持續(xù)關(guān)注,評論數(shù)為6 193,轉(zhuǎn)發(fā)數(shù)為2 300,點贊數(shù)為7 600。這在圖書館的相關(guān)事件中的關(guān)注度是較高的。又如2019年山東某大學的兩名同學在圖書館因爭搶座位而打架,最終被學校處以警告處分,并被圖書館列入讀者黑名單。這一事件在微博上引起軒然大波,至今閱讀量已達206萬,評論及轉(zhuǎn)發(fā)也達5 000余次。這是圖書館輿情分析的重要資源。那么在疫情期間,可以推知的是,在社交網(wǎng)絡(luò)中,這類圖書館公共事件勢必會與疫情因素相互疊加,產(chǎn)生更大的影響力和傳播力。這是圖書館工作需要特別關(guān)注的。

        在技術(shù)的應(yīng)用上,疫情背景下的輿情監(jiān)測,需要圖書館加強對包含特定關(guān)鍵詞數(shù)據(jù)的探測,及時掌握用戶情緒動向,特別是要警惕謠言的產(chǎn)生與辨別,平臺要具有發(fā)現(xiàn),分析研判,上報甚至報警功能,這也是疫情背景下對輿情工作提出的挑戰(zhàn)。

        在疫情背景下,社交網(wǎng)絡(luò)中的相關(guān)數(shù)據(jù)量激增,而且在相當長的一段時間內(nèi)必將持續(xù)產(chǎn)生大量相關(guān)文本,這對系統(tǒng)可靠度提出了更高的要求。事實上,在疫情常態(tài)化的實際情況下,如何增強冗余性,保證疫情監(jiān)控平臺的長期,不間斷的運行,這是對圖書館輿情監(jiān)測提出的又一項挑戰(zhàn)。

        3 輿情監(jiān)測平臺的技術(shù)架構(gòu)

        輿情平臺的基本架構(gòu)涉及數(shù)據(jù)采集、模型訓(xùn)練、數(shù)據(jù)處理、結(jié)果輸出等多個環(huán)節(jié),需要利用爬蟲、分類器、模型訓(xùn)練等多種技術(shù)。

        3.1 數(shù)據(jù)爬蟲

        爬蟲是輿情檢測系統(tǒng)的前端模塊,它的主要作用是模擬瀏覽器向特定的網(wǎng)站HTTP發(fā)送網(wǎng)絡(luò)請求Request,接受請求響應(yīng),按照一定的規(guī)則,自動的抓去網(wǎng)站信息上并獲取數(shù)據(jù)到本地。這是一種代替人工的自動化模塊。按照不同的類型,爬蟲可以分為通用爬蟲、聚焦爬蟲、功能性爬蟲、數(shù)據(jù)增量爬蟲等。一個完善的爬蟲模塊應(yīng)當是框架結(jié)構(gòu)合理,獲取技術(shù)優(yōu)良,高度優(yōu)化的代碼,容易管理和維護。在通常的輿情檢測系統(tǒng)中,爬蟲的運行是以周、月來計算的,數(shù)據(jù)量非常大,優(yōu)秀的爬蟲設(shè)計能夠保證系統(tǒng)在這一過程中少犯錯誤。同時,爬蟲在實現(xiàn)數(shù)據(jù)采全的基礎(chǔ)上,要做到較少的占用資源。對于爬蟲來說,主要的判斷標準有:獲取時間、請求解析時間、腳本支持、CPU占用等。此外,長時間運行的爬蟲還應(yīng)當保證不會出現(xiàn)內(nèi)存泄漏。目前一些網(wǎng)站安裝有反扒策略,例如,網(wǎng)站后臺會監(jiān)控來自同一IP地址的大量訪問,或者要求必須要有訪問賬號,或者是不定時彈出驗證碼識別等。而爬蟲要能夠模仿人類操作,采取聯(lián)合爬取,自動注冊賬號,模擬User-Agent,訪問時帶cookie等。

        3.2 數(shù)據(jù)預(yù)處理模塊

        數(shù)據(jù)分析模塊集中了一系列數(shù)據(jù)預(yù)處理、數(shù)據(jù)分類、主題抽取等技術(shù)。在預(yù)處理功能中,包括分詞,移除微博文本中的網(wǎng)絡(luò)符號、超鏈接、亂碼、停用詞、重復(fù)數(shù)據(jù)清除、非漢語清除、大小寫轉(zhuǎn)化等,總之就是清除所有的不規(guī)范數(shù)據(jù),將主要文本的微博數(shù)據(jù)轉(zhuǎn)換為規(guī)范數(shù)據(jù),減少數(shù)據(jù)噪聲,得到質(zhì)量更好的數(shù)據(jù)。目前Python語言的一些庫,如Jieba、Numpy等被用來實現(xiàn)上述功能。

        接下來是文本特征提取,這是監(jiān)測系統(tǒng)中對文本重點詞匯進行分析的環(huán)節(jié),是用來區(qū)分。最常用的有TF-IDF,其基本思想是在一段文本中出現(xiàn)多次的單詞,再另一個同類文本中也會出現(xiàn)多次,反之,一個單詞很少在一個文本中出現(xiàn),那么其在同類文本中也很少會出現(xiàn),這就能夠衡量出該詞的特征區(qū)別度,即字詞的重要性隨著它在文本中出現(xiàn)的次數(shù)呈正比增加,但隨著該詞在語料庫中出現(xiàn)的頻率成反比下降。這一算法被廣泛地應(yīng)用在了各類檢索模型。

        另一個常用算法是信息增益(IG),其基本思想是衡量該詞能夠為系統(tǒng)帶來多少信息,帶來的信息越多,該特征就越重要。即信息熵的改變程度。此外,還有獨熱編碼,互信息等算法可供選擇。

        3.3 分類模型構(gòu)建

        分類模型的構(gòu)建是輿情監(jiān)測系統(tǒng)的核心。也是學者研究較多的方面,在機器學習的時代,貝葉斯、向量積、決策樹、集成學習、邏輯回歸等都能完成這一任務(wù),其中,貝葉斯算法較為簡單和經(jīng)典。它認為,在文本中,兩個詞之間的關(guān)系是相互的,一個對象的特征向量中每個維度都是相互獨立的。在訓(xùn)練階段,貝葉斯程序能夠從詞袋中收集信息,學習每一種兩兩詞組合的后驗概率,通過比較概率的大小來得到文本所屬的類別。一般來說,對于社交文本的文本分類來說,上述算法是能夠完成任務(wù)的,但是目前,神經(jīng)網(wǎng)絡(luò)算法正被得到廣泛的應(yīng)用,這類算法模擬人腦工作的原理,構(gòu)建出很多個神經(jīng)元,其本身具有輸入層、隱藏層和輸出層,之間的計算辦法就是加權(quán)求和激活,即Sigmoid函數(shù)。以TextCNN為例,這些算法能夠?qū)⑽谋窘馕鰹榫仃?,就是將?xùn)練集的文本特征向量化輸入,在經(jīng)過連接點權(quán)重傳入下一層,這一層的輸出是下一層的輸入。自然語言是一維數(shù)據(jù),向量化進入卷積層后與卷積核做一個point wise的乘法后求和,然后是卷積。接下來,算法掃描向下滑動,持續(xù)輸入,持續(xù)做point wise乘法后求和,然后是池化層,以降低參數(shù)的數(shù)目。最后由softmax函數(shù)做分類。這是一個基本的流程。神經(jīng)網(wǎng)絡(luò)算法的優(yōu)點在于是具有較強的非線性映射能力,實現(xiàn)了從輸入到輸出的映射功能。此外,神經(jīng)網(wǎng)絡(luò)還具有一定的泛化能力,對于新的或者帶有噪聲的數(shù)據(jù)也能有較好的分類能力。

        目前,神經(jīng)網(wǎng)絡(luò)算法發(fā)展出了遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等,并且自注意力機制等也逐漸被加入進來,算法機制逐步成熟。因此,神經(jīng)網(wǎng)絡(luò)算法模塊是數(shù)據(jù)解析模塊的首選算法。

        3.4 分析結(jié)果管理模塊

        在一個成熟的監(jiān)控系統(tǒng)中,目標文本應(yīng)當能夠被按照各種口徑進行劃分,比如某個事件段的情感比例、情感數(shù)量、高頻詞匯、關(guān)鍵詞語義網(wǎng)絡(luò)、文本主題分類、用戶行為分析等,并且能夠可視化的輸出時序圖、分類圖等,以供使用者參考和決策輔助之用。

        3.5 數(shù)據(jù)庫

        數(shù)據(jù)庫的作用是用來存儲爬蟲所收集的數(shù)據(jù)字段內(nèi)容,對于社交網(wǎng)絡(luò)文本,往往包括了發(fā)布者、文本內(nèi)容、發(fā)布時間、點贊數(shù)、轉(zhuǎn)發(fā)數(shù),評論數(shù)和評論文本、發(fā)布用戶等字段,以被調(diào)用和存儲分類結(jié)果。

        4 疫情背景下輿情系統(tǒng)的改進策略

        新冠肺炎疫情是圖書館在發(fā)展中面臨的新課題,綜合以上所述,圖書館輿情監(jiān)測工作應(yīng)當從管理和技術(shù)兩個方面進行改進。

        4.1 管理方面的改進

        圖書館是社會、學校中理所當然的公共場所,并且閱讀活動具有一定的私人性質(zhì),小規(guī)模聚集,討論是應(yīng)有之義。那么在此時的輿情監(jiān)測方面,①應(yīng)當成立專門的管理小組,專人負責,集中利用系統(tǒng)定制收集讀者對于圖書館文獻服務(wù)、館舍布局、疫情防控措施等方面的意見建議。②要注意疫情期間輿情信息的公開透明,對內(nèi)部應(yīng)當充分共享,以利于合作防控,對于外部要及時生成輿情期間的輿情監(jiān)測報告,下情上達。要特別關(guān)注開學、學期末期、學生畢業(yè)等關(guān)鍵節(jié)點的輿情監(jiān)測工作,發(fā)揮系統(tǒng)的技術(shù)優(yōu)勢。同時要做好基于疫情報告的引導(dǎo)工作,及時發(fā)現(xiàn)問題,制定措施,解決問題。注意信息的對外及時公布,避免引起恐慌。

        4.2 技術(shù)方面的改進

        目前,基于神經(jīng)網(wǎng)絡(luò)算法的分類器技術(shù)發(fā)展迅速,BERT,Transformer,self-attention等技術(shù)的加入使得分類的準確度更高,運行速度更快,系統(tǒng)學習率更高,因此應(yīng)當采用最新技術(shù)來提高系統(tǒng)性能。

        在疫情背景下,輿情分析系統(tǒng)應(yīng)當能夠有重點的實施日常和突發(fā)事件中的監(jiān)控行為。①語義分析,即需要分析“疫情”“新冠”等特定關(guān)鍵詞所聯(lián)系較多的詞匯有哪些,這些詞匯那些與圖書館由關(guān)聯(lián),那些直接指向圖書館的服務(wù),應(yīng)當被明確。②情感分析。文本的情感分析是輿情分析中重要的一個方面,如前所述,疫情期間用戶的情緒與平時相比較為敏感,因此輿情系統(tǒng)應(yīng)當感知到日常閱讀活動中讀者的情緒有哪些是消極的,那些是積極的,而這些積極與消極的情緒所指向的圖書館服務(wù)的那些方面也應(yīng)當明確。③目前,國內(nèi)的疫情已經(jīng)持續(xù)一段時間了,在這期間,關(guān)于疫情的關(guān)鍵詞在不斷地變化,死亡率、感染率、無癥狀、環(huán)境等詞匯,系統(tǒng)應(yīng)當增加基于這些關(guān)鍵詞的疫情態(tài)勢圖,同時應(yīng)當注意與圖書館、閱讀等詞匯共線的文本都是哪些,并展開深入研究。

        猜你喜歡
        圖書館文本疫情
        戰(zhàn)疫情
        抗疫情 顯擔當
        疫情中的我
        37°女人(2020年5期)2020-05-11 05:58:52
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        飛躍圖書館
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        去圖書館
        亚洲欧美色一区二区三区| 日韩av中文字幕一卡二卡| 日本免费看一区二区三区| 欧美xxxxx高潮喷水麻豆| 99久久精品日本一区二区免费| 激情影院内射美女| 精品2021露脸国产偷人在视频| 91产精品无码无套在线| 亚洲性码不卡视频在线| 一区二区国产av网站| 丰满人妻一区二区三区视频53| 国产成年女人特黄特色毛片免| 1000部拍拍拍18勿入免费视频下载| 国产亚洲精品A在线无码| 中文字幕你懂的一区二区| 国产亚洲成人精品久久| 国产中文字幕乱人伦在线观看| 亚洲不卡中文字幕无码| 亚洲AV无码一区二区三区精神| 色妞一区二区三区免费视频| 亚洲精品粉嫩美女一区| 熟女体下毛毛黑森林| 欧美国产日本精品一区二区三区| 搡老女人老妇女老熟妇69| 亚洲免费一区二区三区四区| 久久久久av无码免费网| 欧美日韩另类视频| 精品日本韩国一区二区三区| 在线精品首页中文字幕亚洲| 国内精品卡一卡二卡三| 国产成人无码精品久久99| 国产av黄色一区二区| 国产乱码人妻一区二区三区| 中国a级毛片免费观看| 亚洲精品日本| 粉嫩人妻91精品视色在线看| 久久精品国产久精国产果冻传媒| 人成午夜免费大片| 麻豆久久久国内精品| 久久综合久久综合久久| 亚洲色欲色欲大片www无码|