亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶畫像的數(shù)字檔案館個性化服務研究

        2021-11-26 16:51:26熊回香李昕然代沁泉華中師范大學信息管理學院
        浙江檔案 2021年7期
        關鍵詞:資源用戶服務

        熊回香 李昕然 代沁泉/華中師范大學信息管理學院

        隨著網(wǎng)絡技術的迅猛發(fā)展,Web3.0在Web2.0的基礎上以“個性、精準和智能”的核心理念成為新一代互聯(lián)網(wǎng)的顯著特征。在這樣的發(fā)展潮流下,檔案學界對數(shù)字檔案館的建設和發(fā)展賦予了新的內容和技術要求。一方面,數(shù)字檔案資源已呈現(xiàn)出檔案數(shù)據(jù)化的趨勢;另一方面,檔案用戶面對海量異構的檔案原始數(shù)據(jù)難以在短時間內高效獲取有價值的信息,其個性化的需求得不到滿足。集收集、保管、開發(fā)利用等管理過程于一體的數(shù)字檔案館的傳統(tǒng)服務方式已難以適應新環(huán)境和新需求,迫切需要進行變革。近年來,用戶畫像作為一種數(shù)據(jù)分析模型,通過對用戶的基本屬性、行為記錄和興趣偏好等進行標簽化,使用戶信息高度凝練,進而挖掘出用戶的需求特征,其已在電子商務、圖書情報等不同領域得到具體實踐,且效果良好,為個性化服務奠定了基礎。本文將用戶畫像技術引入數(shù)字檔案館個性化服務,通過刻畫用戶全貌、分析用戶特征,幫助數(shù)字檔案館深入落實以用戶需求為導向的個性化服務,進而提高數(shù)字檔案館服務效率,使數(shù)字檔案資源價值得以最大化。

        1 研究評述

        用戶畫像作為大數(shù)據(jù)環(huán)境下分析用戶信息的模型,最早由Alan Cooper提出,它被定義為“表示真實用戶的虛擬代表”[1],目前國內外學者聚焦于用戶畫像的內涵、模型構建和具體應用等方面。本文認為用戶畫像是對用戶的基本信息、個性需求及興趣偏好等數(shù)據(jù)進行標簽化,通過抽象出的標簽信息構建模型來刻畫用戶全貌,強調用戶的主體地位,有效地將用戶需求與服務方向相聯(lián)系,為個性化服務打下基礎;個性化服務作為一種新型信息服務方式,根據(jù)用戶的需求和特征,主動提供相應服務,更具有針對性。在大數(shù)據(jù)滲透于社會各領域的背景下,個性化服務有效地為用戶解決了信息過載和信息迷航的問題[2];數(shù)字檔案館作為提供服務的主體,是存儲和利用檔案信息資源的知識空間,涉及館藏、網(wǎng)絡、數(shù)據(jù)庫等檔案資源。檔案信息資源的快速增多、用戶個性化需求的不斷增長、新興技術的尚未深入應用,使得數(shù)字檔案館難以應對大數(shù)據(jù)時代的強大數(shù)據(jù)壓力[3]。

        針對數(shù)字檔案館面臨的挑戰(zhàn),國內學者張開森最先在數(shù)字檔案館中引入個性化服務,以期提升服務質量,促進其在互聯(lián)網(wǎng)中的生存和發(fā)展[4];繼而王斌、王林等探討了數(shù)字檔案館提供信息分類定制、信息推送、信息智能代理、呼叫中心等個性化的服務模式[5][6]。由此可見,數(shù)字檔案館個性化服務依然以館藏為主,通過發(fā)揮館藏優(yōu)勢來滿足用戶需求。但是,要想為用戶提供高質量的個性化服務,前提是要全面了解用戶,用戶畫像的應用是刻畫用戶全貌、聯(lián)系用戶與服務的有效橋梁。陽曉萍等認為用戶建模技術是個性化服務的基礎和核心[7];陳媛等以數(shù)字圖書館為研究對象,提出建立個性化服務用戶模型構架來獲取用戶隱性興趣[8]。因此,用戶畫像和個性化服務相結合,將進一步提高個性化服務的針對性、精準性與高效性??v觀檔案領域,目前關于用戶畫像的研究相對較少,但已受到相關學者的關注。國外學者Kim HN闡述了用戶畫像在檔案館知識服務中的作用,通過個性化的用戶建模來推薦與用戶興趣相關的內容[9];國內周林興等學者分析了檔案館應用用戶畫像的需求,以此構建基于用戶畫像的檔案知識個性化推薦流程[10]??墒蔷唧w到用戶畫像在數(shù)字檔案館個性化服務中的應用,國內外的相關研究匱乏,檔案界應積極借鑒相關領域的經驗,加快推進用戶畫像的應用,以提高數(shù)字檔案館個性化服務的質量。

        2 當前我國數(shù)字檔案館個性化服務的現(xiàn)狀分析

        隨著檔案數(shù)字化工作的轉型,我國各級各類數(shù)字檔案館以自身館藏為基礎提供著不同程度的個性化服務,通過對我國31個省份的檔案信息網(wǎng)站和檔案館官網(wǎng)進行訪問瀏覽發(fā)現(xiàn),我國數(shù)字檔案館基本上能提供面向公眾交流、展覽、學習的個性化服務,但在內容質量、服務效果、用戶參與度等方面依然存在著不足。

        2.1 服務內容以館藏為主,個性化服務針對性不強

        目前我國絕大多數(shù)檔案館都擁有自己的門戶網(wǎng)站,比如青島、內蒙古數(shù)字檔案館建設有自己的官網(wǎng);北京、長沙、江西數(shù)字檔案館作為檔案信息網(wǎng)站的一個欄目,不斷推進館藏資源數(shù)字化。從館藏內容來看,我國數(shù)字檔案館大多以政務信息、歷史檔案、檔案文化等為主,而互動交流、預約查檔、利用效果等服務功能較少或者服務滯后,用戶的檔案問題得不到及時解決。事實上,當前我國大多數(shù)數(shù)字檔案館所提供的檔案服務并沒有突破傳統(tǒng)檔案服務的思維束縛,在具體實踐中更多的是利用互聯(lián)網(wǎng)技術和數(shù)字化設備將一些事先設計好的服務推送給用戶,并不能及時根據(jù)用戶的利用“場景”來調整優(yōu)化服務[11],針對性不強,因此不能很好地根據(jù)用戶的特點和需求來“定制”服務。

        2.2 館藏資源缺乏融合,知識性的個性化服務需加強

        數(shù)字檔案館的館藏資源反映了本地區(qū)、本單位的發(fā)展面貌、記憶沉淀與未來展望,突出了很強的地方特色,但是這樣的館藏建設使檔案資源面臨地域化、零散化、豐裕度不高、關聯(lián)性不強等問題。即使網(wǎng)站內設置了友情鏈接功能,但是鏈接的結果依然是各個檔案館的獨立資源,質量參差不齊,雖然節(jié)省了檢索時間,卻沒能從本質上提高數(shù)字檔案資源的服務效果。智能化時代,用戶更關注自己需求的滿足,渴望得到個性化、泛在化、快捷智能的知識服務[12]。因此,社會環(huán)境的變化和用戶動態(tài)化需求對數(shù)字檔案館服務提出了新的技術要求,檔案資源要實現(xiàn)分布式存儲與融合,用戶通過統(tǒng)一的檢索入口可以實現(xiàn)跨館檢索,得到的檢索結果經過去重、排序、整合等操作后以可視化的形式呈現(xiàn)給用戶。

        2.3 用戶數(shù)據(jù)較難采集,個性化服務生態(tài)環(huán)境脆弱

        隨著互聯(lián)網(wǎng)的深入發(fā)展,政府信息越來越公開透明,而我國檔案工作依然具有較強的政務性與機密性,所以相對于圖書館、電子商務等其他信息服務領域,我國數(shù)字檔案館服務受眾面比較局限,用戶群體規(guī)模相對較小,社會參與度和影響度不高,整個服務生態(tài)環(huán)境較為脆弱。通過訪問各個檔案館網(wǎng)站可以了解到,大多數(shù)數(shù)字檔案館首頁缺少對用戶相關數(shù)據(jù)的采集,比如用戶首登網(wǎng)站的注冊信息、訪問相關內容記錄、瀏覽網(wǎng)站停留時間等,對用戶行為的研究存在較大困難,個性化服務生態(tài)環(huán)境中“人”的必要因素欠缺。盡管大部分網(wǎng)站設置有公眾參與、互動交流、利用效果等版塊,但是用戶參與量較少、活躍度不高,提供服務的時間滯后,用戶的檔案問題不能得到及時解決,用戶的利用反饋沒有得到充分重視,用戶提出的問題不能得到及時解決,服務效率亟待提高。

        3 基于用戶畫像的數(shù)字檔案館個性化服務模型構建

        3.1 數(shù)據(jù)獲取層

        檔案用戶是數(shù)字檔案館提供個性化服務的核心對象,因此對用戶數(shù)據(jù)的采集是整個服務模型的基礎。當前,我國數(shù)字檔案館在一定程度上形成了固定的檔案用戶社群,其中包括政府機關工作人員、企業(yè)員工、專家學者、高校師生、社會公眾,并且公眾的規(guī)模在逐漸擴大。通過網(wǎng)絡爬蟲等采集工具從數(shù)字檔案館及相應的社交媒體采集用戶信息,然后對檔案用戶數(shù)據(jù)進行識別分類與分布式交換,最后利用區(qū)塊鏈技術加密用戶數(shù)據(jù),保障用戶的隱私安全。

        數(shù)字檔案館的用戶數(shù)據(jù)可以分為結構化、半結構化和非結構化數(shù)據(jù),其中結構化數(shù)據(jù)是關于用戶的自然屬性數(shù)據(jù),是指相對穩(wěn)定或靜態(tài)的人口屬性,主要包括用戶的性別、年齡、職業(yè)、學歷、職稱、工作單位等,可以通過用戶的注冊信息獲得,便于采集,容易形成用戶標簽。而半結構化數(shù)據(jù)和非結構化數(shù)據(jù)屬于用戶行為數(shù)據(jù),是用戶畫像構建的核心數(shù)據(jù),量大類多,本文將其劃為社交屬性數(shù)據(jù)、興趣屬性數(shù)據(jù)和能力屬性數(shù)據(jù)。社交屬性數(shù)據(jù)主要包括用戶的活躍度和相關用戶的聯(lián)系,從而反映出用戶的社交影響力。用戶的活躍度來自用戶頁面點擊、瀏覽、下載、轉發(fā)等行為數(shù)據(jù),通過用戶關注的網(wǎng)站數(shù)、提問及回答的數(shù)量、用戶之間進行的交流合作等行為來建立聯(lián)系。興趣屬性數(shù)據(jù)體現(xiàn)了用戶在檔案領域的某種行為偏好與特征,通過數(shù)據(jù)挖掘技術對用戶標識、用戶接觸點、用戶行為數(shù)據(jù)進行采集。能力屬性數(shù)據(jù)是用戶對檔案資源完成一次檢索查閱或應用的研究領域體現(xiàn)其綜合素質的數(shù)據(jù),包括用戶使用的檢索工具類型、采取的檢索方式、檢索結果的展示?;诖耍瑪?shù)字檔案館系統(tǒng)可通過嵌入用戶頁面行為的監(jiān)控插件,在不影響用戶正常使用的前提下收集用戶不同屬性的數(shù)據(jù)[13],使用戶面貌刻畫得更加完整全面。

        3.2 畫像構建層

        3.2.1 用戶數(shù)據(jù)標簽化

        用戶畫像模型構建的本質是對采集到的用戶數(shù)據(jù)進行標簽化。標簽化是借助簡短的語言來描述用戶的各項特征,通過標注的過程對檔案用戶進行聚類,從而使用戶畫像清晰化、規(guī)范化和精準化。首先,對用戶數(shù)據(jù)進行統(tǒng)計分析,得到用戶畫像的靜態(tài)標簽。用戶的自然屬性屬于靜態(tài)標簽,具有一定的穩(wěn)定性、客觀性和事實性,這一類標簽可以通過檔案用戶的注冊信息獲得,如性別標簽、身份標簽、地域標簽、學習領域標簽等。其次,通過機器學習等智能分析技術挖掘用戶特征、分析用戶行為、構建用戶關聯(lián),得到用戶畫像的動態(tài)標簽,根據(jù)用戶在互動交流區(qū)、查檔咨詢區(qū)、用檔效果區(qū)等公共領域的留言評論提取用戶的興趣特征、社交關系、情感趨向等信息并賦予標簽,將用戶的特征清晰地表達出來,明確用戶需求。另外,在賦予標簽的過程中需要對標簽進行預處理,經過標簽清洗、詞匯標準化、低頻詞過濾等處理步驟,用戶數(shù)據(jù)就轉換成了基于詞的特征項的集合,便于計算機進行識別與操作[14]。

        3.2.2 用戶畫像模型的更新

        數(shù)字檔案館是一個開放與共享的系統(tǒng),館藏資源的結構層次越來越多元,內容越來越豐富,接受服務的檔案用戶范圍越來越廣,規(guī)模也越來越大。換言之,用戶標簽是不斷變化的,因此用戶畫像的構建也應該及時響應數(shù)據(jù)的變化并做出相應調整,根據(jù)新增的用戶數(shù)據(jù)對畫像模型進行動態(tài)更新,以提高準確性。與此同時,用戶畫像的構建與更新離不開算法與模型的技術支持,首先可以通過數(shù)學模型度量檔案用戶各方面的屬性特征,如利用知識相似計算、鄰居相似度計算、路徑相似度計算等精確刻畫用戶特征;其次可以借助數(shù)學模型如一次指數(shù)平滑模型并結合深度學習序列模型,挖掘檔案用戶行為之間的依賴關系、預測檔案用戶興趣的變化,實現(xiàn)用戶畫像模型的實時更新。

        3.3 資源匹配層

        數(shù)字檔案館要想為用戶提供精準服務,用戶需求和檔案資源的深度匹配至關重要。一方面,用戶畫像全面刻畫了用戶面貌,將用戶的屬性、行為和期待等每一個信息抽象成標簽,利用這些標簽再把用戶特征具體化,使用戶的檔案需求得以清晰表達,使相似用戶得以關聯(lián),并為個體用戶尋找相似用戶,得到用戶—用戶的關聯(lián)。另一方面,海量的檔案資源包括網(wǎng)頁、圖片、視頻等社交媒體文件,需要進行顆粒度細化處理,所謂數(shù)據(jù)顆粒度是數(shù)據(jù)倉庫中的相關概念,通過發(fā)現(xiàn)將信息轉化為知識,實質上是通過應用基于事實的支持系統(tǒng)來輔助科學決策的制定,有利于資源的信息化[15]。因此,為了有效揭示和利用細顆粒度檔案資源,需要對館藏資源進行標識,完成資源—資源的關聯(lián),以便快速定位到用戶所需要的檔案。對檔案用戶與檔案資源進行相似度計算,實現(xiàn)資源—用戶的關聯(lián)匹配,為個性化服務提供有力支撐。

        3.4 智慧服務層

        建設數(shù)字檔案館的最終目的是為用戶提供主動性、及時性、知識性、智能性的個性化服務,智慧服務層直接面向檔案用戶,其體驗感受和利用反饋的好壞直接影響著整個數(shù)字檔案館系統(tǒng)的建設效果。首先,用戶畫像提供了豐富的用戶標簽,不僅可以精準捕獲檔案用戶在特定情境下的特定需求,還可以有效預測檔案用戶在較長時間內的興趣偏好,所以個性化推送、知識性定制、智能化問答等服務可顯著提高數(shù)字檔案館服務質量。其次,用戶的訪問界面更具情境化,且美觀智能。智慧導航是用戶瀏覽閱讀檔案資源的指引,引導檔案用戶快速地查閱到所需信息,節(jié)省用戶檢索時間,大大提高了檢索效率。另外,數(shù)字檔案館系統(tǒng)提供的檢索方式也影響著檔案用戶的檢索行為,智慧檢索作為數(shù)字檔案館海量資源的檢索入口,根據(jù)用戶輸入的主題詞和用戶畫像標簽,結合基于協(xié)同規(guī)則的過濾,預測該用戶所需要的檔案資源,將主題最相關、最符合用戶需要的檔案資源按降序排列呈現(xiàn)。最后,數(shù)字檔案館的個性化門戶終端將充分利用各種社交媒體平臺和人工智能技術,針對不同層次的用戶群體開展檔案文化展覽、檔案知識宣傳以及檔案情境體驗等服務,以更好地滿足用戶全方位、多角度、深層次的個性化需求。

        4 基于用戶畫像的數(shù)字檔案館個性化服務策略

        4.1基于用戶畫像提供檔案資源推薦服務

        檔案資源推薦服務是根據(jù)用戶在解決檔案問題過程中的切實需求,利用獲取的用戶數(shù)據(jù)和標簽體系,并結合對用戶個人興趣偏好的分析,主動地向用戶推薦其所需的檔案資源的行為,充分體現(xiàn)了數(shù)字檔案館服務的“智慧化”和“個性化”。在這一過程中需要個性化推薦系統(tǒng)的技術支撐,目前普遍應用的推薦技術有基于內容的推薦技術、基于關聯(lián)規(guī)則的推薦技術和協(xié)同過濾推薦技術,其核心部分就是利用推薦算法,快速定位并找到用戶可能感興趣的信息資源并及時推送[16]。首先,根據(jù)采集到的用戶數(shù)據(jù)提取標簽,得到實時的個體用戶畫像,再根據(jù)實時的個體用戶畫像中的用戶標簽向用戶推薦相匹配的檔案資源或者將實時的個體用戶畫像與已建立的用戶畫像庫進行匹配,找到相似用戶,將相似用戶閱覽的檔案資源推薦給用戶。用戶使用檔案后返回利用反饋界面,如果其檔案需求得到滿足,則此次資源推薦成功,并將目標用戶的標簽添加到用戶畫像庫之中,否則此次資源推薦失敗,以后不再推薦此類檔案信息。由此可見,用戶的利用反饋信息可以倒逼數(shù)字檔案館進行館藏資源建設,使內容更加豐富、層次更加多元、結構更加完整。

        4.2 基于用戶畫像提供數(shù)字檔案知識服務

        大數(shù)據(jù)時代,一方面檔案資源呈現(xiàn)出大數(shù)據(jù)的異構、分散、增長速度快、價值密度低等特點,另一方面檔案用戶更加關注自身檔案問題的解決,檔案信息需要進一步加工處理為檔案知識來滿足其需求,因此數(shù)字檔案館實現(xiàn)個性化的知識服務至關重要,其中知識融合是關鍵一步。知識融合面向需求和創(chuàng)新,對眾多分散資源、異構資源中的知識進行獲取、匹配、集成等處理,挖掘有價值的新知識,同時優(yōu)化知識的結構和內涵,進而提供知識服務[17]。基于此,根據(jù)用戶畫像靈敏地洞察知識需求的對象、領域和層次,得到用戶精準的檔案知識需求,數(shù)字檔案館的知識服務便是從檔案知識中按照用戶需求有針對性地進一步提煉、融合所需知識,提供給用戶,幫助用戶解決其實際問題。將用戶畫像技術嵌入數(shù)字檔案館服務,也有利于知識向智慧轉化,把已有的館藏和能夠調動的資源進行融合,來指導用戶進行檔案實踐。面向用戶的多元化、差異性的需求,鼓勵數(shù)字檔案館和其他信息機構進行跨界融合,深度挖掘隱性知識、整合碎片化知識,使不同機構的檔案知識自由流動并實時共享,實現(xiàn)檔案知識的創(chuàng)新增值。

        4.3 基于用戶畫像提供檔案用戶匹配服務

        數(shù)字檔案館的服務本質是滿足用戶需求。目前,信息技術的廣泛應用為檔案領域帶來了巨大的發(fā)展前景,利用者從原先有特定查檔需求的個體擴大至海量用戶群體[18]。在此背景下,用戶畫像的應用有助于數(shù)字檔案館實時采集數(shù)據(jù)、分析用戶特征,為用戶提供匹配服務,使其能獲得滿足自身需要的檔案資源。從當前檔案用戶來看,可將其劃分為活躍用戶、激活用戶和潛在用戶,活躍用戶是利用檔案比較頻繁并且對檔案資源的開發(fā)利用有促進作用的群體,其中大多為學者專家、高校師生、檔案工作者等專業(yè)人士;激活用戶是對檔案資源有需求,但限于自身檢索能力或所從事的工作,不能很好獲得檔案資源的群體;潛在用戶是當前沒有但未來可能會有檔案需求的群體,包含廣大的社會公眾。用戶畫像的數(shù)據(jù)主要來自活躍用戶,他們不僅是個性化服務的享有者,更是用戶畫像標簽庫的創(chuàng)建者,在這過程中用戶交互不斷加強。隨著個性化服務的發(fā)展以及用戶畫像標簽體系的豐富,活躍用戶也將以自己的實際利用體驗影響并激活更多的用戶來選擇數(shù)字檔案館作為自己獲取資源的渠道之一。在用戶和資源精準匹配的良好循環(huán)中,激活用戶和潛在用戶也將不斷發(fā)展為活躍用戶,從而形成龐大的檔案用戶社群。加強用戶之間的交流學習,最大限度滿足用戶需求,這將進一步提高數(shù)字檔案館的社會影響力,發(fā)揮檔案應有的社會價值。

        猜你喜歡
        資源用戶服務
        基礎教育資源展示
        一樣的資源,不一樣的收獲
        服務在身邊 健康每一天
        服務在身邊 健康每一天
        服務在身邊 健康每一天
        資源回收
        招行30年:從“滿意服務”到“感動服務”
        商周刊(2017年9期)2017-08-22 02:57:56
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        日本免费一区二区三区| 亚洲精品综合中文字幕组合| 亚洲男人免费视频网站| 国内精品久久久久久99| 波多野结衣一区二区三区高清| 亚洲国产精品午夜电影| 91亚洲夫妻视频网站| 麻豆精品国产专区在线观看| 无码少妇一区二区性色av| 99视频在线国产| 综合激情中文字幕一区二区| 白浆国产精品一区二区| 亚洲七久久之综合七久久| 亚洲一级毛片免费在线观看| 国产女主播福利一区在线观看| 亚洲黄片av在线播放| 中文字幕丰满伦子无码| 亚洲成年网站在线777| 久久天堂精品一区专区av| 蜜桃av在线免费网站| 亚洲av永久无码天堂网毛片| 538任你爽精品视频国产| 亚洲视频在线免费观看一区二区| 狠狠综合亚洲综合亚洲色| 中文字幕av无码一区二区三区| 亚洲VA欧美VA国产VA综合 | 久久亚洲国产中v天仙www| 大岛优香中文av在线字幕| 久久久久人妻精品一区二区三区| 国产精品国产午夜免费看福利| 国产va在线播放| 日韩精品极品系列在线免费视频 | av中文字幕不卡无码| 人妻少妇激情久久综合| 亚洲色偷偷综合亚洲avyp| 久久99精品久久久久久hb无码| 国产精品国产三级国产在线观| 亚洲视频免费一区二区 | 夫妻免费无码v看片| 国产精品天天在线午夜更新| 吃下面吃胸在线看无码|