■謝佩云,何 陽
(1.珠海電力建設(shè)工程有限公司,廣東 珠海 519000;2.廣東海洋大學(xué),廣東 湛江 524000)
20世紀(jì)90年代,Schilit和Theimer首次提出情境感知概念,指出情景感知就是依靠智能傳感器技術(shù),自動感知使用情景、智能化推算用戶需求、自適應(yīng)提供推送服務(wù)。情境感知概念自提出以來,就在各個服務(wù)領(lǐng)域有著廣泛的應(yīng)用,特別是隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能技術(shù)的發(fā)明與應(yīng)用,服務(wù)領(lǐng)域融入情景感知已經(jīng)成為一種常態(tài)化現(xiàn)象,檔案館基于情景感知的資源信息推薦服務(wù)也取得了不錯的實踐效果,但是,當(dāng)前學(xué)術(shù)界關(guān)于情景感知融入檔案信息推薦服務(wù)的相關(guān)研究很少。因此,本文以情境感知為切入點,探究檔案信息推薦服務(wù)影響因素,提出檔案信息推薦服務(wù)的優(yōu)化路徑。
情境感知視角下檔案信息推薦服務(wù),實現(xiàn)檔案信息資源、用戶、推薦平臺之間的互聯(lián)互通,是以情景為中心點的信息挖掘、匹配與推送過程。
一方面,情景感知下自動推理分析用戶動態(tài)信息需求。情境感知視角下檔案信息推薦服務(wù)的基礎(chǔ)是用戶檔案信息需求,只有準(zhǔn)確了解用戶的信息需求,才能夠為用戶提供需要的檔案信息服務(wù)。檔案館通過傳感器技術(shù),實時感知用戶的情境信息,接著通過情境建模方法,轉(zhuǎn)變用戶情境信息為可量化的情境數(shù)據(jù),再通過數(shù)據(jù)關(guān)聯(lián)等技術(shù)挖掘用戶的靜態(tài)需求,了解用戶的實時需求,最后通過橫向和縱向比較,分析獲取用戶的動態(tài)化信息需求。
另一方面,情景感知下精準(zhǔn)發(fā)現(xiàn)匹配檔案資源信息。情境感知視角下檔案信息推薦服務(wù)的核心是檔案信息匹配,只有精確的匹配用戶的信息需求,才能確保檔案信息服務(wù)的精準(zhǔn)性與針對性。檔案館通過語義關(guān)聯(lián)方法將用戶的實時情境變化顯性化,了解用戶何時何地何景需要何種信息,再通過語義挖掘方法連接檔案資源歷史情境,形成檔案何時何地何景的情境信息庫,最后通過語義匹配技術(shù),將檔案情境信息庫與用戶實時動態(tài)需求進(jìn)行自適應(yīng)匹配,從而精準(zhǔn)匹配用戶需要。
此外,情景感知下快速評估反饋信息推薦結(jié)果?;谇榫掣兄獧n案信息推薦服務(wù)的保障是高效高質(zhì)量的反饋機制,只有高效地構(gòu)建用戶信息反饋機制,才能確保檔案信息服務(wù)的有效性與有用性。檔案館通過評估機制快速獲取用戶對信息推薦服務(wù)的感知和評價,了解信息推薦的可取與不可取之處,再通過反饋機制進(jìn)一步挖掘用戶對信息推薦服務(wù)的需求與變化,明確信息推薦的重點與焦點,最后通過評估反饋結(jié)果優(yōu)化完善檔案信息資源情境模型,不斷提高信息推薦服務(wù)質(zhì)量。
根據(jù)情境感知的檔案信息推薦服務(wù)運作機制,參考已有學(xué)者的研究成果,結(jié)合檔案館資源信息推薦服務(wù)實踐,提出情境感知視角下檔案信息推薦服務(wù)質(zhì)量的可能影響因素包括:(1)情境數(shù)據(jù)挖掘,具體包括用戶性別年齡文化個體特征、用戶習(xí)慣偏好、用戶行為心情、資源內(nèi)容特征、資源下載瀏覽、資源評價信息等數(shù)據(jù)挖掘;(2)情境數(shù)據(jù)分析,具體包括用戶實時信息需求、檔案信息資源整合、用戶需求與檔案資源匹配等數(shù)據(jù)分析;(3)情境數(shù)據(jù)推送,具體包括推送時間、推送頻率、推送內(nèi)容、推送方式等數(shù)據(jù)推送。
首先,邀請6名檔案館領(lǐng)域的專家學(xué)者,針對情境數(shù)據(jù)挖掘、情境數(shù)據(jù)分析、情境數(shù)據(jù)推送等具體指標(biāo)進(jìn)行1-5級評分,分值越高,正面評價越好。其次,采用因子分析法,驗證上述影響因素是否是情境感知視角下檔案信息推薦服務(wù)質(zhì)量的關(guān)鍵影響因子。采用SPSS軟件針對情境數(shù)據(jù)挖掘、情境數(shù)據(jù)分析、情境數(shù)據(jù)推送等變量進(jìn)行因子分析,因子分析過程及結(jié)果如下。
針對情境感知視角下檔案信息推薦服務(wù)質(zhì)量影響因素分析的KMO和Bartlett檢驗結(jié)果見表1。KMO值為0.955,大于閾值0.7,Bartlett球形檢驗Sig.值為0.006,小于0.05,通過有效性檢驗??梢姡梢葬槍η榫掣兄暯窍聶n案信息推薦服務(wù)質(zhì)量影響因素進(jìn)行因子分析。
表1 KMO和Bartlett檢驗結(jié)果
針對情境感知視角下檔案信息推薦服務(wù)質(zhì)量影響因素分析的公因子方差分析結(jié)果見表2。用戶個體特征、用戶習(xí)慣偏好、用戶行為心情、資源內(nèi)容特征、資源下載瀏覽、資源評價信息、用戶實時信息需求、檔案信息資源整合、用戶需求與檔案資源匹配、推送時間、推送頻率、推送內(nèi)容、推送方式的公因子方差分別為0.729、0.778、0.816、0.732、0.832、0.806、0.746、0.711、0.806、0.893、0.846、0.821、0.734,均大于0.7,說明上述變量公因子轉(zhuǎn)化能夠較好反映原始數(shù)據(jù)。
表2 公因子方差
針對情境感知視角下檔案信息推薦服務(wù)質(zhì)量影響因素分析的特征根、方差貢獻(xiàn)率及累計貢獻(xiàn)率見附表1。前3個公因子特征值分別為2.455、1.576、1.092,均大于1,其余8個公因子特征值均小于1,說明共有3個主因子。3個主因子的累計貢獻(xiàn)率高達(dá)84.377%,說明這3個公因子基本能夠解釋大部分?jǐn)?shù)據(jù)。
附表1 特征根、方差貢獻(xiàn)率及累計貢獻(xiàn)率
采用方差最大正交旋轉(zhuǎn)法對初始因子載荷進(jìn)行旋轉(zhuǎn),從而使各類因子最大限度地向兩級轉(zhuǎn)化。
情境感知視角下檔案信息推薦服務(wù)質(zhì)量影響因素分析的成分矩陣見表3。因子F1在“用戶個體特征、用戶習(xí)慣偏好、用戶行為心情、資源內(nèi)容特征、資源下載瀏覽、資源評價信息”六個變量上均有著超過0.7的載荷,因此可以將F1命名為“情境數(shù)據(jù)挖掘因子”。因子F2在“用戶實時信息需求/檔案信息資源整合/用戶需求與檔案資源匹配”三個變量上均有著超過0.7的載荷,因此可以將F2命名為“情境數(shù)據(jù)分析”。因子F3在“推送內(nèi)容、推送方式”兩個變量上均有著超過0.7的載荷,因此可以將F3命名為“情境數(shù)據(jù)推送”。
表3 旋轉(zhuǎn)后的成分矩陣
上述因子分析結(jié)果表明,用戶性別年齡文化個體特征、用戶習(xí)慣偏好、用戶行為心情、資源內(nèi)容特征、資源下載瀏覽、資源評價信息等情境數(shù)據(jù)挖掘是檔案信息推薦服務(wù)質(zhì)量的重要影響因子。因此,情境感知視角下應(yīng)當(dāng)注重用戶情境和資源情景的數(shù)據(jù)挖掘。
第一,全方位、多層次情境數(shù)據(jù)捕獲。情境數(shù)據(jù)不僅包括用戶情境數(shù)據(jù),也包括檔案資源情境數(shù)據(jù),而用戶情境數(shù)據(jù)又可以分為個體特征靜態(tài)信息和習(xí)慣偏好、行為心情等動態(tài)信息,檔案資源情境信息又可以分為資源內(nèi)容特征基本信息和下載瀏覽、評價信息等使用信息,兩者都具有復(fù)雜性和多樣性特征,需要運用情景感知技術(shù)進(jìn)行全方位、多層次數(shù)據(jù)捕獲。比如,采用射頻識別(RFID)、無線通信技術(shù)(NFC)等感知技術(shù)實現(xiàn)用戶情境數(shù)據(jù)的挖掘與獲?。徊捎脽o線傳感器網(wǎng)絡(luò)技術(shù)(WSN)、定位系統(tǒng)(GPS)等感知技術(shù)實現(xiàn)檔案資源情境信息的分析與捕獲。
第二,系統(tǒng)化、分層級情境數(shù)據(jù)存儲。情境數(shù)據(jù)的挖掘不僅包括數(shù)據(jù)捕獲過程,也包括數(shù)據(jù)傳輸與存儲結(jié)果,只有對捕獲到的情境數(shù)據(jù)進(jìn)行實時動態(tài)傳輸和科學(xué)合理存儲,才能夠有效保證情境信息的時效性與有用性,才能夠保障情境數(shù)據(jù)的可用性和易用性,需要運用情景感知技術(shù)進(jìn)行系統(tǒng)化、分層級的情境數(shù)據(jù)存儲。比如,采用物聯(lián)網(wǎng)、5G通信網(wǎng)絡(luò)等傳輸技術(shù),實現(xiàn)用戶與檔案資源情景信息的實時傳輸;采用云存儲、分布式存儲等存儲技術(shù),實現(xiàn)用戶與檔案資源情景信息的分層級存儲。
上述因子分析結(jié)果表明,用戶實時信息需求、檔案信息資源整合、用戶需求與檔案資源匹配等情境數(shù)據(jù)分析是檔案信息推薦服務(wù)質(zhì)量的重要影響因子。因此,情境感知視角下應(yīng)當(dāng)注重用戶情境和資源情景的數(shù)據(jù)分析。
第一、實時化用戶情境數(shù)據(jù)分析。用戶檔案資源信息需求不是靜態(tài)不變的,而是會隨著采用情境的變化而變化,也就是說,用戶情境信息需求是動態(tài)變化的,需要采用情景感知技術(shù)實時化分析用戶的動態(tài)需求。比如,采用情境關(guān)聯(lián)、情境聚合等技術(shù)挖掘動態(tài)化的情境信息,采用情境推理、情境擴展等算法分析實時化的情境數(shù)據(jù),從而準(zhǔn)確把握用戶的實時信息需要,有效推理用戶的動態(tài)信息需求。
第二,動態(tài)化資源情景數(shù)據(jù)分析。檔案資源信息內(nèi)容特征不是固定不變的,而是會隨著使用情景的變化而變化,也就是說,檔案資源的情境信息亦具有動態(tài)的變化特征,需要采用情景感知技術(shù)動態(tài)化分析檔案資源的數(shù)據(jù)情境變動,整理出科學(xué)有效的檔案信息資源。
第三,匹配化檔案資源與用戶信息需求。檔案資源信息與用戶信息需求匹配不是固化不變的,而是會隨著應(yīng)用情景的變化而變化,也就是說,用戶信息需求與檔案資源信息匹配應(yīng)當(dāng)綜合不同的情境進(jìn)行實時匹配。比如,應(yīng)當(dāng)立足用戶的歷史情境模型,采用語義標(biāo)注方法,篩選出近似匹配的檔案信息資源,應(yīng)當(dāng)立足用戶的現(xiàn)時情境變化,采用語義關(guān)聯(lián)方法,排序出相似匹配的檔案信息資源集,應(yīng)當(dāng)立足用戶與檔案資源的信息情境變化,采用多維情境模型,形成不同情境下的信息匹配結(jié)果。
上述因子分析結(jié)果表明,推送內(nèi)容、推送方式等情境數(shù)據(jù)推送是檔案信息推薦服務(wù)質(zhì)量的重要影響因子。因此,情境感知視角下應(yīng)當(dāng)注重情境數(shù)據(jù)的推送內(nèi)容和推送方式。
第一,個性化匹配推送內(nèi)容。個性化匹配推送內(nèi)容是“信息推薦集—信息推薦順序”的優(yōu)先內(nèi)容匹配,是檔案信息推薦服務(wù)的關(guān)鍵。首先,利用情境感知技術(shù),確定用戶信息需求,關(guān)聯(lián)檔案信息資源庫內(nèi)容,形成檔案信息推薦集。其次,利用情境個性化推薦算法,確定用戶信息需求順序,并根據(jù)情境相似度的大小進(jìn)行推薦排序。再者,利用情景匹配技術(shù),針對不同用戶情境提供不同推送內(nèi)容,如在用戶學(xué)習(xí)與研究情境下,推薦檔案資源史料或者是檔案館資源分布情況;在用戶旅游情境下,推薦檔案資源文創(chuàng)產(chǎn)品;在用戶乘坐公共交通情境下,推薦片碎花檔案資源視頻、音頻或文本。
第二,多樣化匹配推送方式。多樣化匹配推送是“匹配推送—反饋評估—再次匹配推送—再次反饋評估……”的循環(huán)過程,在此過程中,實現(xiàn)檔案信息資源的多維化動態(tài)推送,是檔案信息推薦服務(wù)終端。首先,面向持有不同移動終端的用戶,可以采用微信公眾號、QQ視頻號、抖音等第三方公共平臺,實行多樣化推廣,比如,很多檔案館已經(jīng)開通了官方微信公眾號或者官方抖音號,根據(jù)用戶畫像,形成用戶專輯,開展針對性檔案資源推送。其次,將情境感知融入原有的推薦機制,立足檔案服務(wù)推送平臺,整合檔案服務(wù)推送渠道,實現(xiàn)檔案信息的多層次、全方位推送。
檔案館被動式的資源信息推薦方式和單一化的資源信息推薦機制,要求檔案館引入情境感知技術(shù),基于情景感知優(yōu)化檔案資源信息推送服務(wù)質(zhì)量。檔案資源信息推送服務(wù)質(zhì)量的主要影響因子包括:用戶個體特征、用戶習(xí)慣偏好、用戶行為心情、資源內(nèi)容特征、資源下載瀏覽、資源評價信息等情境數(shù)據(jù)挖掘;用戶實時信息需求、檔案信息資源整合、用戶需求與檔案資源匹配等情境數(shù)據(jù)分析;推送內(nèi)容、推送方式等情境數(shù)據(jù)推送。因此,提出情景感知視角下檔案信息推薦服務(wù)的優(yōu)化路徑,包括:基于數(shù)據(jù)挖掘優(yōu)化情境數(shù)據(jù)捕獲與存儲,基于數(shù)據(jù)分析促進(jìn)檔案資源與用戶信息需求精準(zhǔn),基于數(shù)據(jù)推送匹配檔案資源推薦內(nèi)容和推薦方式。