劉紅英
(廣州工商學院,廣州 510850)
微電子技術不斷提高的背景下,微機械傳感器也取得了較為優(yōu)秀的成果。目前微機械傳感器被深入研究,截止到目前,微機械傳感器的類型大致分為七種,分別為微機械陀螺、微氣體傳感器、微機械溫度傳感器、微機械壓力傳感器、微加速度傳感器、微流量傳感器和其他微機械傳感器[1]。這些傳感器被廣泛應用到化學以及醫(yī)學等行業(yè)當中,通過應用到材料、設備等環(huán)節(jié)上,優(yōu)化數(shù)據(jù)傳輸與技術控制效果,具有極大的應用前景。為了進一步掌握微機械傳感器的應用方法,針對微機械傳感器提出不同的個性化推薦算法[2]。這些現(xiàn)有的推薦算法被應用到各大網(wǎng)絡以及設備中,盡管能夠取得一定成果,但在及時性上還不夠完善,需要進一步優(yōu)化。云模式是將云計算與搜索引擎結合使用的新技術,具有一站式解決問題的綜合能力,針對云模式的特點研究全新的微機械傳感器個性化推薦算法。
標準的特征項標簽能夠以更加全面的方式表達傳遞信息,能夠讓無線傳感器網(wǎng)絡中的節(jié)點之間快速識別,建立不同關聯(lián)度的鄰居關系。當微機械傳感器傳輸穩(wěn)定的數(shù)據(jù),也就是常規(guī)內(nèi)容的數(shù)據(jù)時,設置常規(guī)內(nèi)容與其對應的權重分別為xi和ωi,采用信息加權技術TF-IDF,衡量傳感器中數(shù)據(jù)的重要程度。其中TF用于描述詞頻,該數(shù)值越大越能說明內(nèi)容出現(xiàn)的次數(shù)越多,有較高的重要性;IDF用于描述反文檔頻率,也就是出現(xiàn)次數(shù)較少導致詞頻較低的內(nèi)容。通過上述分析過程,將標簽與TF-IDF方法融合,計算公式為:
式中:fij表示信息加權函數(shù);M表示總文檔數(shù);mi表示出現(xiàn)特征xi的文檔數(shù);Wj表示文本。設置某一特征項信息的標簽為xj,根據(jù)上述公式融合特征項標簽,得到對應的權重為:
式中:xfij代表標簽xj被使用的次數(shù);M表示總數(shù)據(jù)量;m表示觸發(fā)過標簽的數(shù)據(jù)量;Wi表示標簽集合。標簽的權重取值范圍在[0,1]內(nèi),當標簽被頻繁觸發(fā),說明傳感器傳輸過大量同類內(nèi)容,對于該標簽下的數(shù)據(jù)相當熟悉。但在整個網(wǎng)絡大環(huán)境中,傳感器還會面對即時性的信息,此類信息傳感器接觸的相對較少,甚至有的沒有接觸過,那么無線傳感器網(wǎng)絡中的節(jié)點,對于此類數(shù)據(jù)沒有對應的鄰居關系,無法接收鄰居消息,增大鄰居發(fā)現(xiàn)延遲,所以針對即時數(shù)據(jù)也需要計算對應的權重,加快對所有節(jié)點的喚醒速度,快速建立鄰居關系從而減少推薦延遲[3]。根據(jù)傳感器產(chǎn)生的瀏覽行為,針對收藏頁面、保存頁面、打印頁面、停留時間四項內(nèi)容建立行為函數(shù),公式為:
公式中:p表示傳感器接觸過的網(wǎng)絡頁面;其他函數(shù)與上述四項內(nèi)容按順序一一對應。當這些函數(shù)的值為0時,說明沒有對該頁面執(zhí)行數(shù)據(jù)記錄,反之則記錄了該頁面的數(shù)據(jù)。結合以上公式,得到特征項xj的權重為:
公式中:P表示包含特征項xj的頁面集合。將權重標簽的大小控制在[0,1]內(nèi),歸一化處理后的特征項標簽對應的權重為:
公式中:X表示特征項的集合。通過上述方法對穩(wěn)定性數(shù)據(jù)與即時性數(shù)據(jù)建立標簽,讓傳感器通信范圍內(nèi)的節(jié)點間快速建立鄰居關系,從而為個性化推薦提供更大的主動性。
無線傳感器網(wǎng)絡執(zhí)行龐大的數(shù)據(jù)傳輸工作,盡管設置了不同的特征項標簽,也還是會影響節(jié)點之間建立鄰居關系的速度,利用云計算模式融合同屬性標簽并實時更新。已知云數(shù)據(jù)信息交互過程中,每一個簇頭節(jié)點具備初始數(shù)據(jù)感知能力,根據(jù)標簽實施分派,而后通過數(shù)據(jù)采集、相鄰節(jié)點身份認證、多通道通信等步驟實現(xiàn)數(shù)據(jù)的傳輸工作。假設簇頭節(jié)點的信息導碼通過下列公式獲得:
公式中:K表示簇頭總數(shù);sat表示階段函數(shù);S(ω)表示權重為ω的Sink節(jié)點;α表示鄰居標簽的特征相似度;η表示信息流特征;g1、g2分別表示穩(wěn)定和即時數(shù)據(jù)數(shù)量。假設定量論域是精準的,則任意一個連通的云數(shù)據(jù)可通過G=(V,E,S)描述,其中V表示全部節(jié)點的總和;E表示期望、熵等參數(shù)的全局定義;S表示Sink節(jié)點[4]。整合云數(shù)據(jù)特征項,通過提取云數(shù)據(jù)的熵融合特征、分區(qū)預處理熵融合特征,實現(xiàn)云計算模式對海量標簽的融合。定義信息數(shù)據(jù)節(jié)點的信息為(ai,bi),以空間采樣分簇重構的方式得到X的空間結構,式為:
按照間隔粒度劃分空間結構,針對分區(qū)特征集提取同一類節(jié)點的信息熵,式為:
通過上述公式得到信息熵,實現(xiàn)對標簽的融合。同樣根據(jù)空間結構對特征進行混合匹配,從而達到實時更顯標簽的目的。云計算模式構建的簇頭相異粒度數(shù)據(jù)矩陣為:
綜合云自身的特殊性以及數(shù)據(jù)的相似性,以模糊計算為原則,設置標簽匹配模式,實時更新標簽,幫助鄰居節(jié)點之間快速識別與關聯(lián)。式為:
通過上述融合與匹配過程,實時更新特征項標簽,加快節(jié)點之間建立關聯(lián),強化對節(jié)點的喚醒操作。
在獲得實時標簽的基礎上,利用聚類技術按照位置的遠近處理標簽,將位置近的標簽和位置遠的標簽劃分到不同的簇中,這樣在個性化推薦過程中能縮減項目搜索范圍,在考慮時序性的條件下,能改進算法的推薦效率。聚類過程如圖1所示。
圖1 聚類流程
根據(jù)實時標簽的聚類結果,將BP模型與RNN模型融合使用,解決個性化推薦過程中產(chǎn)生的時間序列問題。假設用戶行為在短期內(nèi)發(fā)生頻繁變化,此時的特征項標簽也隨之改變,利用反向傳播算法(BP)在接收輸入數(shù)據(jù)與產(chǎn)生輸出數(shù)據(jù)之間,根據(jù)一定程度的誤差反向傳播,更新網(wǎng)絡內(nèi)部的各種參數(shù),該誤差值為:
公式中:J表示損失函數(shù),用來描述誤差;R表示隱藏層;c表示神經(jīng)元的偏置。循環(huán)神經(jīng)網(wǎng)絡(RNN)具有可多次交互數(shù)據(jù)的能力,可以根據(jù)交互次數(shù)設置網(wǎng)絡空間層次,每一空間層代表一次交互過程。將二者融合使用,建立混合推薦模型。已知網(wǎng)絡的輸入是實際值,輸出是預測值,輸入向量的長度等于項目總數(shù),所以讓BP與RNN分享相同的輸出層,合并輸出層后產(chǎn)生單一結果。則存在:
式中:b(J)i、b(J)0i分別表示合并輸出層和隨機輸出層的產(chǎn)出結果[5]。假設RNN的單元數(shù)為E,則傳感器推薦某一內(nèi)容的概率為:
上述公式無需手動操作,而是通過神經(jīng)網(wǎng)絡訓練實現(xiàn),通過網(wǎng)絡層對數(shù)據(jù)的不斷采集、更新、匹配,實現(xiàn)微機械傳感器的個性化推薦工作。
本次測試選用的設備配置Intel Pentium 4處理器,操作系統(tǒng)為Windows XP,包括200G硬盤和4G內(nèi)存。利用Java語言模擬實現(xiàn),將帶有微機械傳感器的設備與互聯(lián)網(wǎng)平臺之間建立連接,檢查網(wǎng)絡是否穩(wěn)定。利用SimPy設計一個針對離散事件的仿真框架,該軟件以生成器為基礎模擬實體,也就是將微機械傳感器的節(jié)點看作生成器,仿真?zhèn)€性化推薦操作。
根據(jù)推薦質量評價結果,判斷本文算法是否具有實用性;根據(jù)響應時間評價結果,判斷本文算法是否在短時間內(nèi)能喚醒網(wǎng)絡通信節(jié)點;根據(jù)平均發(fā)現(xiàn)延遲評價結果,判斷本文算法是否能夠快速建立鄰居關系;根據(jù)節(jié)點能耗評價結果,判斷本文算法是否能夠主動喚醒更多節(jié)點,將額外能量開銷降至最低。推薦質量的評價將平均絕對偏差MAE作為衡量指標,所得的值越小越能說明算法具有較高的推薦質量。該值的計算公式為:
式中:Ai、Bi分別表示用戶評分的預測集合和實際集合。響應時間用RT表示,也就是目標發(fā)出推薦請求與傳感器產(chǎn)生推薦的時刻差值,計算式為:
式中:t1表示發(fā)出推薦請求的時刻;t2表示產(chǎn)生推薦結果的時刻。平均發(fā)現(xiàn)延遲用RTT表示,計算公式如下:
式中:t0、t3表示客戶端的發(fā)包與收包時間;t1、t2表示節(jié)點的發(fā)包與收包時間。設置每個節(jié)點平均能耗為E,則式為:
公式中:k為常數(shù);d表示一跳的距離;i表示節(jié)點數(shù),且i>2。測試設置2個對照組,分別為協(xié)同推薦算法和混合推薦算法。以對比測試的方法比較三組方法在四組指標上的評價差異,根據(jù)測試結果比較不同算法的性能。
本文方法根據(jù)推薦者、被推薦者和推薦目標三項參數(shù),在特征項標簽的基礎上,利用云計算模式融合與實時更新標簽,如圖2所示。
圖2 云模式的應用
在融合同類型標簽的基礎上,通過實時更新標簽獲取實時數(shù)據(jù),保證標簽都是不重疊的。本文研究的算法在此基礎上推薦個性化數(shù)據(jù)。
2.4.1 推薦質量測試
將本文算法與兩組傳統(tǒng)算法分別應用到同一型號的設備中,已知設備的微機械傳感器型號相同。利用該設備查詢信息,利用式(14)評價三組算法的推薦質量,結果如圖3所示。
圖3 推薦質量測試結果
根據(jù)上圖顯示的結果可知,三組方法的平均絕對偏差MAE均處于0.5以下,但本文算法的評價結果比兩組算法分別低了0.21和0.19,說明本文算法的個性化推薦質量更高。
2.4.2 響應時間測試
根據(jù)式(15)計算三組算法的響應時間,結果如圖4所示。
圖4 響應時間測試結果
根據(jù)圖4顯示的結果可知,本文算法的響應時間RT最短,面對500個通信網(wǎng)絡節(jié)點時,平均響應時間比協(xié)同推薦算法和混合推薦算法分別減少了24.1s和19.8s,說明本文算法在短時間內(nèi),能快速喚醒更多傳感器網(wǎng)絡通信節(jié)點。
2.4.3 延遲對比
已知傳感器網(wǎng)絡的能量有限,通常情況下的網(wǎng)絡節(jié)點會隨時進入睡眠狀態(tài),比較三組算法的平均發(fā)現(xiàn)延遲,根據(jù)式(16)得到的結果,繪制圖5所示的實驗結果。
圖5 平均延遲測試結果
根據(jù)上述評價結果可知,在同樣的測試條件下,隨著節(jié)點數(shù)量的增加,本文算法的平均發(fā)現(xiàn)延遲RTT穩(wěn)定在31~33s之間,協(xié)同推薦算法和混合推薦算法的平均發(fā)現(xiàn)延遲,分別在31~38s和31~40s之間,說明本文算法在快速響應的基礎上,將通信節(jié)點之間迅速建立鄰居關系,能夠以最快速度進入到工作狀態(tài)。
2.4.4 能耗對比
利用式(17)評價節(jié)點能耗并繪制實驗圖,如圖6所示。
圖6 節(jié)點能耗測試結果
根據(jù)圖6顯示的評價結果可知,面對越來越多的節(jié)點數(shù)目,本文算法能夠將節(jié)點能耗E始終控制在2.0×103以下,而協(xié)同推薦算法和混合推薦算法的節(jié)點能耗,隨著節(jié)點數(shù)目的增加而逐漸增多,說明本文方法能夠用最小的能耗喚醒更多的節(jié)點,將額外能量開銷降至最低。
隨著互聯(lián)網(wǎng)、互聯(lián)網(wǎng)技術的飛速發(fā)展,網(wǎng)絡資源變得更加復雜、多樣,如何從海量的數(shù)據(jù)中快速獲取目標信息,滿足不同使用用戶的需求,是現(xiàn)階段研究的重點問題。面對信息過載這一現(xiàn)狀,本文算法以推薦的及時性為研究目標,利用更多智能技術實現(xiàn)了對現(xiàn)有推薦算法的優(yōu)化。但此次研究還存在不足,這種算法的及時性能得到提升,但對于推薦數(shù)據(jù)的準確性還有待驗證。今后在時間充沛的情況下,可以評價推薦內(nèi)容的準確性,完善該算法的其他性能。