?,?劉楊
摘要:隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,人們越來越依賴網(wǎng)絡(luò)獲取信息,為了得到更多用戶的認(rèn)可,信息的提供者必須要保證用戶在瀏覽網(wǎng)頁時(shí),有良好的體驗(yàn)。用戶體驗(yàn)質(zhì)量,即QoE也隨之被大量研究,成為評價(jià)網(wǎng)頁的指標(biāo)之一。文章通過用戶體驗(yàn)的圖像信息影響因素,提出一種基于圖像信息的網(wǎng)頁瀏覽業(yè)務(wù)QoE評價(jià)模型。
關(guān)鍵詞:體驗(yàn)質(zhì)量;瀏覽業(yè)務(wù);網(wǎng)頁渲染;圖像評估;評價(jià)模型
1網(wǎng)頁技術(shù)及QoE基本概念
1.1網(wǎng)頁技術(shù)的組成
一個(gè)網(wǎng)頁應(yīng)用或者網(wǎng)站的組成部分包含:html即頁面的內(nèi)容、CSS即內(nèi)容的樣式、JavaScript即應(yīng)用的邏輯效果。這三者的關(guān)系如圖1所示。
1.2QoE概念
QoE即體驗(yàn)質(zhì)量(Quality of Experience),是指用戶對設(shè)備、網(wǎng)絡(luò)和系統(tǒng)、應(yīng)用或業(yè)務(wù)的質(zhì)量和性能的主觀感受。說的明確些,QoE就是指用戶能感覺到的網(wǎng)頁“質(zhì)量”、“性能”或“舒適度”。
2網(wǎng)頁瀏覽業(yè)務(wù)邏輯展現(xiàn)
網(wǎng)頁瀏覽業(yè)務(wù)與文件下載業(yè)務(wù)相比較起來,交互性更強(qiáng),業(yè)務(wù)邏輯更加復(fù)雜,導(dǎo)致影響因素和影響的方式的多樣性。
2.1網(wǎng)頁加載流程
首先用戶訪問網(wǎng)頁,DNS服務(wù)器(域名解析系統(tǒng))會(huì)根據(jù)用戶提供的域名查找對應(yīng)的IP地址,找到后系統(tǒng)會(huì)向?qū)?yīng)IP地址的網(wǎng)絡(luò)服務(wù)器發(fā)送一個(gè)http請求。然后,網(wǎng)絡(luò)服務(wù)器解析請求,并發(fā)送請求給數(shù)據(jù)庫服務(wù)器。數(shù)據(jù)庫服務(wù)器將請求的資源返回給網(wǎng)絡(luò)服務(wù)器,網(wǎng)絡(luò)服務(wù)器解析數(shù)據(jù),并生成html文件,放人http response中,返回給瀏覽器。最后,瀏覽器解析http response后,需要下載html文件,以及html文件內(nèi)包含的外部引用文件,及文件內(nèi)涉及的圖片或者多媒體文件。并且在瀏覽器下載html文件的時(shí)候,瀏覽器還會(huì)同時(shí)進(jìn)行渲染整個(gè)界面的工作。
2.2網(wǎng)頁渲染流程
網(wǎng)頁瀏覽業(yè)務(wù)的實(shí)現(xiàn)免不了使用瀏覽器。在訪問服務(wù)器的過程中我們可能碰到的主要問題:404和500。404表示網(wǎng)絡(luò)服務(wù)器無法獲取數(shù)據(jù)庫服務(wù)器返回的資源文件;500表示服務(wù)器由于某些原因暫時(shí)無法處理用戶的http請求。
網(wǎng)頁呈現(xiàn)的另一個(gè)重要過程——瀏覽器完成網(wǎng)頁渲染。渲染引擎首先通過網(wǎng)絡(luò)獲得所請求文檔的內(nèi)容,通常以8K分塊的方式完成。下面是渲染引擎在取得內(nèi)容之后的基本流程如圖2所示。
渲染引擎開始解析html,并將標(biāo)簽轉(zhuǎn)化為內(nèi)容樹中的DOM節(jié)點(diǎn)。接著,它解析外部CSS文件及style標(biāo)簽中的樣式信息。這些樣式信息以及html中的可見性指令將被用來構(gòu)建另一棵樹——Render樹。Render樹由一些包含有顏色和大小等屬性的矩形組成,它們將被按照正確的順序顯示到屏幕上。Render樹構(gòu)建好了之后,將會(huì)執(zhí)行布局過程,它將確定每個(gè)節(jié)點(diǎn)在屏幕上的確切坐標(biāo)。再下一步就是繪制,即遍歷render樹,并使用UI后端層繪制每個(gè)節(jié)點(diǎn)。
值得注意的是,瀏覽器在解析時(shí),文件下載業(yè)務(wù)是停止的,在解析完成之后,才重新繼續(xù)下載。上面的過程是逐步完成的,為了更好的用戶體驗(yàn),渲染引擎將會(huì)盡可能早的將內(nèi)容呈現(xiàn)到屏幕上,并不會(huì)等到所有的html都解析完成之后再去構(gòu)建和布局Render樹。它是解析完一部分內(nèi)容就顯示一部分內(nèi)容,同時(shí),可能還在通過網(wǎng)絡(luò)下載其余內(nèi)容。這樣也就造成了人們有時(shí)會(huì)看到網(wǎng)頁整體加載出來了,但是某些部分的詳細(xì)內(nèi)容并沒有加載出來。由于我們這里使用的視覺信息,我們并不是用單純的頁面整體文檔時(shí)間,而是使用用戶瀏覽完網(wǎng)頁的時(shí)候,整個(gè)網(wǎng)頁的加載時(shí)間。
3基于視覺信息的網(wǎng)頁瀏覽業(yè)務(wù)的QoE評價(jià)模型
上面的這些過程任何一部分出現(xiàn)問題,都會(huì)造成網(wǎng)頁總的打開時(shí)間的延長,這些過程的時(shí)間很短,并且不連續(xù),造成了分析的困難性。所以我們一般都采用頁面顯示中顯示的總的加載完成時(shí)間T來綜合上面這些過程的運(yùn)行時(shí)間,人主觀的影響因素,我們通過最后的參數(shù)選取來進(jìn)行平衡。同時(shí)隨著心理學(xué)理學(xué)WFL在這個(gè)領(lǐng)域的運(yùn)用,網(wǎng)頁評估業(yè)務(wù)QoE的評估,基本上都是使用公式f1)所示。
MQoE=A·ln(T)+B
(1)
其中A和B都是固定參數(shù),這兩個(gè)參數(shù)是使用主觀MOS值擬合出來的數(shù)值。作者通過實(shí)驗(yàn)驗(yàn)證出:網(wǎng)頁內(nèi)容豐富程度是會(huì)對用戶的主觀評價(jià)產(chǎn)生一些影響,雖然不是關(guān)鍵因素,但是也有不可忽略的影響。一般來說我們對網(wǎng)頁信息量的獲取都是通過眼睛獲取信息,人對網(wǎng)頁這種界面式的服務(wù),一般認(rèn)為網(wǎng)頁內(nèi)容的豐富程度并不是簡單地加載圖片,而是人眼睛看到的內(nèi)容經(jīng)過大腦的分析之后,大腦認(rèn)為的信息量多少。所以我們在這里分析的時(shí)候,考慮引入網(wǎng)頁視覺信息量的大小,來構(gòu)建網(wǎng)頁瀏覽業(yè)務(wù)的QoE評價(jià)模型,如公式(2)所示。
注:I代表視覺信息量,T代表網(wǎng)頁加載時(shí)間,A、B為待求參數(shù),v為視覺信息速度。同時(shí)為了與文件下載業(yè)務(wù)的QoE評價(jià)模型形成實(shí)現(xiàn)統(tǒng)一,這里我們將S/T變換為v,v單位時(shí)間內(nèi)獲取的視覺信息量,也就是基于視覺信息的網(wǎng)頁下載速度。接下來我們主要進(jìn)行網(wǎng)頁視覺信息量的分析和提取。
4網(wǎng)頁圖像信息量的提取
現(xiàn)在關(guān)于圖像信息處理的研究已經(jīng)得到廣泛地發(fā)展,例如:圖像編碼,圖像解碼和傳輸?shù)取8鶕?jù)香農(nóng)信息論,一個(gè)事件包含了高的信息,它出現(xiàn)的概率可能性比較低。因此圖像信息量的提取可以通過出現(xiàn)可能性的測量來實(shí)現(xiàn)。使用圖像信息理論來研究圖像質(zhì)量的評估,其結(jié)果表明,圖像信息對人的視覺信息感知有主觀的影響,并且可以用這個(gè)主觀影響來建立模型。作者以視覺顯著度(ROI)的方法來計(jì)算圖像的信息量,并且驗(yàn)證了這種算法的可行性。一個(gè)視頻的每個(gè)幀被劃分成小片,并且這樣的一個(gè)特定幀的貼片被稱為空間事件。我們通過估計(jì)上面所說特定幀的空間事件的可能性獲得可視信息量。圖像視覺信息量提取方法如圖3所示。
首先,圖片被分成許多8x8的小塊,每個(gè)小塊B(x,y)出現(xiàn)在坐標(biāo)(x,y)的概率表示為P(B(x,y)),用這個(gè)概率來表示小塊B(x,y)的唯一性。根據(jù)信息理論,圖像的視覺信息量提取可以簡單地使用每個(gè)小塊出現(xiàn)的概率來簡單計(jì)算。
圖片在電腦中是由無數(shù)個(gè)像素點(diǎn)組成的,像素是圖片信息的最小組成單位,理論上我們可以把單個(gè)的像素點(diǎn)看作一個(gè)空間事件來計(jì)算每個(gè)像素點(diǎn)。但是由于人眼的識(shí)別度并沒有達(dá)到那么高的程度,而且每個(gè)像素點(diǎn)作為一個(gè)空間事件,會(huì)造成很大的計(jì)算量。所以,我們采用8x8的圖像塊作為最小單位,對圖像進(jìn)行分塊處理。另外還有一個(gè)原因就是,我們之后會(huì)使用DCT變換,使用8x8小塊對于DCT計(jì)算有便利之處。
由于原始圖像數(shù)據(jù)之間的相關(guān)性造成了提取塊出現(xiàn)概率的困難。因此,有必要擺脫數(shù)據(jù)的相關(guān)性。離散余弦變換(DCT)作為一種獲取獨(dú)立數(shù)據(jù)的正交變換方法,在圖像處理和視頻編碼領(lǐng)域獲得了廣泛地運(yùn)用。DCT編碼屬于正交變換編碼方式,用于去除圖像數(shù)據(jù)的空間冗余。并且將圖像從空間信息量變換成獨(dú)立的頻域分量,便于我們提取相應(yīng)圖像塊的特征。
我們從一副圖像中獲取視覺信息量的步驟如下:
5結(jié)論
QoE本身是一項(xiàng)綜合指標(biāo),影響QoE的因素有很多,本文主要研究圖像信息對QOE的影響。除了圖像信息以外,文字信息量的提取也對網(wǎng)頁瀏覽業(yè)務(wù)QoE評價(jià)有很大影響,筆者將在后繼的研究中給出相關(guān)模型和仿真。