亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于XDR數(shù)據(jù)分析的OTT視頻服務(wù)感知質(zhì)量評估方法

        2021-02-06 09:27:34黃鸝聲冉金也張翔引
        關(guān)鍵詞:質(zhì)量

        黃鸝聲 冉金也 羅 靜 張翔引

        1(電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 成都 611731)2(電子科技大學(xué)航空航天學(xué)院 成都 611731)(lsh@uestc.edu.cn)

        隨著移動(dòng)網(wǎng)絡(luò)傳輸能力的快速提升和智能終端的普及,互聯(lián)網(wǎng)電視(over the top, OTT)視頻業(yè)務(wù)日趨成為網(wǎng)絡(luò)用戶中最流行的在線業(yè)務(wù)之一.以O(shè)TT視頻技術(shù)為主導(dǎo)的網(wǎng)絡(luò)電視、移動(dòng)視頻和多屏互動(dòng)業(yè)務(wù),通過智能手機(jī)、平板電腦和聯(lián)網(wǎng)電視機(jī)的OTT視頻內(nèi)容消費(fèi)量正以驚人的速度增長.在移動(dòng)視頻領(lǐng)域,研究表明50%以上的平板電腦用戶會(huì)經(jīng)常在線觀看OTT視頻[1].

        有線電視長期以來的低費(fèi)用和高保障,使得消費(fèi)者不再滿足于以往免費(fèi)網(wǎng)絡(luò)視頻“盡力而為”的質(zhì)量體驗(yàn).用戶體驗(yàn)質(zhì)量的高低成為OTT視頻成功的關(guān)鍵.一旦用戶感知質(zhì)量(quality of experience, QoE)沒有達(dá)到用戶的期望值,他們可能立刻轉(zhuǎn)投競爭者.

        然而網(wǎng)絡(luò)視頻往往由于網(wǎng)絡(luò)質(zhì)量差、服務(wù)平臺(tái)過載等因素,出現(xiàn)播放失敗、卡頓次數(shù)增加、緩沖時(shí)間過長等業(yè)務(wù)質(zhì)量問題,這些問題會(huì)導(dǎo)致用戶滿意度下降、投訴量增加甚至退訂業(yè)務(wù)等后果.因此,服務(wù)提供商需要精確評估和掌握用戶在使用網(wǎng)絡(luò)視頻業(yè)務(wù)過程中的體驗(yàn)質(zhì)量,以便于提前發(fā)現(xiàn)質(zhì)量問題,進(jìn)一步開展客戶關(guān)懷、預(yù)檢預(yù)修工作.

        視頻質(zhì)量評估主要分為主觀、客觀2種方法.主觀評估需要人類觀察者通過視覺系統(tǒng)感知視頻質(zhì)量,雙激勵(lì)損傷量表(double stimulus impairment scale, DSIS)、雙激勵(lì)連續(xù)質(zhì)量量表(double stimulus continuous quality scale, DSCQS)、絕對分級法(absolute category rating, ACR)[2]都是典型的主觀評估方法.盡管主觀評估方法可以最直接地反映視頻質(zhì)量,但是由于成本高昂且費(fèi)時(shí),所以并不實(shí)用.

        客觀視頻質(zhì)量評估方法分為3類:全參考(full reference, FR)、半?yún)⒖?reduce reference, RR)、無參考(no reference, NR).FR需要獲取完整原始視頻序列.在評估過程中,對比完整的原始視頻圖像數(shù)據(jù)和用戶接收到的視頻圖像數(shù)據(jù)間的差異,檢測用戶接收到的視頻質(zhì)量損傷程度,根據(jù)損傷程度對視頻用戶體驗(yàn)進(jìn)行評價(jià).峰值信噪比(peak signal-to-noise ratio, PSNR)[3]和結(jié)構(gòu)相似性(structural simi-larity index measurement, SSIM)[4]是常用的FR指標(biāo).RR是從原始視頻序列中提取和比較一些特征,即評估時(shí)也需要參考原始視頻序列,只不過使用的是基于原始視頻提取的特征信息,而非全部圖像數(shù)據(jù)[5],如文獻(xiàn)[6],通過參考部分圖像特征來對視頻質(zhì)量進(jìn)行評估.不管是FR還是RR,都需要將用戶接收到的視頻數(shù)據(jù)和原始視頻數(shù)據(jù)傳輸?shù)皆u估服務(wù)器中進(jìn)行視頻質(zhì)量評估,該過程成本高昂且耗時(shí).另一方面,運(yùn)營商獲取原始視頻數(shù)據(jù)也相對困難.NR估計(jì)視頻質(zhì)量時(shí)則不需要原始視頻序列,只需要分析通過客觀測量得到的與視頻質(zhì)量有關(guān)的指標(biāo)對視頻質(zhì)量進(jìn)行估計(jì).因此,對于運(yùn)營商來說,采用NR方法估計(jì)視頻質(zhì)量顯然比FR和RR更可行.

        深度報(bào)文檢測(deep packet inspection, DPI)系統(tǒng)通過對網(wǎng)絡(luò)關(guān)鍵接口的流量和報(bào)文內(nèi)容進(jìn)行檢測分析,根據(jù)策略對流量進(jìn)行過濾控制,實(shí)現(xiàn)信令面和用戶面消息的采集,能夠?qū)τ脩羯暇W(wǎng)行為產(chǎn)生的信息進(jìn)行過濾、采集.該系統(tǒng)分為3層架構(gòu),其中采集層和解碼層負(fù)責(zé)數(shù)據(jù)采集、流量分析、日志合成,一般以各種數(shù)據(jù)記錄方式存儲(chǔ)在解碼層的數(shù)據(jù)庫內(nèi),這種數(shù)據(jù)即用戶話單數(shù)據(jù)(extend data record, XDR),其中X代表呼叫事務(wù)會(huì)話[7].因此,例如,具體地,呼叫詳細(xì)記錄(call detail records, CDR)包含關(guān)于提供給最終用戶的網(wǎng)絡(luò)和服務(wù)特性的大量數(shù)據(jù),這些海量的數(shù)據(jù)被DPI設(shè)備采集并存儲(chǔ)在電信運(yùn)營商大數(shù)據(jù)系統(tǒng)中.國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(International Telecommunication Union for Telecommunication Standardization Sector, ITU-T)[8]建議規(guī)定了CDR的結(jié)構(gòu)和內(nèi)容.應(yīng)用層主要對XDR記錄數(shù)據(jù)進(jìn)行計(jì)算、整理、統(tǒng)計(jì),合理組織和存儲(chǔ)數(shù)據(jù),并進(jìn)行呈現(xiàn).電信運(yùn)營商對XDR數(shù)據(jù)源轉(zhuǎn)換處理后得到可以直接識別的字段信息,內(nèi)容包括時(shí)間、網(wǎng)絡(luò)類型、國際移動(dòng)用戶識別碼(international mobile subscriber identity, IMSI)、移動(dòng)用戶號碼(mobile subscriber international ISDNPSTN number, MSISDN)等100多個(gè)字段[9],也正是本文所使用的原始數(shù)據(jù).

        由于XDR數(shù)據(jù)的龐大規(guī)模和低價(jià)值,長期以來,針對XDR數(shù)據(jù)分析的OTT視頻質(zhì)量評估研究工作相對欠缺且計(jì)算存儲(chǔ)成本高昂.本文提出了一種基于XDR數(shù)據(jù)的無參考的網(wǎng)絡(luò)視頻質(zhì)量評估的方法,在原始XDR數(shù)據(jù)的基礎(chǔ)上進(jìn)行數(shù)據(jù)加工,從海量XDR數(shù)據(jù)中提取出與視頻質(zhì)量強(qiáng)相關(guān)性的少量信息,將大規(guī)模、低價(jià)值的XDR話單數(shù)據(jù)轉(zhuǎn)化為高價(jià)值、小規(guī)模的視頻質(zhì)量特征信息,有利于后續(xù)人工智能算法的應(yīng)用和視頻業(yè)務(wù)質(zhì)量評價(jià),降低下一步數(shù)據(jù)挖掘的資源成本,提升下一步機(jī)器學(xué)習(xí)的輸入樣本質(zhì)量和輸出模型的準(zhǔn)確性.

        1 相關(guān)工作

        目前對網(wǎng)絡(luò)視頻業(yè)務(wù)質(zhì)量的NR評估方法主要有以下3類.

        1.1 流量探針分析方法

        在網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)(如城域網(wǎng)路由器)部署流量探針,對網(wǎng)絡(luò)中的視頻流進(jìn)行采集、分析,利用DPI或深度動(dòng)態(tài)流檢測(deepdynamic flow inspection, DFI)技術(shù)直接從網(wǎng)絡(luò)報(bào)文序列中提取視頻質(zhì)量指標(biāo),完成質(zhì)量評估,如文獻(xiàn)[10].但是現(xiàn)有的流量探針分析方法存在一些缺陷,如必須在網(wǎng)絡(luò)中部署流量采集探針設(shè)備,成本高昂,在已經(jīng)存在統(tǒng)一DPI的前提下,再次部署流量采集設(shè)備顯得過于浪費(fèi);而且單臺(tái)探針設(shè)備處理能力有限,在大規(guī)模流量環(huán)境下會(huì)出現(xiàn)丟包、資源耗盡等現(xiàn)象,導(dǎo)致分析功能失效.

        1.2 APP上報(bào)信令分析方法

        各類視頻終端APP軟件在播放過程中,會(huì)向視頻業(yè)務(wù)服務(wù)平臺(tái)報(bào)送業(yè)務(wù)質(zhì)量信息,例如播放起止時(shí)間、卡頓次數(shù)、卡頓時(shí)長占比等,對這些信令進(jìn)行采集、提取、解析,可獲得較為真實(shí)的視頻業(yè)務(wù)質(zhì)量評價(jià)結(jié)果.目前部分運(yùn)營商已采取此類方法分析常見視頻網(wǎng)站的用戶體驗(yàn)質(zhì)量.但是采用該方法時(shí),信息的提取依賴于終端視頻APP軟件上報(bào)給視頻服務(wù)平臺(tái)的信令信息,各個(gè)視頻服務(wù)APP分別設(shè)計(jì)了自己的信令格式,需要針對每一類APP單獨(dú)定制信令解析規(guī)則,工作量大.一旦APP軟件升級或啟用數(shù)據(jù)加密傳輸,則原有的信令解析規(guī)則不再可用,導(dǎo)致對該類視頻業(yè)務(wù)的質(zhì)量分析全部失效.

        1.3 XDR話單大數(shù)據(jù)分析方法

        在移動(dòng)統(tǒng)一DPI系統(tǒng)中,提取與視頻業(yè)務(wù)相關(guān)的XDR原始話單,結(jié)合已知的視頻質(zhì)量標(biāo)簽作為訓(xùn)練樣本,采用各類機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,以獲得從XDR原始話單數(shù)據(jù)到視頻業(yè)務(wù)質(zhì)量之間的映射模型.例如文獻(xiàn)[10]給出一種基于XDR分析互聯(lián)網(wǎng)業(yè)務(wù)質(zhì)量的方案,即在服務(wù)器集群的架構(gòu)上組建一套系統(tǒng)對XDR數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、轉(zhuǎn)換處理,再輸出數(shù)據(jù)到前臺(tái)應(yīng)用程序,做深入分析優(yōu)化,能準(zhǔn)確定位互聯(lián)網(wǎng)業(yè)務(wù)指標(biāo)異常變化的原因,提高互聯(lián)網(wǎng)業(yè)務(wù)質(zhì)量分析工作效率.然而,XDR數(shù)據(jù)具有數(shù)據(jù)量大,數(shù)據(jù)粒度小的特點(diǎn),視頻服務(wù)進(jìn)程通常對應(yīng)于數(shù)十條XDR記錄,且XDR記錄中的大多數(shù)信息是統(tǒng)計(jì)數(shù)據(jù),并不直接包含與視頻服務(wù)質(zhì)量相關(guān)的信息.所以問題的關(guān)鍵就是如何合理地利用這些XDR數(shù)據(jù),但現(xiàn)有研究[11-12]僅提出了概念框架和思路,缺乏從XDR中挖掘視頻服務(wù)質(zhì)量的具體實(shí)施方法.

        2 方法介紹

        2.1 基本思想

        Fig. 1 Relationship between video service and XDR record圖1 視頻業(yè)務(wù)和XDR數(shù)據(jù)的關(guān)系

        視頻業(yè)務(wù)是一個(gè)跨越一定時(shí)間周期的連續(xù)過程,其質(zhì)量特征也表現(xiàn)為一個(gè)完整過程中不同時(shí)段的質(zhì)量.因此,對視頻業(yè)務(wù)質(zhì)量的刻畫,應(yīng)該對視頻業(yè)務(wù)的全過程進(jìn)行分時(shí)段的連續(xù)評價(jià),最終將不同時(shí)段的質(zhì)量評價(jià)結(jié)果進(jìn)行聚合,獲得完整的質(zhì)量刻畫指標(biāo).雖然單個(gè)XDR話單記錄僅僅覆蓋一個(gè)網(wǎng)絡(luò)會(huì)話且不足以刻畫整體業(yè)務(wù)質(zhì)量,但多個(gè)XDR話單在時(shí)間和空間層面存在耦合,利用該耦合關(guān)系可實(shí)現(xiàn)XDR話單的聚合和關(guān)聯(lián)挖掘:覆蓋同一時(shí)段的多個(gè)XDR話單記錄共同構(gòu)成了該時(shí)段的視頻業(yè)務(wù)行為,多個(gè)XDR話單的同一指標(biāo)值共同構(gòu)成了該時(shí)段的視頻業(yè)務(wù)指標(biāo)值.本文以原始XDR話單為輸入,實(shí)現(xiàn)高價(jià)值質(zhì)量數(shù)據(jù)的生產(chǎn),主要思路可概括為:將以會(huì)話為單位的XDR話單以時(shí)間和空間方式進(jìn)行關(guān)聯(lián),形成為以時(shí)間窗口為單位的切片記錄,然后將多個(gè)切片記錄進(jìn)行匯聚,形成對視頻業(yè)務(wù)過程的總體質(zhì)量記錄.

        如圖1所示,橫坐標(biāo)表示時(shí)間,一條水平線代表一條XDR記錄,多個(gè)相互重疊的XDR記錄集合表示一次視頻業(yè)務(wù).

        2.2 視頻質(zhì)量特征信息的選擇

        定義網(wǎng)絡(luò)視頻質(zhì)量特征信息為:用于記錄某一時(shí)段內(nèi),某個(gè)移動(dòng)上網(wǎng)用戶在觀看視頻過程中的多個(gè)質(zhì)量特征指標(biāo)的數(shù)據(jù)記錄.本文提出的視頻質(zhì)量特征信息如表1所示.包括但不限于5個(gè)基本字段,12個(gè)統(tǒng)計(jì)字段,3個(gè)計(jì)算字段,3個(gè)推測字段.

        Table 1 Filed of Feature Information

        基本字段表示一次視頻服務(wù)的基本信息,如時(shí)間信息、用戶識別信息等;統(tǒng)計(jì)字段可直接從原始XDR數(shù)據(jù)中經(jīng)過累加統(tǒng)計(jì)獲取,是一次視頻服務(wù)的簡單統(tǒng)計(jì)量,本文不過多討論;計(jì)算字段則是對統(tǒng)計(jì)字段進(jìn)行關(guān)聯(lián)計(jì)算后得出的與視頻質(zhì)量強(qiáng)相關(guān)的信息.

        計(jì)算字段能夠較好地刻畫視頻質(zhì)量,其中,丟包率(packet loss rate, PLR)被認(rèn)為是刻畫視頻質(zhì)量最重要的參數(shù).在IP網(wǎng)絡(luò)的傳輸中,視頻文件通常被打包成固定大小的分組,不同分組的分片信息不同,丟包會(huì)直接影響其所在幀的解碼[10].為了獲得更準(zhǔn)確的結(jié)果,我們需要同時(shí)考慮客戶端和服務(wù)器之間的雙向PLR.

        另外,平均下載速率也被認(rèn)為對視頻質(zhì)量有很大影響.一般而言,如果下載速度非常慢,視頻質(zhì)量將不會(huì)很好[11],因此平均下載速度也可以用作視頻質(zhì)量的重要參數(shù).

        在網(wǎng)絡(luò)視頻播放中,往往采用一邊下載一邊播放的方式.視頻服務(wù)器和客戶端均會(huì)控制下載速率和緩存大小,使之與播放所需要的碼率匹配,并保持適當(dāng)?shù)囊曨l播放緩沖.本文提出一種“快推質(zhì)量標(biāo)記”參數(shù),其中快推是指在視頻剛剛播放的時(shí)候,為了減少緩沖時(shí)間,往往使用多線程或不限制下載速率的方式,盡快填充客戶端的播放緩沖區(qū),因此視頻剛剛開始播放的時(shí)候,下載速率可能遠(yuǎn)高于觀看過程中的正常碼率.表1推測字段中的推測快推質(zhì)量標(biāo)記就是用于表示快推是否成功.顯然,該參數(shù)對視頻質(zhì)量有著很大的影響.

        2.3 按時(shí)間窗口切片的信息提取

        圖2是從原始XDR話單數(shù)據(jù)中提取出特征信息的過程,主要可分為2步:第1步是將XDR話單數(shù)據(jù)按時(shí)間分片得到時(shí)間窗口記錄;第2步將時(shí)間窗口記錄進(jìn)行聚合,得到一條匯總記錄.

        2.3.1 切片

        本步驟是對以TCP會(huì)話為單位的視頻類XDR話單進(jìn)行切片加工,輸出多條以固定時(shí)間窗口為單位的時(shí)間窗口記錄;時(shí)間窗口記錄的格式如表1所述.

        1) 將同一用戶的多條視頻類XDR話單記錄進(jìn)行時(shí)間聚類,形成XDR話單群(XDR records cluster),如圖3所示,其中每一條線段表示一條視頻類XDR話單記錄,線段的2個(gè)端點(diǎn)分別代表該XDR話單的起止時(shí)間,一個(gè)XDR話單群應(yīng)滿足以下條件:話單群中任意一條XDR話單,均能在本群中找到至少一條起止時(shí)間與之部分或全部重合的XDR話單,不同XDR話單群之間存在明顯的時(shí)間間隔.

        Fig. 3 XDR records cluster圖3 XDR話單群示意圖

        將XDR話單群X定義為

        X={r1,r2,…,rn},

        其中ri表示第i條話單(話單按照開始時(shí)間排序),其開始時(shí)間為bi,結(jié)束時(shí)間為ei,對每個(gè)XDR話單群X而言,其中任意一條XDR記錄都能在當(dāng)前話單群中找到至少一個(gè)與其時(shí)間重疊的XDR記錄,即?ri∈X滿足:?rj∈X,

        (bi>bj&&bibi&&bj

        定義XDR話單群X的開始時(shí)間btX:

        btX=min{bi|ri∈X};

        結(jié)束時(shí)間etX:

        etX=max{ei|ri∈X};

        則對于不同的XDR話單群X和Y,X和Y之間存在明顯時(shí)間間隔,即若btX

        btY-etX>T,

        其中T為給定的2個(gè)話單群之間最小時(shí)間間隔,在本文中,我們將其取值為5 s.

        2) 將同一XDR話單群X中的話單切片為多條時(shí)間窗口記錄,形成時(shí)間窗口記錄列表.

        如圖4所示,我們將一個(gè)話單群的總持續(xù)時(shí)長(最大結(jié)束時(shí)間與最小開始時(shí)間的差值)平均切分為多個(gè)固定時(shí)長的時(shí)間窗口,然后對同一XDR話單群中的所有話單進(jìn)行數(shù)據(jù)切片,為每個(gè)時(shí)間窗口生成一條唯一的時(shí)間窗口記錄;該時(shí)間窗口記錄中的各個(gè)統(tǒng)計(jì)字段來自于與該時(shí)間窗口部分或全部重合的多條XDR話單的切片統(tǒng)計(jì)結(jié)果.

        Fig. 4 Time window圖4 時(shí)間窗口

        將一個(gè)話單群的總持續(xù)時(shí)長定義為

        dtX=etX-btX.

        (1)

        若將X平均切分為n個(gè)時(shí)間窗口,則第i個(gè)窗口wndi的開始時(shí)間wnd_bti滿足

        結(jié)束時(shí)間wnd_eti滿足

        在步驟2)中涉及到一些統(tǒng)計(jì)字段的計(jì)算,在此以SERVER_COUNT字段為例,說明時(shí)間窗口記錄中的各個(gè)統(tǒng)計(jì)字段的計(jì)算方法.

        ① 定義SERVER_COUNTi,k為XDR話單群X中第i條XDR話單記錄ri中的SERVER_COUNTi值在第k個(gè)時(shí)間窗口記錄wndk中的統(tǒng)計(jì)分量值,則wndk中的WND_SERVER_COUNTk值為該話單群中所有XDR話單記錄的SERVER_COUNTi,k分量值之和,即

        (2)

        ② 第i條XDR話單記錄ri在第k個(gè)時(shí)間窗口記錄wndk中的SERVER_COUNTi,k分量值計(jì)算方法為:

        取該ri的SERVER_COUNTi字段值,除以該記錄起止時(shí)間(ENDTIME-BEGINTIME)之差(單位為s),然后乘以該XDR話單記錄與本時(shí)間窗口的時(shí)間重合長度Toverlap(單位為s),表示為

        (3)

        ③ 第i條XDR話單記錄ri與某個(gè)時(shí)間窗口wndk的時(shí)間重合長度Toverlap計(jì)算方法為

        (4)

        除了統(tǒng)計(jì)字段外,對3個(gè)計(jì)算字段的獲得方法進(jìn)行說明,3個(gè)計(jì)算字段的值為同一記錄中的其他統(tǒng)計(jì)字段值的計(jì)算結(jié)果,計(jì)算方法分別為

        平均下載速率:

        (5)

        下載丟包率:

        (6)

        上傳丟包率:

        (7)

        2.3.2 聚合

        本節(jié)是將2.3.1節(jié)輸出的時(shí)間窗口特征信息記錄進(jìn)行聚合,輸出一條匯總記錄,然后,計(jì)算并回填匯總記錄中的3個(gè)計(jì)算字段.匯總記錄的格式同樣如表1所述.計(jì)算方法如下:

        1) 將2.3.1節(jié)中輸出的同一XDR話單群的時(shí)間窗口記錄列表匯聚為一條匯總記錄,即為每個(gè)XDR話單群生成唯一的一條匯總記錄,其中的各個(gè)統(tǒng)計(jì)字段來自于時(shí)間窗口記錄列表中所有記錄的統(tǒng)計(jì)結(jié)果.

        2) 計(jì)算匯總記錄中的推測字段.

        推測碼率MR的表達(dá)式為

        MR=

        (8)

        推測快推質(zhì)量標(biāo)記FASTPUSH_FLAG字段表達(dá)式為

        FASTPUSH_FLAG=MIN(2V,1),

        (9)

        其中V是SERVER_COUNT字段的離散系數(shù),F(xiàn)ASTPUSH_FLAG取值為V的2倍值與常數(shù)1的較小值.

        推測視頻下載質(zhì)量分LABEL_SCORE字段的表達(dá)式為

        (10)

        根據(jù)上述過程,可將多條XDR數(shù)據(jù)記錄融合為一條視頻觀看記錄,從而在大規(guī)模減少數(shù)據(jù)集規(guī)模的前提下,實(shí)現(xiàn)高價(jià)值指標(biāo)信息的提取,為進(jìn)一步機(jī)器學(xué)習(xí)提供優(yōu)質(zhì)數(shù)據(jù)集.

        3 實(shí)驗(yàn)結(jié)果和分析

        3.1 GBDT模型

        在實(shí)驗(yàn)中,我們使用梯度提升迭代決策樹算法(gradient boosting decision tree, GBDT)[13]模型來完成后續(xù)機(jī)器學(xué)習(xí)過程,彌補(bǔ)人工特征生成的局限性.GBDT算法是一種用于數(shù)據(jù)分類和回歸的集成學(xué)習(xí)[14]算法.該算法是由多棵類似分類回歸樹(classi-fication and regression tree, CART)[15]的決策樹組成,將算法中所有決策樹的輸出結(jié)果累加起來就是GBDT的最終輸出結(jié)果,它在被提出之初就和支持向量機(jī)(support vector machine, SVM)[16]一起被稱為泛化能力較強(qiáng)的算法,并都是數(shù)據(jù)分析中常用到的學(xué)習(xí)算法.GBDT模型的數(shù)學(xué)表達(dá)式可表示為

        (11)

        其中,b(x;γm)代表第m棵決策樹,βm是第m棵決策樹的權(quán)重.

        我們選擇GBDT算法模型的原因是,該模型中的每棵決策樹都是回歸決策樹,因此它可以較好解決數(shù)據(jù)回歸問題并具有高檢測精度的特性.此外該算法可有效處理異常點(diǎn),還能在一定程度上避免模型過擬合問題.

        3.2 數(shù)據(jù)集

        我們使用的數(shù)據(jù)集是包括8 102個(gè)視頻會(huì)話的XDR話單數(shù)據(jù)集,數(shù)據(jù)來自于某地區(qū)網(wǎng)絡(luò)真實(shí)OTT業(yè)務(wù)匿名化數(shù)據(jù)集,以標(biāo)準(zhǔn)的XDR格式提供,每個(gè)視頻會(huì)話有預(yù)先標(biāo)記好的視頻質(zhì)量主觀分,該主觀分的表達(dá)式為

        Lable=100-lag,

        (12)

        其中l(wèi)ag是使用APP上報(bào)信令分析方法計(jì)算出的視頻卡頓時(shí)長占比,見本文1.2節(jié).一般認(rèn)為網(wǎng)絡(luò)用戶在觀看視頻時(shí),卡頓時(shí)長占比越高則視頻質(zhì)量越差.

        作為對比,本文針對原始XDR話單數(shù)據(jù)使用同樣的模型進(jìn)行訓(xùn)練和預(yù)測,該原始XDR話單數(shù)據(jù)包括了24 715條XDR話單.

        3.3 評估指標(biāo)

        我們參考每個(gè)視頻會(huì)話中預(yù)先標(biāo)記好的視頻質(zhì)量主觀分(式(12)),使用3個(gè)指標(biāo)來評估本文方法的可行性,分別為:

        1) 平均絕對誤差(mean absolute error),記為mae.是絕對誤差的平均值,能夠直接反映視頻質(zhì)量評分誤差的真實(shí)情況,定義如下:

        2) 均方差(mean squared error),記為mse.是最簡單,應(yīng)用最廣泛的圖像評價(jià)方法之一,可以很好地衡量視頻質(zhì)量評分和視頻質(zhì)量主觀分之間的偏差,定義如下:

        3) 平均偏差誤差(mean deviation error),記為mde.可以較好地反映視頻質(zhì)量評分與視頻質(zhì)量主觀分之間的平均差異,定義如下:

        以上3個(gè)指標(biāo)是常用的衡量觀測值與真值之間偏差的參數(shù),能夠較好地反映出本文中視頻質(zhì)量評分和主觀分之間的差異.本文通過比較提取后數(shù)據(jù)和原始數(shù)據(jù)在不同學(xué)習(xí)率下的mae,mse,mde,來說明該提取方法的高效性和有用性.除此之外,本文還選用常用性能參數(shù)PLCC,SROCC,KROCC來輔助評價(jià)算法的好壞.這3個(gè)指標(biāo)夠較好地刻畫數(shù)據(jù)之間的相關(guān)性.

        3.4 結(jié)果及分析

        本文分別使用原始數(shù)據(jù)、本文提取的特征信息進(jìn)行訓(xùn)練和用戶感知質(zhì)量評估,采用0.1~0.9的不同學(xué)習(xí)率來訓(xùn)練模型,在每次訓(xùn)練過程期間訓(xùn)練數(shù)據(jù)是隨機(jī)選擇的.結(jié)果如表2、表3所示.很顯然,學(xué)習(xí)率越高,得到的結(jié)果越準(zhǔn)確,其原因是GBDT模型的估計(jì)精度取決于訓(xùn)練集的大小.

        表2是直接以原始XDR話單數(shù)據(jù)為輸入對用戶感知質(zhì)量評估的結(jié)果.可以看到,在學(xué)習(xí)率較低的情況下,基于原始XDR的視頻質(zhì)量評估結(jié)果存在較大誤差;雖然隨著學(xué)習(xí)率的增加,mae和mse確實(shí)可以有效降低,但mse仍然無法降低至可以接受的范圍.基于mse對異常值敏感,而mae對異常值不敏感這一特性,基本可以得出結(jié)論:該方法對一些異常值的預(yù)測能力較差.而事實(shí)上,卡頓導(dǎo)致的視頻質(zhì)量下降恰好是屬于這些異常值,因此使用原始XDR話單數(shù)據(jù)對視頻質(zhì)量進(jìn)行評估,很難取得良好效果.

        Table 2 Experimental Result of Initial Data at Different Learning Rates

        表3是以本文提取的特征信息為輸入、使用同樣的算法模型和參數(shù)的用戶感知質(zhì)量評估結(jié)果,可以看到,在不同的學(xué)習(xí)率中,mae,mse,mde均明顯低于原始數(shù)據(jù)實(shí)驗(yàn)結(jié)果;其中mse雖然隨著學(xué)習(xí)率的變化而顯著變化,但總體保持在較低水平.

        Table 3 Experimental Result of Extraction Data at Different Learning Rates

        進(jìn)一步將基于兩類數(shù)據(jù)的評估結(jié)果進(jìn)行對比,如圖5~7所示,可以看出,采用本文方法提取的質(zhì)量特征信息,只需要很少的學(xué)習(xí)率即可實(shí)現(xiàn)較高的評估準(zhǔn)確性.本文提取的質(zhì)量特征數(shù)量僅為原始XDR字段數(shù)量的6.7%,可以看出原始XDR數(shù)據(jù)不僅數(shù)據(jù)量大,而且直接利用價(jià)值較低.而在使用本文方法進(jìn)行信息加工后,不僅能顯著減小數(shù)據(jù)規(guī)模,還能大幅度降低學(xué)習(xí)率并顯著提升質(zhì)量評估結(jié)果的準(zhǔn)確性.

        Fig. 5 Comparison of mae between two data sets圖5 2個(gè)數(shù)據(jù)集平均絕對誤差對比

        Fig. 6 Comparison of mse between two data sets圖6 2個(gè)數(shù)據(jù)集均方差對比

        Fig. 7 Comparison of mde between two data sets圖7 2個(gè)數(shù)據(jù)集平均偏差誤差對比

        進(jìn)一步,選用圖像質(zhì)量分析領(lǐng)域常用的評價(jià)參數(shù)PLCC,SROCC,KROCC來輔助評價(jià)本文方法的效果,這3個(gè)參數(shù)均為相關(guān)系數(shù),取值范圍是[-1,1],越接近1表示相關(guān)性越強(qiáng).由于目前已知的文獻(xiàn)中,尚缺乏可驗(yàn)證的從XDR數(shù)據(jù)中提取特征的方法介紹,因此本文不做類似方法的比對.分別將基于本文提取數(shù)據(jù)、原始XDR數(shù)據(jù)的視頻質(zhì)量評估結(jié)果與主觀評分進(jìn)行相關(guān)性分析,獲得的相關(guān)系數(shù)值如表4所示:

        Table 4 Performance of the Proposed Method

        通過表4可以看出,使用本文方法的視頻質(zhì)量評價(jià)結(jié)果表現(xiàn)出了與主觀評價(jià)結(jié)果的明顯相關(guān)性,其PLCC,SROCC,KROCC指標(biāo)均明顯優(yōu)于基于原始XDR話單的評價(jià)結(jié)果.

        4 結(jié) 論

        針對OTT視頻業(yè)務(wù)質(zhì)量評估,本文提出了一種基于XDR的信息提取方法.首先將多條原始XDR話單進(jìn)行聚合,將以會(huì)話為單位的XDR話單以時(shí)間和空間方式進(jìn)行關(guān)聯(lián),形成為以時(shí)間窗口為單位的切片記錄,然后將多個(gè)切片記錄進(jìn)行匯聚,形成對視頻過程的總體質(zhì)量記錄.

        以本文提取的信息作為機(jī)器學(xué)習(xí)算法輸入,能夠得到較為精確的視頻質(zhì)量評估結(jié)果,與原始XDR數(shù)據(jù)相比,本文生成的特征數(shù)據(jù)與真實(shí)視頻質(zhì)量具有更高的相關(guān)性,數(shù)據(jù)量更小,所需學(xué)習(xí)率更低,評估結(jié)果也更為準(zhǔn)確.

        猜你喜歡
        質(zhì)量
        聚焦質(zhì)量守恒定律
        “質(zhì)量”知識鞏固
        “質(zhì)量”知識鞏固
        質(zhì)量守恒定律考什么
        做夢導(dǎo)致睡眠質(zhì)量差嗎
        焊接質(zhì)量的控制
        關(guān)于質(zhì)量的快速Q(mào)&A
        初中『質(zhì)量』點(diǎn)擊
        質(zhì)量投訴超六成
        汽車觀察(2016年3期)2016-02-28 13:16:26
        你睡得香嗎?
        民生周刊(2014年7期)2014-03-28 01:30:54
        成在人线av无码免费| 国产三级久久久精品麻豆三级| 国产呦系列呦交| 精品无码久久久九九九AV| 亚洲在线视频一区二区| 国内自拍速发福利免费在线观看| √新版天堂资源在线资源| 日韩AV不卡六区七区| 久久免费网站91色网站| 中文字幕亚洲视频一区| 人妻少妇乱子伦精品无码专区电影| 欧美人与动牲交片免费| 成人午夜视频在线观看高清| 丝袜美腿视频一区二区| 手机看片久久国产免费| 另类欧美亚洲| 亚洲一区二区三区天堂av| 久久精品国产久精国产爱| 99精品国产综合久久久久五月天| 国产午夜亚洲精品一级在线| 欧美a视频在线观看| 亚洲免费看三级黄网站| 国产日本精品一二三四区| 日本牲交大片免费观看| 久久精品国产亚洲Av无码偷窍| 国产精品视频一区二区久久| 帅小伙自慰videogay男男| 激情欧美日韩一区二区| 亚洲女同系列高清在线观看| 国产亚洲av成人噜噜噜他| 天天燥日日燥| 久久频这里精品99香蕉| 亚洲av天堂一区二区| 中文无码成人免费视频在线观看| 欧美高大丰满freesex| 日本熟妇高潮爽视频在线观看| 国产偷国产偷亚洲高清视频| 日本熟妇色xxxxx欧美老妇| 99久久亚洲国产高清观看| 亚洲视频专区一区二区三区| 欧美成人片在线观看|