邢圓慶
摘 要:本文詳細(xì)介紹了TS流相關(guān)概念(包括TS流知識、TS流描述語言、TS流的構(gòu)建方法和準(zhǔn)則)、以及這些算法應(yīng)用在數(shù)字電視播出系統(tǒng)當(dāng)中存在的利與弊,最終提出全新想法:在數(shù)字電視播出系統(tǒng)當(dāng)中引入TS流,TS流可以讓電視領(lǐng)域的描述更加規(guī)范化和結(jié)構(gòu)化,為系統(tǒng)添加語義,讓基于TS流的播出系統(tǒng)為用戶更加準(zhǔn)確、更加快速的做出推薦。
關(guān)鍵詞:TS流;數(shù)字電視;播出系統(tǒng);用戶喜好
1.TS流數(shù)字電視播出系統(tǒng)介紹
TS流數(shù)字電視播出系統(tǒng)的基本原理是通過系統(tǒng)對用戶購買行為和感興趣內(nèi)容等信息進(jìn)行分析,然后為其推薦類似產(chǎn)品。例如,某個(gè)用戶喜歡《星際穿越》、《阿凡達(dá)》、《變形金剛》等影片,系統(tǒng)則可以推斷這個(gè)用戶喜歡科幻片進(jìn)而推薦《機(jī)器人總動(dòng)員》、《黑客帝國》等片。CB 算法的理論依據(jù)主要來自于信息獲取與信息過濾,CB 算法最早也是出現(xiàn)在信息檢索系統(tǒng)當(dāng)中。CB 算法一般有三步驟:
(1)物體陳述(Item Representation):首先將該領(lǐng)域的 Item 進(jìn)行分類以及歸類,并且寫出一些標(biāo)簽,然后為每個(gè)物品抽取其自身特征來標(biāo)志該物品。
(2)用戶學(xué)習(xí)(Profile Learning):根據(jù)用戶過去的瀏覽行為、評分、喜好等建立以及更新用戶模型,此步驟主要是學(xué)習(xí)用戶喜歡。
(3)產(chǎn)生推薦(Recommendation Generation):根據(jù)特定算法,來比較物品模型與用戶模型,以此篩選出相關(guān)性較大的物品。舉個(gè)例子來更加具體的介紹以上推薦步驟,在數(shù)字電視播出系統(tǒng)中,每部電視即為一個(gè)Item,第一步,我們可以把電視分為“愛情”、“科幻”、“動(dòng)作”、“青春”、“勵(lì)志”、“魔幻”、“浪漫”、“童話”、“喜劇”、“戰(zhàn)爭”等類別,然后為每部電視添加標(biāo)簽,比如《星際穿越》“科幻”、“動(dòng)作”權(quán)值較大,而“勵(lì)志”、“青春”等權(quán)值較小,《幸福終點(diǎn)站》的“喜劇”、“愛情”權(quán)值較大,“戰(zhàn)爭”、“童話”權(quán)值較小。第二步就是根據(jù)用戶過去的觀看行為,評分行為等等來構(gòu)建用戶模型,來學(xué)習(xí)用戶的喜好,例如用戶喜歡《阿凡達(dá)》、《黑客帝國》、《星際穿越》等“科幻”、“動(dòng)作”等權(quán)值較大的電視,則系統(tǒng)可以構(gòu)建一個(gè)該用戶喜歡科幻片、動(dòng)作片的配置文件,如果該用戶在接下來的時(shí)間觀看《賭圣》、《喜劇之王》、《功夫》等片,則系統(tǒng)需要更新用戶的喜好,很明顯該用戶選擇了一系列“喜劇”、“周星馳”等權(quán)值較大的電視,系統(tǒng)需要實(shí)時(shí)更新用戶的 Profile,在系統(tǒng)獲取用戶的 Profile 后,CB 系統(tǒng)就可以利用推薦模型當(dāng)中所有電視與用戶模型當(dāng)中的 Profile 進(jìn)行相關(guān)度分析,篩選出一個(gè)相關(guān)性比較大的一個(gè)列表的電視,然后把這個(gè)結(jié)果呈現(xiàn)給用戶。
2.基于TS流的數(shù)字電視播出系統(tǒng)的研究與實(shí)現(xiàn)
基于TS流的數(shù)字電視播出系統(tǒng)結(jié)構(gòu)框架是基于 MVC 模式基礎(chǔ)構(gòu)造而成,M(模型層)主要包含數(shù)據(jù)層、構(gòu)建TS流等模塊;C(控制層)主要為數(shù)據(jù)分析、預(yù)測評分等模塊;V(視圖層)包含用戶登陸系統(tǒng)界面、用戶使用系統(tǒng)界面和為用戶呈現(xiàn)電視等模塊。詳細(xì)的系統(tǒng)框架如下圖 1:
2.1 用戶TS流模塊的分析與設(shè)計(jì)
用戶模型,大體上說就是對于用戶的抽象與歸納,具體含義上不同的學(xué)者又有不同的見解,Jameson 認(rèn)為用戶模型是對各方面屬性的明確描述。Elaine 認(rèn)為是對用戶的各方面資源、屬性的明確描述,另外用戶模型集合分為單個(gè)個(gè)體用戶、多個(gè)個(gè)體用戶兩種,而更多學(xué)者比較認(rèn)同 Murry 的觀點(diǎn),他認(rèn)為目前為止真正意義上、投入商業(yè)的用戶模型還比較少,用戶模型應(yīng)該是對單個(gè)用戶或用戶組知識、特征、喜好的表示和建模,它需要完成對用戶的基本信息、喜好進(jìn)行規(guī)范化描述以及對目標(biāo)用戶存在認(rèn)知。
2.2 電視TS流的分析與設(shè)計(jì)
電視是一門可以容納文字、雕塑、建筑、攝影、繪畫等聽覺和視覺上的現(xiàn)代藝術(shù),其存在可以讓現(xiàn)代人們學(xué)習(xí)研究藝術(shù),發(fā)揚(yáng)與傳遞文化,是藝術(shù)和休閑生活中的不可或缺的重要一員。電視一般有名稱、演員(導(dǎo)演)、類型、年代、地區(qū)等屬性,構(gòu)建的電視TS流應(yīng)該整體上涵蓋現(xiàn)在當(dāng)前主流視頻網(wǎng)站的所有電視。主要的類包括:id、name(名稱)、artist(藝術(shù)家,即演員或?qū)а荩?、category(分類)、ages(年代)、area(地區(qū))。其中“名字”為電視名字,“藝術(shù)家”為比較著名、受用戶歡迎的演員或?qū)а?,“分類”是對電視的分類,例如“愛情”、“喜劇”、“?dòng)畫”、“科幻”等等,“地區(qū)”為電視的出版方所在地,例如“美國”、“中國大陸”、“中國香港”、“韓國”等,“年代”為電視出版時(shí)間,如“2015”、“2014”、“二戰(zhàn)”。利用工具 Protege 創(chuàng)建電視TS流的步驟與創(chuàng)建用戶TS流的步驟類似:
1、在 Active Ontology標(biāo)簽項(xiàng)里定義電視TS流的IRI
2、在class 標(biāo)簽當(dāng)中創(chuàng)建電視的類,以及所有電視屬性類及其類的關(guān)系
3、在Data Properties標(biāo)簽當(dāng)中創(chuàng)建電視類的數(shù)據(jù)屬性、Object Properties標(biāo)簽當(dāng)中創(chuàng)建電視類的對象屬性4、在Individuals標(biāo)簽當(dāng)中創(chuàng)建電視類的實(shí)例以及定義實(shí)例屬性值
2.3 用戶興趣模塊的分析與設(shè)計(jì)
該模塊主要是針對目標(biāo)用戶,對其在電視方面某些喜好進(jìn)行抽象和歸納,建立該模塊對該系統(tǒng)成功與否有著至關(guān)作用的影響,如果可以準(zhǔn)確拿捏目標(biāo)用戶的興趣,可以及時(shí)而準(zhǔn)確的對用戶進(jìn)行推薦其喜歡的電視。用戶興趣模塊要抽象出用戶對電視的某些屬性的偏愛度,可以用三元組用戶-屬性-偏愛值來表達(dá),建立了用戶興趣模塊之后,隨著時(shí)間的推移,用戶興趣度不是一個(gè)常量而是會實(shí)時(shí)發(fā)生變化的,系統(tǒng)應(yīng)該收集用戶過去對系統(tǒng)的評分記錄、收藏記錄等顯式反饋信息和搜索模式、瀏覽記錄等隱式反饋信息對用戶的興趣度進(jìn)行更新。
顯式反饋信息是指用戶對系統(tǒng)的直接反饋,比如用戶對電視的評分記錄、收藏記錄、或者對被推薦電視點(diǎn)擊不喜歡按鈕,顯式反饋信息對系統(tǒng)做出的明確操作,比較容易獲取。隱式的反饋信息是指用戶在使用系統(tǒng)過程當(dāng)中的使用行為,比如瀏覽行為、網(wǎng)頁呆留時(shí)間、搜索模式、甚至鼠標(biāo)的移動(dòng)方式等等。
相關(guān)研究表明采取顯式與隱式的信息反饋對播出系統(tǒng)的準(zhǔn)確度以及用戶體驗(yàn)可以有不少的提高。但是目前為止在獲取隱式反饋信息技術(shù)卻不是特別成熟,因此主流的播出系統(tǒng)主要還是以獲取顯示反饋信息為主。
3.結(jié)語
由于大數(shù)據(jù)時(shí)代的誕生,數(shù)據(jù)以及信息等都呈現(xiàn)爆炸式的增長曲線,對于人們生活來說一方面來說是一件好事,人們有了更多的選擇性,但是從另外一方面來講,過多的數(shù)據(jù)與信息讓人們很難在最短時(shí)間尋找到自己心儀的信息,甚至可能會造成部分現(xiàn)代人們養(yǎng)成選擇困難癥等不良影響,播出系統(tǒng)就是在這樣的大背景下應(yīng)運(yùn)而生,播出系統(tǒng)出現(xiàn)的宗旨就是讓人們在大數(shù)據(jù)當(dāng)中擺脫出來。TS流在近些年來受到學(xué)者的廣泛關(guān)注,通過TS流技術(shù),可以對用戶和電視的屬性等信息進(jìn)行語義標(biāo)注,可以讓電視領(lǐng)域知識規(guī)范化、結(jié)構(gòu)化,從而可以讓計(jì)算機(jī)更好的理解信息,當(dāng)用戶使用計(jì)算機(jī)時(shí),系統(tǒng)通過已經(jīng)記錄的用戶信息、之前瀏覽行為、觀看行為等信息來理解用戶的喜好與需求。
參考文獻(xiàn)
[1] 胡亞龍,劉志偉.青島電視臺電視廣告截播系統(tǒng)[J]. 視聽界(廣播電視技術(shù)). 2013(04)
[2] 經(jīng)國煒,崔冬明.視頻服務(wù)器在播出系統(tǒng)中的應(yīng)用分析[J]. 視聽界(廣播電視技術(shù)). 2013(04)
[3] 卞德森,姜建發(fā).關(guān)于標(biāo)清數(shù)字電視播出系統(tǒng)通道技術(shù)指標(biāo)測量的若干問題[J]. 現(xiàn)代電視技術(shù). 2013(06)