閆子琪
摘 要 隨著網(wǎng)絡(luò)的不斷普及,人們?cè)诰W(wǎng)絡(luò)中獲取消息的渠道也不斷擴(kuò)增,這也促進(jìn)了網(wǎng)絡(luò)上各種技術(shù)的不斷發(fā)展。視頻推薦算法就是這其中的一個(gè),它的主要作用是通過(guò)一些數(shù)學(xué)上的算法,將網(wǎng)友在某社交網(wǎng)站上的喜好行為做出相應(yīng)的歸納總結(jié),再對(duì)該用戶(hù)進(jìn)行相關(guān)的視頻推薦。因此,視頻推薦算法是一個(gè)以數(shù)學(xué)理論為基礎(chǔ),應(yīng)用于互聯(lián)網(wǎng),服務(wù)于全體網(wǎng)友的技術(shù)。文章先對(duì)視頻推薦算法的發(fā)展歷程做簡(jiǎn)要介紹,并就微博上的視頻推薦算法進(jìn)行介紹和相關(guān)優(yōu)缺點(diǎn)的分析。
關(guān)鍵詞 視頻推薦算法;微博視頻推薦;用戶(hù)喜好;統(tǒng)計(jì)分析
中圖分類(lèi)號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)224-0148-02
當(dāng)今社會(huì),是一個(gè)信息爆炸的時(shí)代,獲取信息的方式日益多樣。微博作為當(dāng)代社會(huì)一個(gè)巨大的公眾交流平臺(tái),每時(shí)每刻都會(huì)產(chǎn)生無(wú)數(shù)的新信息,而它產(chǎn)出消息的精準(zhǔn)和快速,也讓微博從眾多社交媒體中脫穎而出,成為人們獲取信息的主要渠道。它具備了從海量信息中瞬間提取出我們喜好的強(qiáng)大功能。比如我們通常在刷微博的過(guò)程中會(huì)收到一些視頻的推薦,而這些視頻往往和我們的興趣點(diǎn)不謀而合,所以出于好奇心人們就會(huì)點(diǎn)開(kāi)視頻。微博能夠以視頻的形式抓住用戶(hù)的眼球,同時(shí)引發(fā)擁有相同興趣的用戶(hù)間的頭腦風(fēng)暴。這一技術(shù)應(yīng)用的就是視頻推薦算法。本文就是以微博作為例子來(lái)闡釋社交網(wǎng)站中的視頻推薦算法。
1 推薦系統(tǒng)的發(fā)展歷程
推薦系統(tǒng),顧名思義,是能給用戶(hù)推薦相關(guān)信息的系統(tǒng)。主要目的是在現(xiàn)在這個(gè)互聯(lián)網(wǎng)信息呈指數(shù)增長(zhǎng)的時(shí)代里,解決信息過(guò)載的弊端,帶給網(wǎng)友更加優(yōu)質(zhì)的網(wǎng)絡(luò)體驗(yàn),讓人們能輕松了解到自己所感興趣的信息。隨著科技的不斷進(jìn)步,推薦系統(tǒng)也發(fā)展的愈加完善。
1.1 初步研究期(20世紀(jì)90年代初期)
我們一般認(rèn)為,推薦系統(tǒng)的發(fā)現(xiàn)與研究,始于1994年明尼蘇達(dá)大學(xué),當(dāng)時(shí)GroupLens研究組所推出的GroupLens系統(tǒng)。那是最早將協(xié)同過(guò)濾算法融入到推薦算法中的系統(tǒng)。應(yīng)用到了一些數(shù)學(xué)和統(tǒng)計(jì)學(xué)上的知識(shí),巧妙地把數(shù)學(xué)算法和計(jì)算機(jī)技術(shù)聯(lián)系到了一起,為視頻推薦算法的開(kāi)啟和研究奠定了基礎(chǔ),也使處于起步階段的互聯(lián)網(wǎng)技術(shù)遠(yuǎn)離單調(diào)死板。本文后續(xù)將會(huì)就協(xié)同過(guò)濾算法展開(kāi)研究。
1.2 發(fā)展期(20世紀(jì)90年代末)
推薦算法作為當(dāng)時(shí)新興的一種技術(shù),能與協(xié)同過(guò)濾算法進(jìn)行聯(lián)系,無(wú)疑受到了不少人的關(guān)注。緊接著,1995年,就由卡內(nèi)基梅隆大學(xué)的Robert? Armstrong等人開(kāi)發(fā)了全新的系統(tǒng)。該系統(tǒng)能協(xié)助互聯(lián)網(wǎng)進(jìn)行信息查找,同時(shí)進(jìn)行個(gè)性化推薦。將剛起步的推薦算法進(jìn)行優(yōu)化,在原有的基礎(chǔ)上擴(kuò)大了其功能。同年,麻省理工學(xué)院和斯坦福大學(xué)也對(duì)此技術(shù)進(jìn)行了相關(guān)的研究和發(fā)現(xiàn)。1997年,隨著研究的不斷推進(jìn),美國(guó)計(jì)算機(jī)協(xié)會(huì)就此發(fā)起會(huì)議,逐漸把對(duì)于推薦系統(tǒng)的研究推向高潮。
1.3 成熟期(21世紀(jì))
21世紀(jì),是互聯(lián)網(wǎng)高度普及的時(shí)代。隨著科技的不斷發(fā)展,推薦系統(tǒng)也得到了相應(yīng)的完善。就我國(guó)的網(wǎng)絡(luò)現(xiàn)狀而言,目前推薦系統(tǒng)已遍布各種App,像微博搜索欄下的視頻推薦系統(tǒng)、優(yōu)酷愛(ài)奇藝等視頻播放平臺(tái)的興趣推薦系統(tǒng)、淘寶中的“猜你喜歡”等。這些我們常用的軟件,隨著科技的發(fā)展,都漸漸地將推薦技術(shù)的原理應(yīng)用其中,說(shuō)明推薦系統(tǒng)已不再是人們觸不可及的高端科技,漸漸變成了人們網(wǎng)絡(luò)生活中一項(xiàng)必不可少的功能。
2 微博中的視頻推薦算法原理
關(guān)于微博中的視頻推薦算法,現(xiàn)在最常用的有3種,分別是:基于內(nèi)容的推薦算法、基于協(xié)同過(guò)濾的推薦算法和基于社交網(wǎng)絡(luò)的推薦算法。這三種算法通過(guò)對(duì)用戶(hù)的發(fā)帖內(nèi)容、轉(zhuǎn)發(fā)點(diǎn)贊和搜索等進(jìn)行一系列的分析和評(píng)估,從而篩選出最符合用戶(hù)喜好的視頻并進(jìn)行推薦。下面就這3種方法進(jìn)行詳細(xì)介紹。
1)基于內(nèi)容的推薦算法?;趦?nèi)容的推薦算法是通過(guò)搜集用戶(hù)的個(gè)人喜好,來(lái)對(duì)用戶(hù)的搜索行為和興趣進(jìn)行建模,然后通過(guò)計(jì)算用戶(hù)喜好和文本內(nèi)容的相似度來(lái)匹配視頻的一種方法。簡(jiǎn)單點(diǎn)說(shuō)就是將用戶(hù)微博內(nèi)提及的內(nèi)容進(jìn)行總結(jié),再聯(lián)系出現(xiàn)相應(yīng)關(guān)鍵詞的視頻文本,進(jìn)行用戶(hù)的興趣視頻推薦。關(guān)于提取用戶(hù)文本里的關(guān)鍵詞,我們通常用到的算法叫做“TF-IDF”。這種算法能將用戶(hù)發(fā)布的微博中的“關(guān)鍵詞”的“特征權(quán)重”進(jìn)行計(jì)算分析,來(lái)衡量這個(gè)關(guān)鍵詞在該用戶(hù)喜好行為中的重要程度?!癟F”是根據(jù)一個(gè)特征詞在文本中出現(xiàn)的頻率越高就越重要的原理計(jì)算的,而“IDF”則是說(shuō)明一個(gè)特征詞多次出現(xiàn)在不同文本里,這個(gè)詞就不具備較強(qiáng)的區(qū)分性,就不能代表用戶(hù)的喜好。兩者的結(jié)合則高度的證明了一個(gè)用戶(hù)在網(wǎng)絡(luò)體驗(yàn)中的喜好。這種算法在某種程度上能使用戶(hù)的興趣和視頻內(nèi)容出現(xiàn)很大比重的重合。
2)基于協(xié)同過(guò)濾的推薦算法。協(xié)同過(guò)濾算法是通過(guò)分析該用戶(hù)在微博上的喜好,同時(shí)在廣大用戶(hù)群中篩選出同樣喜好的用戶(hù),并對(duì)這些用戶(hù)對(duì)某一信息的評(píng)價(jià)進(jìn)行整合評(píng)估,自動(dòng)形成該用戶(hù)對(duì)于這個(gè)關(guān)鍵詞喜好程度的預(yù)測(cè)。比如說(shuō)一個(gè)用戶(hù)喜歡搜索關(guān)于娛樂(lè)方面的社會(huì)熱點(diǎn)新聞,那么微博后臺(tái)就會(huì)將所有這方面的愛(ài)好用戶(hù)匯總,評(píng)估出這個(gè)用戶(hù)在所有用戶(hù)中對(duì)這方面的喜愛(ài)程度,得出用戶(hù)對(duì)此內(nèi)容喜愛(ài)度在廣大網(wǎng)友中的排名,了解你在相應(yīng)圈子里的位置,并進(jìn)行相關(guān)視頻推薦。
3)基于社交網(wǎng)絡(luò)的推薦算法。這一算法,是基于上面兩種算法進(jìn)行的補(bǔ)充,可以用來(lái)解決一個(gè)用戶(hù)特征不明確的問(wèn)題。它的原理主要是利用微博上一個(gè)用戶(hù)和另外用戶(hù)的鏈接關(guān)系進(jìn)行相關(guān)特征的預(yù)測(cè)。具體方法是通過(guò)分析這個(gè)用戶(hù)的關(guān)注以及粉絲的特征取向,將它們共同的特征進(jìn)行匯總,反映到這個(gè)用戶(hù)的特征上。好友圈就是一個(gè)能很好應(yīng)用這種算法的場(chǎng)所。兩個(gè)互相關(guān)注的用戶(hù)一定有著相類(lèi)似的喜好,因此通過(guò)分析好友圈里各個(gè)用戶(hù)的喜好可以更大程度的反應(yīng)一個(gè)用戶(hù)的喜好。如果說(shuō)兩人近期都搜索過(guò)某一綜藝節(jié)目,那么微博后臺(tái)自然就會(huì)推薦相應(yīng)的節(jié)目花絮給此用戶(hù)。
3 社交網(wǎng)站中的視頻推薦算法短板及優(yōu)勢(shì)
隨著時(shí)代的進(jìn)步,越來(lái)越多的人選擇通過(guò)微博來(lái)獲取信息。但這一技術(shù)目前還沒(méi)有發(fā)展到一個(gè)完善的階段,微博平臺(tái)中的視頻推薦仍存在以下幾點(diǎn)問(wèn)題:
1)對(duì)于該視頻搜索量的統(tǒng)計(jì)存在疏漏。使用目前微博里面的視頻推薦算法來(lái)推薦視頻,在某種程度上對(duì)其商業(yè)影響力造成影響。由于許多品牌是會(huì)對(duì)用戶(hù)在搜索欄的搜索量進(jìn)行數(shù)據(jù)的統(tǒng)計(jì),因此搜索量的好壞可以直接影響到該品牌對(duì)于這一視頻內(nèi)容商業(yè)上的重視程度。微博熱搜榜就是這一原理的良好體現(xiàn)。里面總結(jié)了當(dāng)下時(shí)段搜索量最高的一些內(nèi)容。品牌商官方微博的統(tǒng)計(jì)形式和熱搜榜實(shí)則大同小異。而微博中推薦的視頻是無(wú)法算作搜索量的,而搜索量對(duì)于一個(gè)品牌來(lái)說(shuō),是非常重要的參考數(shù)據(jù)。所以在搜索量統(tǒng)計(jì)這一方面,微博的視頻推薦技術(shù)存在一定的弊端。
2)推薦方式存在局限。微博視頻推薦技術(shù)只能針對(duì)完整播放和互動(dòng)率高的視頻進(jìn)行二次推薦。假如一個(gè)用戶(hù)看到他不感興趣的視頻,可能就會(huì)瀏覽幾秒鐘,那么微博系統(tǒng)就很難再次將這個(gè)視頻推薦給其他用戶(hù)。因此初始的完播率和互動(dòng)率對(duì)于一個(gè)視頻來(lái)說(shuō)尤為重要。
現(xiàn)在的社會(huì),各種各樣的媒體層出不窮,但推送的內(nèi)容實(shí)則大同小異。而新浪微博的這種視頻推送技術(shù),則是根據(jù)每個(gè)用戶(hù)當(dāng)下的“即時(shí)興趣”進(jìn)行分析在推送的。在海量的信息時(shí)代里尊重用戶(hù)的差異化愛(ài)好,進(jìn)行精準(zhǔn)的個(gè)性化推薦。個(gè)性化即時(shí)推送技術(shù)打破了固有的概念和模板,進(jìn)行了全新的嘗試。這在個(gè)性化傳播技術(shù)上無(wú)疑是一種巨大的飛躍。所以總體來(lái)說(shuō),微博視頻推薦技術(shù)對(duì)互聯(lián)網(wǎng)的影響,還是利大于弊的。以下是幾個(gè)顯著的優(yōu)點(diǎn)。
1)微博視頻推薦技術(shù)能較好的滿(mǎn)足用戶(hù)的個(gè)性化需求,不再一味的灌輸相同的信息。有些用戶(hù)常年在互聯(lián)網(wǎng)上看到的信息都是千篇一律的。而微博視頻推送的出現(xiàn),能讓許多用戶(hù)的個(gè)性化需求得以滿(mǎn)足,從而逃離固有的“繭房”,享受網(wǎng)絡(luò)帶來(lái)的樂(lè)趣。
2)推薦算法將不斷地與新媒體技術(shù)進(jìn)行融合,并在某種程度上促進(jìn)同行新媒體技術(shù)的創(chuàng)新發(fā)展。至今,網(wǎng)絡(luò)出現(xiàn)也已經(jīng)很長(zhǎng)一段時(shí)間了。隨著人們眼界的不斷開(kāi)闊和信息的不斷轟炸,固有的傳媒技術(shù)已經(jīng)進(jìn)入了一個(gè)瓶頸期。而微博視頻推薦技術(shù)的出現(xiàn),不僅滿(mǎn)足了用戶(hù)需求,還滿(mǎn)足了媒體平臺(tái),給他們帶來(lái)了很多流量。因此促進(jìn)了當(dāng)代網(wǎng)絡(luò)新媒體技術(shù)的轉(zhuǎn)型和升級(jí),促使各個(gè)平臺(tái)廣泛普及這項(xiàng)視頻推薦技術(shù),從而實(shí)現(xiàn)更多的創(chuàng)新。
4 結(jié)論
本文對(duì)推薦算法的發(fā)展進(jìn)行了簡(jiǎn)要概述,并就微博中視頻推薦算法的原理、短板及優(yōu)勢(shì)進(jìn)行了簡(jiǎn)單的研究和介紹。從20世紀(jì)90年代開(kāi)始,推薦算法從無(wú)到有,逐漸地被科學(xué)家們重視,并且發(fā)展為今天這樣能夠?yàn)槿藗兯玫募夹g(shù)。這一切都離不開(kāi)科技和人們思維的發(fā)展。發(fā)展的同時(shí)也暴露了相關(guān)的問(wèn)題,比如網(wǎng)絡(luò)時(shí)代的個(gè)人信息泄露等。但總的來(lái)說(shuō),時(shí)代還是在進(jìn)步,人們的思想也在進(jìn)步。到現(xiàn)在,人們還在不斷嘗試著怎么才能讓推薦算法更加便利地為廣大網(wǎng)友所用,帶給人們更加貼心的網(wǎng)絡(luò)體驗(yàn)。
參考文獻(xiàn)
[1]尚松濤,石民勇,尚文倩,等.基于大數(shù)據(jù)的微視頻推薦算法研究[J].中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,24(2):38-45.
[2]劉聰.論媒體個(gè)性化推薦模式對(duì)“信息繭房”的影響——以新浪新聞“即時(shí)推”功能為例[J].新聞研究導(dǎo)刊,2017(23).
[3]李鵬飛.視頻網(wǎng)站中混合模型推薦算法的優(yōu)化[D].北京:北京交通大學(xué),2014.
[4]李斌.推薦系統(tǒng)研究綜述[J].現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版),2014(3):7-10.