曾秀芹 何 夢 申夢莉 許文鵬
隨著互聯(lián)網的發(fā)展和普及,人類進入一個高度信息化的時代,網絡中的海量信息一方面滿足了用戶對信息的需求,另一方面也增加了人們找尋有用信息的成本,出現(xiàn)所謂的“信息過載”問題。個性化推薦系統(tǒng)是解決信息過載問題的一個有效辦法,而音樂推薦則是應用個性化推薦的一個重要領域。根據(jù)中國互聯(lián)網絡信息中心(CNNIC)發(fā)布的《第42次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》,截至2018年6月,我國手機網絡音樂用戶規(guī)模達到5.23億,占手機網民的66.4%。面對海量的音樂曲庫,越來越多的用戶使用音樂個性化推薦系統(tǒng)來尋找符合自身興趣的音樂。
目前學界與業(yè)界對推薦系統(tǒng)的研究大多關注推薦系統(tǒng)的技術算法,偏向技術導向,而以用戶心理體驗為視角的研究相對較少。評估推薦質量時傾向強調算法的準確性,而忽略了消費者心理體驗,并缺乏一個通用的推薦系統(tǒng)評價指標體系,這不利于推薦系統(tǒng)的優(yōu)化和改進。
據(jù)QuestMobile發(fā)布的《2017年中國移動互聯(lián)網年度報告》資料顯示,在移動音樂行業(yè)中,網易云音樂憑借社交、智能推薦、音樂內容的建設,30日留存率行業(yè)第一,并入選一線城市移動網民最愛TOP10 APP和二線城市移動網民最愛TOP10 APP第一。而在網易云音樂用戶中,“90后”與“00后”占比較高,用戶趨于年輕化。因此,本研究以大學生為研究對象,通過問卷調查和統(tǒng)計方法探索音樂推薦系統(tǒng)使用體驗的評價指標體系,并利用修訂過的量表對網易云音樂用戶進行驗證,證明其有效性。
自從1997年學界首次提出基于協(xié)同過濾算法的個性化推薦系統(tǒng)的概念之后,個性化推薦系統(tǒng)就成為學術界一個重要的研究領域。
關于推薦系統(tǒng)的概念和定義,學者們有著不同的闡釋。雷斯尼克和范里安[1]首次提出“推薦系統(tǒng)”(recommender system,RS)一詞,將其定義為:“它是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程。”劉建國等[2]表示個性化推薦系統(tǒng)的本質其實就是信息過濾,利用用戶已有的選擇過程或相似性關系挖掘每個用戶潛在感興趣的對象,進而進行個性化推薦。博瓦迪利亞等[3]認為推薦系統(tǒng)利用關于用戶的各種信息源推薦符合用戶偏好、品味和需求的服務,幫助用戶找到在特定領域可能感興趣的內容。
根據(jù)有關學者對個性化推薦系統(tǒng)的闡釋,筆者認為,個性化推薦系統(tǒng)使用計算機算法技術收集用戶相關信息,分析用戶的偏好,向用戶提供符合其需求和興趣的個性化推薦和服務。
音樂推薦系統(tǒng)是個性化推薦系統(tǒng)在音樂領域的延伸。音樂推薦起源于1995年,MIT媒體實驗室開發(fā)了第一個音樂推薦系統(tǒng)Ringo,Ringo系統(tǒng)可以預測用戶對歌曲的評分,推測用戶可能喜歡或者不喜歡的音樂,從而向用戶推薦他們感興趣的音樂[4]。Uitdenbogerd[5]認為音樂推薦系統(tǒng)結合用戶的人口統(tǒng)計學特性和音樂偏好,根據(jù)用戶的音樂品味,向他們推薦有趣和新穎的音樂。譚學清和何珊[6]認為音樂推薦系統(tǒng)需要綜合考慮用戶的需求,并結合多媒體領域的音頻特征識別、語音處理等技術完成音樂特征的提取,幫助用戶在海量數(shù)據(jù)庫中快速、準確地獲取自己感興趣的音樂曲目,是比一般推薦系統(tǒng)更復雜的系統(tǒng)。
筆者認為,音樂推薦系統(tǒng)是音樂平臺對個性化推薦系統(tǒng)的具體應用,根據(jù)用戶的閱聽習慣,分析用戶的音樂興趣和品味,向用戶推薦歌曲,以幫助用戶在龐大音樂庫中高效率地找到自己喜歡的音樂。
傳統(tǒng)的推薦系統(tǒng)多數(shù)偏向于技術算法的評價,而忽略以用戶心理為導向的主觀態(tài)度評價。近些年,隨著用戶地位的提升,學者們也開始關注推薦系統(tǒng)的用戶心理體驗問題,研究適用于評估推薦系統(tǒng)用戶態(tài)度的評價指標。
一些學者對個性化推薦系統(tǒng)的評價指標進行綜合性研究。麥克尼等[7]表示,感知可用性、感知易用性、感知個性化、感知多樣性、感知驚喜性和感知新穎性等多種因素影響用戶對推薦系統(tǒng)的滿意度。薩尼和古納瓦德納[8]總結的評價指標有:用戶偏好、預測準確度、覆蓋率、信心、信任、新穎性、驚喜度、多樣性、有用性、風險、魯棒性、隱私、適應性、可擴展性。Avazpour等[9]歸納了16個推薦系統(tǒng)評價指標:準確度、覆蓋率、多樣性、推薦信心、信任、新穎性、驚喜度、實用性、風險性、魯棒性、學習率、擴展性、穩(wěn)定性、隱私性、可用性、用戶偏好。曾秀芹等[10]提出電子商務中個性化推薦系統(tǒng)的評價指標體系并加以實證檢驗,該體系包括內容評價、感知易用性、感知有用性、頁面設計、互動評價、社會臨場感、信心、滿意度、影響速度、風險監(jiān)控及隱私管理11個指標。
還有一些學者試圖構建評價推薦系統(tǒng)的模型和框架。普等[11]在采用TAM和SUMI模型的基礎上設計出一個個性化推薦系統(tǒng)用戶評價模型——ResQue模型(1)ResQue模型包括四個維度:受眾系統(tǒng)質量感知(推薦項目質量、交互充分性、界面充分性);受眾信念感知(受眾感知易用性、有用性、互動可控性和透明度);受眾態(tài)度(總體滿意度、信心、信任);受眾行為意圖(采納推薦、購買行為、持續(xù)性、社會影響)。。該模型適用于電子商務平臺,為理解影響用戶采用推薦的重要因素做出了貢獻,并為指導推薦系統(tǒng)的用戶評估提供了一個有用的概念化工具。Knijnenburg等[12]設計了一個以用戶為中心的推薦系統(tǒng)評估模型,該模型展示了系統(tǒng)的客觀特性(推薦、互動、表現(xiàn)、能力)通過影響系統(tǒng)的用戶主觀感知(用戶對系統(tǒng)互動可用性、質量、吸引力的感知),繼而影響用戶的態(tài)度和行為(用戶體驗、用戶互動),與此同時,情景特征(隱私擔憂、熟悉度、系統(tǒng)信任、選擇目標)和用戶的人口統(tǒng)計學特征(地理、專業(yè)知識、信任、控制)也一同影響用戶的態(tài)度和行為。針對音樂推薦系統(tǒng)的用戶體驗研究比較少見,其中Zhang等人[13]對音樂個性化推薦系統(tǒng)的驚喜度進行研究,提出一個Auralist音樂推薦系統(tǒng),并使用準確性、驚喜度、新穎性和多樣性4個評價指標來定量地評估該系統(tǒng)的推薦質量,研究結果顯示突出驚喜度的Auralist音樂個性化推薦系統(tǒng)能夠顯著地增強用戶對推薦結果的滿意度。
綜上,盡管學界已經有不少關于推薦系統(tǒng)用戶體驗評價指標的研究,但是關于音樂個性化推薦系統(tǒng)的主觀體驗和評價的研究則很少,也缺乏系統(tǒng)性。因此,本研究旨在構建一個適用于音樂推薦系統(tǒng)評估的用戶體驗評價指標體系,進一步優(yōu)化推薦系統(tǒng)的用戶體驗。筆者在以往有關用戶評價指標的文獻基礎上,提出由內容性、功能性、頁面設計、響應速度、感知易用性、感知有用性、滿意度、信心、感知體驗和潛在風險10個維度構成的音樂推薦系統(tǒng)評價原始量表,然后通過深度訪談、預調查和正式調查對量表進行一系列修訂,以期構建一個適用于音樂推薦系統(tǒng)的評價指標體系。此外,本研究還以網易云音樂為例,用修訂好的量表評估其推薦系統(tǒng)在各項指標上的優(yōu)劣,并探討何種因素將影響用戶對推薦系統(tǒng)的評價。
為保證本研究貼合大學生群體的人群特征,對評價指標做在地化的探索與修訂,本研究在制定問卷前擬定了采訪提綱,選取20位具有音樂推薦系統(tǒng)使用經驗的在校大學生,展開半結構化深度訪談。圍繞文獻整理得出的評價維度,收集了受訪者在使用習慣、體驗感受、功能喜好等方面的評價反饋,以檢測問卷題項是否適用與全面,本階段生成音樂推薦系統(tǒng)的初始評價量表。
預調研階段,通過發(fā)放網絡問卷,共計回收樣本258份,經過篩選題過濾掉39份無效樣本,有效樣本量為219份。樣本構成情況為:在性別上,女性樣本居多,62.6%為女性,而男性占比37.4%;在受教育程度上,本科學歷樣本為47.0%,研究生學歷的有48.4%,??茖W歷的樣本占比4.6%。
針對收集來的樣本,本研究對各個測量項目進行了初步分析,檢驗量表的信度和效度,對信效度表現(xiàn)較差的題項進行調整,最后編制成較正式的評價量表。
正式調查是為了對預研究修訂過的正式量表進行信效度再檢驗,應用于特定音樂平臺,探索影響評價結果的具體因素。鑒于“網易云音樂”的用戶體量可觀,正式研究對象限定為“網易云音樂”的使用用戶。
結合線上發(fā)放及線下隨機攔訪的方式,本研究共收集問卷550份,最終確定有效問卷436份,其中女性277人,占63.5%,男性159人,占36.5%;年齡分布上,主要集中在19至26歲,共占90.4%,學歷分布上,54.6%為本科或???,45.4%為碩士及以上;地域分布比較均衡,33.9%來自農村,19.0%來自縣城,中小城市占30.5%,省會城市或直轄市占16.5%。
表1 樣本人口統(tǒng)計學構成概況
特征特征項樣本量占比(%)性別男性15936.5女性27763.5年齡18歲及以下112.519—22歲19043.623—26歲20446.827歲及以上317.1學歷???96.7本科20947.9碩士及以上19845.4地域農村14834.0縣城(包括城鎮(zhèn))8319.0中小城市13330.5省會城市或直轄市7216.5
本研究在文獻研究基礎上,提出音樂推薦系統(tǒng)包括內容性、功能性、頁面設計、響應速度、感知易用性、感知有用性、滿意度、信心、感知體驗和潛在風險10個維度。訪談結果發(fā)現(xiàn),由于媒介設備的升級及網速的提升,“響應速度”維度的存在意義不大,予以刪除,另外,“滿意度”及“潛在風險”維度的部分題項與其他維度的題項存在語意交叉,不能準確地體現(xiàn)測量意圖,予以刪除;考慮到個性化推薦評價指標沒有指向特定領域,部分題項不具有區(qū)分度,不能完全概括音樂用戶的使用心理,故本研究新增了多個受訪者重復提及的特征,并納入指標體系中。如“驚喜度”“瀏覽習慣一致性”與“潛在風險”等多個測量題項。
“驚喜度”源自用戶對音樂推薦功能的期望,不同于其他類型的推薦系統(tǒng),音樂是感性的藝術產物,用戶更容易接納推薦的內容,從而產生情感上的期望;目前國內多數(shù)音樂類APP的個性推薦功能居于首頁,占據(jù)了重要版面,用戶將頁面設計與瀏覽習慣的一致性作為考量指標,則反映出互聯(lián)網時代用戶對網頁交互體驗的需求;此外,多位受訪者表明對推薦質量的擔憂,相關表述有“推薦質量參差不齊”“頻繁推薦不感興趣的同類歌曲”“興趣相關但不喜歡”等。
根據(jù)定性研究結果,本文生成了由內容性、功能性、頁面設計、感知易用性、感知有用性、信心、感知體驗和潛在風險8個維度43個題項構成的音樂推薦系統(tǒng)評價量表。測量指標及其出處參見表2。
對于預調查收集到的219份有效數(shù)據(jù),本研究采用探索性因子分析和內在一致性信度檢驗來檢驗初始量表的信度和效度。
本研究使用SPSS19.0分析檢測樣本。在進行因子分析前,首先進行KMO檢驗,判斷量表數(shù)據(jù)是否適合做因子分析,本問卷量表的KMO值為0.879>0.70,且Bartlett球形檢驗結果非常顯著(p=0.000),說明各個變量間存在相關,適合因素分析。進而采用主成分分析法和最大方差法獲得因子載荷矩陣,發(fā)現(xiàn)“信心”量表的所有題項及“感知有用性”部分題項跨載荷超過0.4,予以刪除,同時逐項刪除共同度和因素載荷表現(xiàn)不佳的項目。經過多次分析,最終保留33個題項,析出7個公共因子(見表3)。
表2 音樂推薦系統(tǒng)用戶原始評價指標體系匯總
二階指標一階指標測量題項題項來源內容性準確度Q2-1Pu et al.,(2008)[14]熟悉度Q2-2Swearingen & Sinha,(2002)[15]新穎性Q2-3Pu et al.,(2009)[16]多樣性Q2-4Jones & Pu,(2008)[17]驚喜度Q2-5Kotkov et al.,(2016)[18];譚學清&何珊,(2014)[6];由訪談結果增加該題項充分性Q2-6Delone & McLean,(2003)[19];Kirakowski & Corbett,(1993)[20]更新速度Q2-7Delone & McLean,(2003)[19];Kirakowski & Corbett,(1993)[20]需求考量Q2-8Komiak & Benbasat,(2006)[21]功能性感知信息診斷力Q3-1Kempf & Smith,(1998)[22]偏好修正Q3-2Chen & Pu,(2009)[23]解釋能力Q3-3Tintarev & Masthoff,(2007)[24]交流能力Q3-4劉蓓琳,(2012)[25]頁面設計清晰易懂性Q4-1曲目充分性Q4-2信息豐富性Q4-3風格一致性Q4-4瀏覽習慣一致性Q4-5Delone & McLean,(2003)[19]江娟等,(2014)[26];由訪談結果增加Q4-4和Q4-5題感知易用性使用便益性Q5-1~Q5-3反饋便益性Q5-4~Q5-9Hu & Pu,(2009)[27];Pu et al.,(2011)[11];Kirakowski & Corbett,(1993)[20];由訪談結果增加Q5-9題項感知有用性耗時性Q6-1效率Q6-2偏好影響Q6-3Stohr & Viswanathan,(1998)[28];Pu & Chen,(2006)[29];信心品質信心Q7-1推薦信心Q7-2品味信心Q7-3依賴信心Q7-4Pu et al.,(2012)[30]感知體驗關懷性Q8-1交互性Q8-2人情味Q8-3Qiu & Benbasat,(2010)[31]潛在風險風險Q9-1Q9-2~Q9-7Shani & Gunawardana,(2011)[8];黃鼎隆等,(2008)[32]由訪談結果增加Q9-2~Q9-7題項
表3 網易云音樂推薦系統(tǒng)評價指標的因子矩陣
題項共同度因素載荷因子S1因子S2題項共同度因素載荷因子S3因子S4因子S5因子S6因子S72-10.610.754-10.740.772-20.640.794-30.720.772-30.740.824-40.820.852-40.540.664-50.760.762-50.640.729-30.580.582-60.660.799-50.680.772-70.630.779-60.600.702-80.640.759-70.720.805-10.630.579-10.660.715-20.620.529-20.700.775-30.700.609-40.740.775-50.670.773-20.680.675-60.750.803-30.770.845-70.770.763-40.660.745-80.640.758-10.720.606-20.560.588-20.780.678-30.610.74因子命名內容性感知易用性因子命名頁面設計質量風險干擾風險功能性感知體驗因子方差貢獻率(%)14.6514.39因子方差貢獻率(%)11.187.967.296.786.01累計方差貢獻率(%)14.6529.04累計方差貢獻率(%)40.2248.1855.4762.2668.26
根據(jù)變量抽取的因子分布情況,對7個公共因子重新命名。因子S1“內容性”包含8個題項,分析音樂個性化推薦系統(tǒng)的準確度、熟悉度、新穎性、多樣性、驚喜度、充分性、更新速度、需求考量等內容特性,其中“新穎性”權重(載荷值=0.82)最高,由于音樂用戶的閱聽風格不固定、兼容性強,用戶更期望推薦陌生新穎的歌曲;因子S2“感知易用性”包含8個題項,體現(xiàn)在使用推薦系統(tǒng)時的便利性和系統(tǒng)對用戶操作反饋的及時性,其中“反映偏好變化的及時性”權重(載荷值=0.80)最高,表明用戶看重推薦系統(tǒng)的定制化特征,推薦系統(tǒng)如能及時探測到用戶的偏好變化,推送相關風格的歌曲,可使用戶感受到作為個體的獨特性;因子S3包含4個題項,主要描繪音樂個性化推薦系統(tǒng)頁面的設計元素,因此命名為“頁面設計”,其中“顏色、風格看上去舒服”權重(載荷值=0.85)最高,表明推薦系統(tǒng)在設計頁面時,應重視迎合用戶的直觀審美感受;變量“潛在風險”析出了兩個公共因子S4和S5,因子S4包含4個題項,主要描繪用戶對推薦內容質量問題的覺察,因此命名為“質量風險”,其中“數(shù)量過?!睓嘀?載荷值=0.80)最高,推薦數(shù)量過多會增加信息篩選成本,引起用戶反感情緒,平臺未來應重視平衡推薦數(shù)量;因子S5主要展示推薦功能對用戶聽歌體驗可能產生的干擾項,造成用戶的聽歌障礙,因此命名為“干擾風險”;因子S6包含3個題項,展示了音樂個性化推薦系統(tǒng)的功能應用,因此命名為“功能性”;因子S7包含3個題項,描繪了用戶在使用過程中感知到的體驗,如推薦系統(tǒng)的關懷性、交互性和人情味,因此命名為“感知體驗”。
最終本研究構建出由內容性、功能性、頁面設計、感知易用性、感知體驗、干擾風險和質量風險7個維度構成的音樂推薦系統(tǒng)評價指標體系,具體33個題項如表4所示。
表4 網易云音樂推薦系統(tǒng)用戶評價指標體系匯總
二階指標一階指標測量題項Cronbach's α系數(shù)二階指標一階指標測量題項Cronbach's α系數(shù)內容性準確度Q2-1熟悉度Q2-2新穎性Q2-3多樣性Q2-4驚喜度Q2-5充分性Q2-6更新速度Q2-7需求考量Q2-80.90功能性偏好影響Q3-1解釋能力Q3-2交流能力Q3-30.80頁面設計清晰易懂性Q4-1信息豐富性Q4-2風格一致性Q4-3瀏覽習慣一致性Q4-40.91感知易用性使用便益性Q5-1~Q5-4反饋便益性Q5-5~Q5-80.92感知體驗關懷性Q6-1交互性Q6-2人情味Q6-30.86干擾風險廣告干擾Q7-1消費干擾Q7-2內容無關性Q7-30.81質量風險興趣無關性Q8-1質量不一Q8-2數(shù)量過剩Q8-3重復推薦Q8-40.79
對總量表和各分量表進行內在一致性檢驗,結果表明量表整體的克隆巴赫α值為0.93,各分量表的克隆巴赫α值在0.79—0.91之間,均大于0.75,信度理想,具體見表4。
1.評價量表的信效度再檢驗
利用本研究正式調研收集的436份有效樣本進行驗證性因子分析,再次檢驗評價體系跨樣本間的穩(wěn)定性。
根據(jù)統(tǒng)計學家的建議(Hu & Bentler,黃芳銘),本研究采用χ2/df、RMSEA、RMR、GFI、NFI、CFI、TLI指標來對測量模型的擬合優(yōu)度進行評價。
由于本評價體系中有些維度的測量項目比較多,為了簡化模型,此處采用結構方程建模中的題目打包法(2)題目打包法(item parceling,也譯為題目組合法或題目小組法)是解決此類問題的一種有效方法(Landis,Beal,&Tesluk)。[33]對相關題目進行打包處理[34]。最終模型如圖1所示。
在整體模型適配度方面,各指標的理想值如表5所示。
其中,除AGFI值略小于0.9外,χ2/df=3.01,RMSEA介于0.05—0.08,RMR值小于0.05,GFI、NFI、TLI、CFI值均大于0.9符合要求,說明本模型擬合較為理想。本研究所修訂的音樂推薦系統(tǒng)評價體系的結構效度再次得到檢驗。
對收集到的數(shù)據(jù)進行信度和效度分析。以整體信度和建構信度為檢驗標準:整體信度通過Cronbachα系數(shù)進行檢驗,總量表信度在0.8以上,各維度信度在0.7以上,表示量表信度好;建構信度(CR值)用于評估潛變量下的各個測量變量之間的內在一致性,CR值越大,表示信度越高,量表的內在一致性越好,需大于0.6。CFA檢驗建構效度,包含收斂效度(聚合效度)與區(qū)分效度(判別效度):當標準化載荷在0.5以上,平均方差抽取(AVE)大于0.5時,表示聚合效度良好;當潛變量的AVE平方根大于其與其他潛變量的相關系數(shù),表明量表的區(qū)分效度良好。信效度系數(shù)詳見表6所示。
圖1 網易云音樂推薦系統(tǒng)評價指標結構方程模型
表5 網易云音樂推薦機制各因子的擬合度指標
擬合指標χ2dfχ2/dfRMRGFIAGFINFITLICFIRMSEA一階七因子斜交模型343.681143.010.030.910.870.940.940.960.07理想值——1-5<0.05>0.9>0.9>0.9>0.9>0.9<0.08
注:理想值標準來源于《結構方程模型:AMOS的操作與應用》[35]。
表6 各維度信度、聚合效度和區(qū)分效度檢驗
內容性功能性頁面設計感知易用性感知體驗干擾風險質量風險內容性(0.840)功能性0.651(0.797)頁面設計0.6850.548(0.870)感知易用性0.7480.6650.754(0.848)感知體驗0.6160.6230.6410.731(0.882)干擾風險0.1960.2780.2070.2760.329(0.734)質量風險0.2270.2160.2320.2480.3070.638(0.760)Cronbachα0.900.800.910.920.860.810.79CR值0.87790.77120.86180.88440.87460.77620.8042AVE值0.70570.63450.75730.71890.77800.53910.5781
注:變量相關系數(shù)矩陣對角線上括號中的值是AVE平方根。
信度檢驗結果顯示:量表整體信度(Cronbach α系數(shù))為0.93,各一階潛變量的整體信度均達到0.7以上,整體信度良好;各維度的CR值均大于0.6,建構信度良好。效度檢驗結果顯示:七個維度題項的標準化載荷均大于0.5,且達到顯著性水平;在平均方差抽取量方面,各維度的AVE值均達到0.5以上,說明各維度(分量表)的聚合效度良好。各維度AVE的平方根均大于其與其他維度之間的相關系數(shù),說明各維度之間具有區(qū)分效度。
2.對網易云音樂推薦系統(tǒng)的評價現(xiàn)狀
本研究對436位大學生樣本進行描述性統(tǒng)計,結果如表7所示。
表7 變量間相關系數(shù)及描述性統(tǒng)計表
均值標準差內容性功能性頁面設計感知易用性感知體驗干擾風險質量風險內容性3.640.611功能性3.390.730.65??1頁面設計3.820.650.69??0.55??1感知易用性3.710.630.75??0.67??0.75??1感知體驗3.670.700.62??0.62??0.64??0.73??1干擾風險3.670.700.20??0.28??0.21??0.28??0.33??1質量風險3.220.790.23??0.22??0.23??0.25??0.31??0.64??1總體評價3.590.520.83??0.81??0.82??0.89??0.85??0.47??0.46??
研究發(fā)現(xiàn),除“干擾風險”及“質量風險”外,各指標與“總體評價”呈高度相關,且用戶對網易云音樂推薦系統(tǒng)的總體評價良好(M=3.59),其中“頁面設計”評價最高(M=3.82),說明其交互設計符合多數(shù)人的審美取向;用戶對“質量風險”的評價最低(M=3.22),且與其他變量呈低度相關,表明用戶察覺到網易云音樂推薦的歌曲質量存在風險,推薦質量不穩(wěn)定。盡管“潛在風險”與其他各變量呈低相關關系,但依舊表現(xiàn)為正向相關,說明用戶的使用體驗必然會伴隨一定程度的風險感知。另外,用戶對網易云音樂推薦系統(tǒng)的“功能性”評價同樣偏低(M=3.39),說明網易云音樂在與用戶的功能溝通上存在欠缺,功能反饋的靈敏性不足,需要進一步完善內嵌功能,加強雙向反饋。
3.用戶評價的影響因素探究
(1)人口統(tǒng)計學變量對用戶評價的影響分析
本研究采用單因素方差分析檢驗不同性別、學歷、地域的群體對網易云音樂推薦系統(tǒng)評價是否具有顯著影響(見表8)。結果顯示,男性評價普遍高于女性,特別表現(xiàn)在功能性評價方面,性別差異顯著(F=5.19,df=1,p<0.05)。從學歷層次上來看,專科生的評價分值整體偏高,本科生的評價相對較低,研究生則介于二者之間,并且在多個評價指標上均存在顯著性差異。至于來自地域,總體而言分值差異不大,僅在“干擾風險”及“質量風險”上具有顯著差異(F=6.00,df=3,p=0.00<0.05;F=3.47,df=3,p=0.02<0.05),說明地域因素對網易云音樂推薦系統(tǒng)的評價整體不構成影響。
表8 不同群體間用戶評價的分值比較
注:p<0.1,**p<0.05。
(2)行為習慣變量對用戶評價的影響作用
依據(jù)深度訪談結果,研究人員發(fā)現(xiàn)不同使用行為的用戶會導向不同的評價結果。為證實這一設想,本研究將“周使用頻率”“愛好程度認知”及“依賴程度認知”作為用戶行為數(shù)據(jù)的差異指標,采用單因素方差分析檢測用戶行為差異對推薦系統(tǒng)總體評價的影響。具體結果如表9所示。
表9 用戶行為習慣差異性均值比較結果
dfF顯著性R方Eta周使用頻率?總體評價22.730.000.050.22愛好程度認知?總體評價32.890.040.020.14依賴程度認知?總體評價45.970.000.050.23
根據(jù)方差分析結果,“周使用頻率”“愛好程度認知”及“依賴程度認知”分別達到了顯著性水平,Sig值均小于0.05,說明對總體評價有顯著影響。結果表明,用戶間的不同行為習慣對其評價存在顯著差異,對推薦功能的使用頻率、愛好程度及依賴程度也會左右用戶的評價感受。
本研究聚焦個性化推薦系統(tǒng)的分支方向——音樂推薦系統(tǒng),應用定性與定量相結合的方法,構建具有良好信效度的用戶評價工具,提出音樂推薦系統(tǒng)的評價指標體系由內容性、功能性、頁面設計、感知易用性、感知體驗、干擾風險和質量風險七個維度構成,并以網易云音樂推薦系統(tǒng)為例進行檢驗。
第一,本研究發(fā)現(xiàn),大學生網易云音樂推薦系統(tǒng)的頁面設計評價最高,頁面設計迎合了網易云用戶年輕化的心理需求,同時也是決定用戶是否繼續(xù)使用APP的重要因素之一。而用戶在感知易用性、感知體驗、干擾風險和內容性方面評價稍低,用戶結合自身所處的大數(shù)據(jù)時代和高風險社會背景,在心理需求層面對其綜合評價較低,表明用戶在推薦系統(tǒng)的內容和可能存在的風險等方面存在自己較為獨立的思考。而用戶在功能性和質量風險方面評價最低,這也表明用戶對感知信息診斷力、偏好修正、解釋、交流能力方面信心不足,推薦系統(tǒng)并不能全面、精準、有效地滿足用戶需要。
第二,在本研究中,研究者發(fā)現(xiàn)大學生群體中的人口統(tǒng)計學因素和相關行為變量同樣影響著推薦系統(tǒng)的滿意度評價。
從人口統(tǒng)計學因素來看,男性和女性在聽歌時長上存在顯著差異。男性對推薦音樂的使用頻率較為不穩(wěn)定,有兩極分化的趨勢,而女性之間的使用頻率相對穩(wěn)定。在受教育程度方面,不同教育水平對受眾的總體評價存在顯著差異,低學歷群體更容易成為高度影響者,而高學歷群體更容易成為低度影響者,對網易云音樂的總體評價相對要更為客觀。在地域類別方面,受眾的干擾風險及質量風險感知在不同類別地域間存在一定差異;來自中小城市及以上的受眾評分整體要低于來自農村和縣城的受眾,這表明地區(qū)的經濟發(fā)達程度會影響受眾對風險的感知接納程度。
從行為變量方面來看,在使用網易云音樂客戶端的大學生中,有三分之一的學生每天都會使用其音樂推薦系統(tǒng),但依賴音樂推薦系統(tǒng)的比例并不高。“每日推薦”“推薦歌單”“私人FM”和“排行榜”是大學生最常使用的推薦欄目;網易云音樂服務商可以在提升這幾個推薦欄目的推薦準確度和推薦質量的同時,考慮對其他幾個推薦欄目進行完善,提升受眾黏性。
本研究結合訪談結果和文獻研究制訂出音樂推薦系統(tǒng)的初始評價量表,并通過預研究和正式研究等實證數(shù)據(jù)對該量表進行信效度檢驗,證明該量表為音樂平臺個性化推薦系統(tǒng)提供了一個較為全面、科學、客觀的評價指標體系,為未來此類的研究方向打下堅實的基礎。本研究以內容性、功能性、頁面設計、感知易用性、感知體驗、干擾風險和質量風險這七個維度為落腳點,結合用戶的使用情境、使用目的、自身對于音樂的愛好程度和對推薦功能的依賴程度進行綜合探究,還探討了影響音樂推薦系統(tǒng)使用主體的因素,為音樂推薦系統(tǒng)的質量提升,用戶體驗改善提供了參考。
本研究的不足之處在于抽樣過程不夠嚴謹,部分問卷是通過線上發(fā)放得來,雖然在數(shù)據(jù)分析前的數(shù)據(jù)處理環(huán)節(jié)剔除了該部分樣本,但仍有可能影響到人口學等方面的結果。此外,筆者將樣本類型詳細界定為在校大學生,學生樣本的不穩(wěn)定性可能會影響調研結果。
因此,未來的研究方向可能會進一步擴大樣本量,同時嚴格控制樣本的獲取并針對個性化推薦系統(tǒng)的潛在風險作更深一步的研究。
依據(jù)本研究的發(fā)現(xiàn),本文對音樂平臺提出以下幾條可能性的實踐啟示:
其一,加強推薦內容的豐富度與個性化。現(xiàn)階段的推薦內容多為千篇一律的大眾熱門音樂,平臺應結合用戶的閱聽習慣推薦一些小眾冷門的長尾音樂,給用戶帶來新鮮感和驚喜。
其二,重視功能性方面的偏好影響和交流能力。目前平臺的推薦方式不能充分影響用戶的音樂偏好,且用戶間交流渠道單一,未來可以考慮強化不同欄目間的差異性,拓展用戶間交流渠道,增強社交黏性,打造交互式平臺。
其三,保證頁面設計清晰易懂和信息豐富。音樂平臺在更新頁面設計和版本時,可以考慮當前大眾的審美習慣,簡化頁面標簽和布局。
其四,提升用戶使用的便益性。在推薦效率方面,協(xié)調量與質的均衡,使用戶更快速地找到自己喜歡的音樂。
其五,重視用戶的心理體驗。音樂平臺應更加智能化和人性化,給予用戶人文關懷,拉近與用戶的心理距離。
其六,強化風險監(jiān)控,把關推薦質量。音樂平臺可以減少無關及重復內容的推送,注重提升推薦音樂品質和精度,減少用戶在風險方面的顧慮。
綜上所述,未來音樂推薦系統(tǒng)的改進方向可參照本文的7個維度,兼顧多個方面的評價指標,既要提升包括內容性、感知易用性、感知體驗、干擾風險及質量風險在內的軟件標準,也不能忽視頁面設計、功能性方面的硬件標準。在后續(xù)的算法優(yōu)化中,將用戶評價指標納入考量范圍,貼合用戶的心理感受,讓技術主動擁抱用戶。