王 雪 查先進 嚴(yán)亞蘭
(1.武漢大學(xué)信息管理學(xué)院 湖北武漢 430072)
(2.武漢大學(xué)圖書情報國家級實驗教學(xué)示范中心 湖北武漢 430072)
(3.武漢科技大學(xué)恒大管理學(xué)院 湖北武漢 430065)
新信息時代是語義網(wǎng)絡(luò)、人工智能和個性化定制的時代,借助智能推薦算法,社會化媒體能夠根據(jù)用戶及其他相似用戶的歷史信息行為把握和滿足用戶信息需求、主動提供更精準(zhǔn)的信息服務(wù),一定程度上緩解了信息過載壓力。然而,人機協(xié)同下的智能推薦讓用戶愈加受困于同質(zhì)化的信息繭房中,加劇了用戶的信息疲勞感,一定程度上違背了社會化媒體促進用戶多對多互動交流、給予用戶最大可能參與空間的初衷。智能推薦環(huán)境下,如何平衡信息的同質(zhì)和異質(zhì)、單一和多元、精準(zhǔn)和泛化問題,變得十分迫切。
知乎作為國內(nèi)最受歡迎的綜合性社會化問答社區(qū),通過“推薦”向用戶傳遞知識,通過“邀請回答”鼓勵用戶貢獻(xiàn)內(nèi)容,每天新增超過2000萬條創(chuàng)作和互動[1],然 而 馬 太 效 應(yīng) 明 顯[2],老 問 題 或 高 影 響 力 用 戶關(guān)注的問題回答眾多,普通信息搜尋者(提問者)的新問題卻鮮有人問津;且智能推薦的受邀問題量大又相似,知識貢獻(xiàn)者(答題者)面臨信息過載和信息繭房的雙重困擾。為提高提問者和答題者的匹配度、推動社會化問答社區(qū)的可持續(xù)發(fā)展,本研究以知乎“邀請回答”智能推薦功能為背景,爬取知乎用戶已有的在線討論數(shù)據(jù),通過扎根理論分析,試圖回答以下兩個問題:(1)問答社區(qū)中什么樣的問題才算好問題?(2)智能推薦問題情境下,影響用戶為新問題貢獻(xiàn)知識的因素有哪些,其影響機理是什么?
社會化問答社區(qū)融合了社交與知識傳播功能,已有問答和活躍答題者構(gòu)成了核心知識庫[3],使其成為人們?nèi)粘+@取知識的重要渠道。提問者和答題者都是社會化問答社區(qū)的貢獻(xiàn)者[4],提問者是知識搜尋者,也是問題信息源,側(cè)重于為社區(qū)貢獻(xiàn)好問題;答題者是知識貢獻(xiàn)者,側(cè)重于提供、整合或創(chuàng)造隱性或顯性知識[5]。如何促進用戶貢獻(xiàn)和持續(xù)貢獻(xiàn)知識是提高社會化問答社區(qū)問答質(zhì)量、擴大知識庫的關(guān)鍵[6]。許多學(xué)者基于社會交換和期望確認(rèn)指出,答題需要耗費時間、精力等成本[7],通過對感知收益(如利他主義[8]、聲譽、互惠[9]等)、感知成本和自身期望(如反 饋 期 望 確 認(rèn) 程 度[10]、優(yōu) 秀 答 題 者 稱 號[11]等)的評估來決策答題與否[12]。用戶持續(xù)答題是為了維持實際獲得或感知的收益、避免中斷答題所造成的成本或損失[13],感知收益還會通過社區(qū)契合和社區(qū)依賴等情感因素中介影響知識持續(xù)貢獻(xiàn)意愿[14],但Kang認(rèn)為,答題者成為活躍用戶后,知識共享變成一種自動重復(fù)的習(xí)慣,并不會每次都評估成本和收益[15]。此外,社區(qū)成員間的互動關(guān)系強度[16]、基于身 份 的 信 任[17]、同 伴 效 應(yīng)[18]等 影 響 答 題 者 的 知 識 貢獻(xiàn)意愿和行為,知識貢獻(xiàn)行為也影響用戶的獲贊數(shù)、粉絲數(shù)等社會資本[19]。
已有的社會化問答社區(qū)知識貢獻(xiàn)行為研究并未區(qū)分知識貢獻(xiàn)的途徑,且更關(guān)注回答,如答案質(zhì)量評估[20]和影響因素[21]。本文認(rèn)為,社會化問答社區(qū)知識貢獻(xiàn)的途徑有多種,以知乎為例,就存在瀏覽主頁時回答、接收邀請時回答、搜索話題回答等多種途徑。其中“邀請回答”需要一系列點擊操作、付出更多沉沒成本,有理由相信用戶已產(chǎn)生對受邀問題的好奇,更可能成為潛在答題者。此外,問題才是社會化問答社區(qū)的根基,沒有問題就沒有回答,就不會存在知識共享和交流,一個好問題對答題者和問答社區(qū)都至關(guān)重要。問題屬性與答案數(shù)量具有相關(guān)關(guān)系[22],主動的答題者很大程度上會從質(zhì)量評價角度來作決策,如提問者的社會資本[23],問題的類型[22]、清晰度[24]、可讀性[25]、相關(guān)性、啟示性[26]等。
智能推薦算法在社會化媒體平臺中廣泛應(yīng)用,如何利用用戶信息行為數(shù)據(jù)來提升智能推薦算法的準(zhǔn)確度和效率已被廣泛研究[27],但智能推薦系統(tǒng)帶來的行為影響近幾年才開始受到關(guān)注[28]。功能價值、社交價值和情感價值是用戶采納智能推薦服務(wù)的主要因素[29]。Rosenthal等發(fā)現(xiàn)個性化推薦信息接受度越高,用戶對Facebook的信任度越高[30];Bodó等從過濾氣泡角度討論了個性化新聞推薦中用戶對多樣性的重視[31];袁向玲和牛靜證實用戶的隱私素養(yǎng)能通過隱私關(guān)注和個性化信息接受意愿的鏈?zhǔn)街薪樾?yīng)影響隱私管理行為[32];張雄濤和甘明鑫指出社會化媒體推薦可以提升用戶的感知收益、增強平臺信任、緩解隱私顧慮,進而積極影響用戶信息交 互意向[33]。
在知乎等社會化問答社區(qū)中,“邀請回答”是一種典型的智能推薦功能,其主要機制是平臺根據(jù)用戶瀏覽、點贊、收藏、關(guān)注或回答過的問題及用戶自己添加的話題標(biāo)簽,基于提問者邀請,智能推薦可能解答的問題,實現(xiàn)問答社區(qū)的分工協(xié)同[34]。“邀請回答”增加了新問題獲得答案的機會,對知識共享行為具有積極影響[35]。目前大多研究更偏向從提問者角度探究如何將問題推薦給高回答率的潛在答題者[36],或 基 于 問 答 社 區(qū) 的 首 頁 推 薦 環(huán) 境[37],并 未 從潛在答題者角度考慮智能推薦的新問題對其偏好選擇和行為決策的影響。
知乎用戶對“邀請回答”具有最直觀的體會和發(fā)言權(quán),已有許多用戶針對“邀請回答”下答題與否進行了討論,與本文研究主題不謀而合,這些用戶具有代表性和典型性,符合本文調(diào)查對象特點。故本文重點爬取了相關(guān)問答文本,利用八爪魚數(shù)據(jù)爬取軟件,設(shè)計了三種數(shù)據(jù)爬取方式:(1)關(guān)鍵詞搜索“邀請回答”;(2)話題標(biāo)簽“邀請回答(知乎功能)”中的“精華”;(3)循環(huán)搜索具體問題鏈接。共得到182個問題及3074條回答,剔除與“邀請回答”功能和知識貢獻(xiàn)不相關(guān)的問答和無效回答,對篩查后的典型問題單獨搜索以不遺漏密切相關(guān)的所有回答,最終獲取34個問題和607條回答(所得典型問題見表1)。截至爬取時間為2021年5月31日。
表1 典型問題
扎根理論是一種典型的質(zhì)性研究方法,能夠同時基于原始資料和已有文獻(xiàn)建立理論體系,契合本文的研究目標(biāo)。按照扎根理論三級編碼方法(開放編碼、主軸編碼和選擇編碼)[38]對所搜集的問答文本進行編碼,并預(yù)留45個回答(同一問題每10個回答預(yù)留1個)作理論飽和度檢驗。在編碼過程中,借助Nvivo12軟件來提高編碼的質(zhì)量。
開放編碼是對原始文本進行概念化和范疇化處理。研究者依據(jù)研究目標(biāo),按照反映真實內(nèi)涵、意思相同或相近的原則,對原始數(shù)據(jù)進行逐句逐段閱讀和分析,在盡量保留原話的同時也對部分詞句適當(dāng)抽象,經(jīng)多次對比梳理,最終提煉出209個初始概念。然后結(jié)合原始陳述,系統(tǒng)梳理了初始概念之間的內(nèi)在聯(lián)系,將具有相同本質(zhì)屬性的概念進行合并歸納,最終得到22個出現(xiàn)頻次大于2的基本范疇,并得到開放編碼結(jié)果(見表2)。
主軸編碼需要建立各基本范疇間的邏輯關(guān)聯(lián),進行聚類分析以構(gòu)建主范疇。從已形成的基本范疇來看,存在對信息和信息源的評估、對行為結(jié)果的預(yù)判、對行為的情感反應(yīng)、態(tài)度的性格表征、條件保障等邏輯關(guān)系,將其進一步聚類歸納為9個主范疇:問題質(zhì)量、問題過載、提問者可靠性、動機、情感狀態(tài)、性格特征、過程連續(xù)性、知識貢獻(xiàn)意愿、知識貢獻(xiàn)行為。最終得出主軸編碼結(jié)果(見表3)。
表3 主軸編碼結(jié)果
選擇編碼需要處理主范疇之間的關(guān)系結(jié)構(gòu),以形成影響潛在答題者回答受邀問題的完整“故事線”。對智能推薦問題情境下的知識貢獻(xiàn)行為影響機理進行梳理,構(gòu)建模型(見圖1),可以發(fā)現(xiàn):(1)知識貢獻(xiàn)意愿和行為主要受“認(rèn)知-動機-態(tài)度”三個維度的直接影響,其中“認(rèn)知”包括問題質(zhì)量、問題過載和提問者可靠性,“態(tài)度”即情感狀態(tài);(2)過程連續(xù)性為潛在答題者將知識貢獻(xiàn)意愿轉(zhuǎn)化為知識貢獻(xiàn)行為提供了保障;(3)“認(rèn)知”維度的問題過載、問題質(zhì)量、提問者可靠性對動機和情感狀態(tài)具有重要影響,問題質(zhì)量影響提問者可靠性感知;(4)“動機”維度中,動機積極影響潛在答題者的情感狀態(tài),認(rèn)同反饋滿意度會影響感知利己性和利他性;(5)“態(tài)度”維度的情感狀態(tài)在“認(rèn)知”和“動機”對知識貢獻(xiàn)意愿和行為的影響中具有中介作用,時間壓力會影響情緒;(6)潛在答題者的性格特征可由“態(tài)度”反映而出,會直接影響知識貢獻(xiàn)意愿和行為。
圖1 智能推薦問題情境下知識貢獻(xiàn)行為影響機理模型
為確保各范疇的信效度,本研究對預(yù)留的45個回答按照相同的編碼原則進行檢驗,沒有發(fā)現(xiàn)新的范疇和不一致的關(guān)系結(jié)構(gòu)。因此可以認(rèn)為,上述智能推薦問題情境下知識貢獻(xiàn)行為影響機理模型達(dá)到理論飽和。
通過扎根理論,本研究分析總結(jié)出社會化問答社區(qū)智能推薦問題情境下知識貢獻(xiàn)行為“認(rèn)知-動機-態(tài)度-意愿-行為”的影響機理。除了認(rèn)知、動機和態(tài)度等對意愿和行為帶來的直接影響,智能推薦問題情境下的知識貢獻(xiàn)行為還表現(xiàn)出更為復(fù)雜的影響過程:與首頁推薦信息瀏覽的情境不同,多數(shù)用戶是懷著成為潛在答題者的積極情緒打開“邀請回答”智能推薦功能,受邀問題是用戶首先需要處理的認(rèn)知對象,用戶更關(guān)心自己能否回答問題而非對該問題已有回答的興趣,這一信息加工過程受到信息繭房和信息過載的雙重影響,用戶在根據(jù)自身問題質(zhì)量評價指標(biāo)進行篩選過濾的同時,也會直接跳過多余問題以避免認(rèn)知超載和時間壓力;提問者作為信息源,是用戶次要處理的認(rèn)知對象,這一過程往往在問題信息處理過后并受到問題質(zhì)量影響,因此可能會被忽略,也可能會強化用戶的答題意愿和行為;整個認(rèn)知過程和以往答題經(jīng)歷會影響用戶利他性或利己性動機的產(chǎn)生,并在認(rèn)知和動機的共同作用下觸發(fā)時間壓力和情緒,進一步引發(fā)知識貢獻(xiàn)意愿,最后促成知識貢獻(xiàn)行為,甚至持續(xù)貢獻(xiàn)意愿。
優(yōu)質(zhì)問題能夠帶動用戶的知識貢獻(xiàn)意愿和行為[52],“邀請回答”不同于首頁推薦環(huán)境,用戶面臨更千奇百怪、復(fù)雜多樣的問題信息,因此會更注重問題本身質(zhì)量。本文歸納出問題質(zhì)量評估的9個指標(biāo)——相關(guān)性、難度、趣味性、多樣性、易理解性、意義、友好性、受關(guān)注度和時效性,但并不是所有指標(biāo)都會被同時評估。相關(guān)性是影響知識貢獻(xiàn)行為最廣泛的指標(biāo);意義讓問題更容易在眾多受邀問題中引發(fā)關(guān)注和貢獻(xiàn)意愿;多樣性揭露了智能推薦問題情境中的顯著弊端,重復(fù)和相似問題浪費時間,引發(fā)信息疲勞和負(fù)面情緒,只會被忽略;難度關(guān)系到能否回答好問題,在智能推薦問題情境下受到潛在答題者更多考量,但尚未引起已有研究重視;易理解性和友好性等會影響用戶對提問者真誠度的感知。當(dāng)其中某一指標(biāo)呈消極狀態(tài),潛在答題者便會否定其問題質(zhì)量,降低利他和利己動機,甚至引發(fā)負(fù)面情緒,進而產(chǎn)生知識不貢獻(xiàn)意愿或行為。因此,提問者可按指標(biāo)對所提問題預(yù)先自審,特別是與被邀請者契合度、是否已有相似問題、是否表述清晰等;潛在答題者可在個人主頁中給出答題偏好或興趣說明;平臺邀請推薦算法和問題審查機制可據(jù)此指標(biāo)做進一步優(yōu)化。
社會化媒體感知過載包括系統(tǒng)過載、社交過載和信息過載[41],在本研究情境中,用戶更多的是面臨問題數(shù)量過多導(dǎo)致的問題過載,已有研究鮮少關(guān)注此變量。本研究發(fā)現(xiàn),面對智能推薦的受邀問題,潛在答題者常會收到超出其承受范圍和處理能力的海量邀請,增加了時間壓力和負(fù)面情緒,許多問題淹沒在題海中被直接忽略。提問者應(yīng)珍惜邀請回答的機會,平臺可通過優(yōu)化提問界面的相似問題推薦算法、限制用戶被邀次數(shù)、增加“不再接受此類邀請”、屏蔽受邀問題關(guān)鍵詞等功能,以避免無人問津的“僵尸”問題。
受邀問題實質(zhì)上是提問者作為信息源發(fā)布的問題信息,對信息源的評估會影響個體相關(guān)信息行為的態(tài)度和意愿[53],用戶對提問者可靠性的評估必然也會影響其答題態(tài)度、意愿和行為,主要包括真誠度、交互強度和共同語言。一般而言,在答題之前有過關(guān)注、評論、贊同或私信等正向接觸的提問者會讓潛在答題者感到更親密,更愿意貢獻(xiàn)知識并付出更多時間和精力。但智能推薦的問題大多來自陌生用戶,潛在答題者只能通過提問者個人主頁中的個人信息和歷史交互記錄來判斷提問者的活躍度、共同語言等,并以此衡量回答該問題的可能收益,如曝光度、獲贊等。但仔細(xì)查看個人主頁這種增加沉沒成本的行為并不常見,畢竟“大家都很忙”,潛在答題者會更直觀地從問題本身,即問題內(nèi)容和語氣反映出的提問態(tài)度與提問動機來解讀提問者真誠度和共同語言,以此生成答題態(tài)度和答題動機,只知索取不懂回報的“伸手黨”深受潛在答題者厭惡。平臺不僅要重視答案監(jiān)管,還應(yīng)加強問題審查,鼓勵用戶不管是問是答都能體現(xiàn)自己的思考。
知識貢獻(xiàn)行為存在“為他”和“為我”兩種形式,利 他 主 義[51]、內(nèi) 在 利 益 滿 足[14]和 個 人 結(jié) 果 期 望[54]等動機對知識貢獻(xiàn)行為的影響已得到許多學(xué)者驗證,適用于智能推薦問題情境。本研究還發(fā)現(xiàn),不管是出于助人還是助己,被邀請和點贊、感謝等正面反饋類似,本身就增強了用戶被需要和被認(rèn)可的滿足感和積極情緒,因此潛在答題者會更愿意通過“邀請回答”來為社區(qū)作出貢獻(xiàn)。用戶的后續(xù)行為是初始行為的延續(xù)、受到初次使用經(jīng)驗的影響[55],對以往回答問題所接收反饋的滿意度會影響用戶對此刻回答受邀問題所獲收益的判斷,進而影響答題者的知識持續(xù)貢獻(xiàn)態(tài)度、意愿和行為。
情感狀態(tài)反映了潛在答題者回答受邀問題的態(tài)度,表現(xiàn)為時間壓力和情緒。潛在答題者時間資源有限,缺乏時間是阻礙知識貢獻(xiàn)行為的主要原因之一[56],時間壓力越大,越容易產(chǎn)生焦慮等消極情緒,特別是受到問題過載的沖擊,為了實現(xiàn)有效配置、避免消極情緒,只能選擇性回答或忽略受邀問題。由于被認(rèn)可的滿足感,用戶往往是帶著開心、興奮的心情打開“邀請回答”,但情緒是動態(tài)的,且網(wǎng)絡(luò)交流中存在大量的社會情緒內(nèi)容[48],在瀏覽受邀問題時,會受到認(rèn)知和動機的影響,積極情緒可能轉(zhuǎn)變?yōu)橄麡O情緒,進而轉(zhuǎn)變態(tài)度,影響知識貢獻(xiàn)意愿和行為。
性格特征可從潛在答題者對受邀問題的態(tài)度和行為方式的表現(xiàn)中析出,相比首頁推薦問題,對被邀者而言,智能推薦的受邀問題更像是一種任務(wù),熱心、具有責(zé)任心和同理心的用戶更愿意完成任務(wù),且更加認(rèn)真謹(jǐn)慎、愿意付出更多時間,因為不愿辜負(fù)提問者的信任和等待;而懶惰的用戶知識貢獻(xiàn)可能性較低。
過程連續(xù)性是知識貢獻(xiàn)“意愿-行為”作用路徑得以順利進行的保障,如果用戶對受邀問題產(chǎn)生知識貢獻(xiàn)意愿后出于各種原因被迫中斷或主動中斷,知識貢獻(xiàn)行為可能就不會成功,因為新的受邀問題會將之前的問題淹沒,用戶大概率也會“忘了”。但對于貢獻(xiàn)意愿特別強烈的問題,潛在答題者會通過關(guān)注問題、加入草稿箱等方式來提醒自己完成知識貢獻(xiàn)行為。
通過對知乎中關(guān)于“邀請回答”已有討論的扎根理論分析,本文主要回答了兩個問題:一是社會化問答社區(qū)中的好問題因人而異,智能推薦問題情境下,答題者會根據(jù)相關(guān)性、難度、趣味性、多樣性、易理解性、意義、友好性、受關(guān)注度和時效性進行綜合評估;二是智能推薦問題情境下社會化問答社區(qū)知識貢獻(xiàn)行為的影響機理更加復(fù)雜,可總結(jié)為“認(rèn)知-動機-態(tài)度-意愿-行為”,認(rèn)知(問題質(zhì)量、問題過載、提問者可靠性)、動機、態(tài)度(情感狀態(tài))和性格特征對意愿和行為具有直接影響,動機和態(tài)度具有中介作用,并發(fā)現(xiàn)過程連續(xù)性是“意愿-行為”作用路徑的保障。本文有助于提問者提出高質(zhì)量問題,但應(yīng)謹(jǐn)記“一個問題得到更多回復(fù)并不一定是最好的,最好的應(yīng)是至少獲得了一個有用的答復(fù)[37]”;同時為優(yōu)化提問者和答題者高效匹配的智能推薦算法提供理論基礎(chǔ)參考,有利于平衡潛在答題者信息過載和信息繭房的困擾、推動社區(qū)的可持續(xù)發(fā)展。但本研究僅分析了知乎中的已有問答,其人口統(tǒng)計特征的代表性難以確定,且未通過訪談法等了解用戶可能的最新觀點,存在一定局限性,未來可作進一步完善和實證。