李進(jìn)華 張婷婷
〔摘 要〕[目的/意義]社會化問答社區(qū)的投票機(jī)制有利于信息消費(fèi)者篩選高質(zhì)量回答。本文以用戶原創(chuàng)回答為研究對象,探討影響知識分享用戶感知有用性的影響因素。[方法/過程]以信息接受模型為基礎(chǔ),基于知乎社區(qū)71 495條回答,結(jié)合文本分析與負(fù)二項回歸分析方法,從回答特征、回答質(zhì)量和回答者特征3個方面探討知識分享有用性的影響因素。[結(jié)果/結(jié)論]研究結(jié)果表明,回答特征(及時性、圖片或引用)、回答質(zhì)量(答案中心度、情感支持)、回答者特征(社會網(wǎng)絡(luò)中心度、可信度)均對回答有用性投票具有正向影響?;卮鸬恼Z言多樣性對回答有用性投票具有負(fù)向影響。本研究通過實(shí)證進(jìn)行客觀分析,有利于促進(jìn)回答者貢獻(xiàn)高質(zhì)量回答并對社會化問答社區(qū)進(jìn)行高質(zhì)量的信息服務(wù)提供可行性建議。
〔關(guān)鍵詞〕知識分享;用戶感知有用性;信息接受模型;知乎社區(qū)
DOI:10.3969/j.issn.1008-0821.2018.04.003
〔中圖分類號〕C912.67;G203 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2018)04-0020-09
〔Abstract〕[Purpose/Signficance]The voting mechanism of social Q&A; community is helpful for information consumers to select high quality answers.This paper focused on the original knowledge sharing of users in social Q&A; community,and explored the factors that influence the user perceived usefulness of knowledge sharing.[Method/Process]Based on the information adoption model and 71495 answers in social Q&A; community,combining text analysis and negative binomial regression analysis,this paper discussed the influencing factors of knowledge sharing usefulness from three aspects of answer characteristics,answer quality and respondent characteristics.[Result/Conclusion]The results showed that the answer characteristics(timeliness,pictures or citations),answer quality(answer centrality,emotional support),respondent characteristics(social network centrality,credibility)had a positive impact on answer useful votes.However,the linguistic diversity of answers had a negative effect on answer useful votes.And this research promoted the sharers to contribute high quality knowledge sharing and provides feasible suggestions for high quality information service in social Q&A; community.
〔Key words〕knowledge sharing;user perceived usefulness;information acceptance model;zhihu community
社會化問答平臺是一種基于社會網(wǎng)絡(luò)關(guān)系的問答服務(wù)模式,其“關(guān)注”模塊將用戶、問題、話題、回答等要素相互關(guān)聯(lián)起來構(gòu)建了龐大且多元化的知識網(wǎng)絡(luò)[1]。社會化問答社區(qū)積極鼓勵和促進(jìn)社區(qū)用戶進(jìn)行知識的交換與流動,即回答者可以對同一問題進(jìn)行全方位、多角度討論,為提問者和瀏覽者提供不同的參考視角。而提問者和瀏覽者則可以通過點(diǎn)贊、踩、評論等方式對回答進(jìn)行評價。社會化問答社區(qū)中的信息是由用戶生成的,其信息生成速度之快、規(guī)模之大。社會化問答平臺通常會通過回答的點(diǎn)贊數(shù)、反對數(shù)等指標(biāo)對知識分享進(jìn)行排序?yàn)橛脩艉Y選出高質(zhì)量回答,這在一定程度上減輕了因信息過載和認(rèn)知成本等原因給用戶帶來的信息壓力[2]。但在網(wǎng)絡(luò)環(huán)境下,由于“馬太效應(yīng)”的存在,社區(qū)意見領(lǐng)袖對問題簡單的點(diǎn)評可能會引來用戶高點(diǎn)贊數(shù),而普通用戶的回答則無法獲得足夠的投票,很多高質(zhì)量的回答會因此被湮沒。對于社會化問答社區(qū)而言,為了自身的良性發(fā)展需要有效地管理社區(qū)中海量的提問和回答并為社區(qū)用戶提供高質(zhì)量的信息服務(wù)以促進(jìn)知識的傳播。而知識分享者則需要了解影響信息消費(fèi)者對其知識分享感知有用性的影響因素以便更好地完善回答,提高自己在社區(qū)中的聲望和影響力,從而滿足自己被他人尊重、自我實(shí)現(xiàn)的需求[3]?;诖?,對社會化問答知識分享用戶感知有用性的影響因素的研究具備深入探討的現(xiàn)實(shí)意義。知乎是國內(nèi)社會化問答社區(qū)的典型代表。本文以知乎為研究對象,通過Python編寫爬蟲爬取知乎社區(qū)提問回答界面的知識分享數(shù)據(jù),并以信息接受模型為理論基礎(chǔ),利用文本分析和負(fù)二項回歸模型對該研究問題進(jìn)行實(shí)證分析。通過對實(shí)驗(yàn)結(jié)果的討論,可促進(jìn)回答者貢獻(xiàn)高質(zhì)量回答并對社會化問答社區(qū)進(jìn)行高質(zhì)量的信息服務(wù)提供可行性建議。
1 相關(guān)研究評述
1.1 知識分享用戶感知有用性
孫曉寧等[4]借助“百度知道”用戶對答案質(zhì)量感知的問卷,綜合采用專家訪談、探索性因子分析和驗(yàn)證性因子分析的方法,構(gòu)建了社會化問答系統(tǒng)答案質(zhì)量評價模型。Zhu等[5]結(jié)合專家咨詢、用戶調(diào)查和比較分析3種方法總結(jié)出質(zhì)量評估模型。John等[6]以雅虎回答為研究對象,運(yùn)用Logistic回歸分析方法構(gòu)建了包含社會特征、文本特征以及內(nèi)容評價特征為指標(biāo)的質(zhì)量框架,用以預(yù)測高質(zhì)量的回答。綜上所述,已有的研究大多集中在構(gòu)建知識分享質(zhì)量評價模型上。通過收集到的一手資料進(jìn)行探索性分析,試圖從新切入點(diǎn)提出新的評價指標(biāo)對已有評價體系進(jìn)行補(bǔ)充。也有研究通過搜集網(wǎng)站用戶行為數(shù)據(jù),構(gòu)建評價信息質(zhì)量的特征集,利用機(jī)器學(xué)習(xí)算法,訓(xùn)練自動評價信息質(zhì)量的模型[7-9]。姜雯、許鑫[10]從國內(nèi)外的相關(guān)研究出發(fā),分別從人工評價和機(jī)器學(xué)習(xí)自動化的角度對在線問答社區(qū)信息質(zhì)量評價的影響因素進(jìn)行了研究綜述?;诖?,本文在前述研究基礎(chǔ)之上,針對知乎社會化的特點(diǎn),提煉知識分享用戶感知有用性的影響因素作為理論模型的假設(shè)條件,力圖豐富社會化問答社區(qū)知識分享相關(guān)方面的理論研究。
1.2 信息接受模型
信息接受模型(Information Adoption Model)是Sussman和Siegal[11]在技術(shù)接受模型(TAM)的基礎(chǔ)之上根據(jù)精細(xì)加工可能性理論(ELM)[12]提出的。精細(xì)加工可能性理論將信息的說服過程分為兩部分:中心路徑和邊緣路徑。中心路徑把個體態(tài)度的改變看做是個體認(rèn)真思考和綜合信息的結(jié)果,邊緣路徑是指個體對客體態(tài)度的改變是根據(jù)信息的某些關(guān)聯(lián)線索決定的。如圖1所示,信息接受模型表明影響用戶感知信息有用性的因素為信息內(nèi)容質(zhì)量和信息源可靠性,其中信息內(nèi)容質(zhì)量是中心路徑,信息源可靠性是邊緣路徑。
對于社會化問答社區(qū)而言,信息質(zhì)量表現(xiàn)為用戶的知識分享質(zhì)量。信息質(zhì)量的判斷受主觀和環(huán)境的影響,但信息內(nèi)容作為一種客觀的存在,對其效用的評價也是客觀的。因此,信息質(zhì)量是可測量的[13]。Kim等[14-15]從內(nèi)容、認(rèn)知、社會情感、參考資源和效用等角度衡量信息質(zhì)量。本研究從語法和語義兩個層面對回答數(shù)據(jù)進(jìn)行文本分析以衡量回答的質(zhì)量。信息源可靠性是指知識分享者被用戶認(rèn)為是可相信的、有能力的、值得信賴的程度[16]。社會化問答社區(qū)中的信息具有不對稱性,用戶不會完全、真實(shí)地揭示自身信息。因此,用戶無法對其現(xiàn)實(shí)身份進(jìn)行識別進(jìn)而評價其可靠性。知乎為每位用戶設(shè)置了個人主頁,我們可以通過用戶回答的數(shù)量、質(zhì)量、獲得的點(diǎn)贊數(shù)來判定其知識水平和影響力。感知有用性在不同場景下,其含義有所不同。本文將知識分享有用性定義為社會化問答社區(qū)用戶感知知識分享對其知識搜索的有用程度。知乎社區(qū)針對知識分享進(jìn)行了有用性設(shè)置,比如投票機(jī)制,可以通過贊同數(shù)量對知識分享的有用性進(jìn)行測量。在社會化問答社區(qū)中,信息采納是主體有目的地選擇、評價、接受和利用信息的過程,并且該過程最終會影響主體的后續(xù)行為[17]。相比于傳統(tǒng)問答平臺(如百度知道)設(shè)置答案采納的功能,社會化問答社區(qū)中的信息采納是一種隱式行為。
2 研究模型和假設(shè)
結(jié)合本研究的情景,本文以信息接受模型為基礎(chǔ),研究社會化問答知識分享用戶感知有用性的影響因素。本研究的模型如圖2所示。
2.1 回答特征
2.1.1 外部引用數(shù)量
外部引用是指回答者在回答問題時,在文本中添加的外部鏈接、圖片或圖表。一方面,回答者在闡述自身觀點(diǎn)
時,引用外部參考文獻(xiàn)來證明其正確性和可信度,這有助于提高瀏覽者對其分享的認(rèn)同度。另一方面,圖片或圖表將復(fù)雜的語言論述簡化,使用文本和外部引用相結(jié)合的方式便于瀏覽者理解。Tian等[18]、Shah等[19]均將是否有外部鏈接、圖片或引用等指標(biāo)納入機(jī)器學(xué)習(xí)自動化評價問答社區(qū)答案質(zhì)量的研究體系,因此本文提出如下假設(shè):
H1:回答引用數(shù)量與知識分享用戶感知有用性之間正向相關(guān)。
2.1.2 回答及時性
回答及時性是指回答發(fā)布與提問之間的間隔時間,間隔越小表示其知識分享越及時。蔣楠等[20]認(rèn)為在社會化問答服務(wù)平臺中,及時性是提問者做出滿意答案判定的指標(biāo)之一。在社會化問答平臺中,知識分享具有時效性。隨著時間的推移,問題和話題的熱度會逐漸消退[21]。因此,回答發(fā)布的時間越早,相比于同問題下發(fā)布時間較晚的回答具有更大的曝光度,更有可能獲得更多的點(diǎn)贊數(shù)。因此本文提出如下假設(shè):
H2:回答及時性與知識分享用戶感知有用性之間負(fù)向相關(guān)。
2.2 回答質(zhì)量
2.2.1 回答中心度
回答中心度是指一個問題下,某回答處于所有回答中心的程度,中心度越高,則該回答為問題答案的可能性越大[22]。金家華[23]認(rèn)為回答文本的中心度是評價信息質(zhì)量的重要指標(biāo),且文本中心度正向影響用戶的信息采納行為。知乎的一個問題下會有多個回答者提供不同的回答。用戶在瀏覽眾多回答時,如果某回答較其他回答的中心度越高,用戶認(rèn)為該回答有用性越高。因此文本提出如下假設(shè):
H3:回答中心度與知識分享用戶感知有用性之間正向相關(guān)。
2.2.2 情感支持
Hwang等[24]認(rèn)為患者在醫(yī)療社區(qū)中只能通過文字信息進(jìn)行互動,因此在線醫(yī)療社區(qū)為患者提供了兩種社會支持即信息支持和情感支持。在此基礎(chǔ)上,金家華[23]的研究發(fā)現(xiàn)情感支持對用戶信息采納有正向影響。Joyce等[25]的研究發(fā)現(xiàn),帶有正面情感的信息有助于增強(qiáng)用戶的認(rèn)同。知乎的關(guān)注功能將關(guān)心同樣或類似問題的人聚集在一起進(jìn)行交流,相互幫助,這在一定程度上體現(xiàn)了情感支持。因此本文提出如下假設(shè):
H4:情感支持與知識分享用戶感知有用性之間正向相關(guān)。
2.2.3 語言多樣性
以往的研究認(rèn)為,語言貧瘠會負(fù)向影響聽者對說話者的語言、知識、溝通能力甚至其情緒狀態(tài)和社會地位的判斷。在虛擬社區(qū)中,具有良好的書面格式和語言的多樣性的回答能提高回答者的可信度[26]。在社會化問答社區(qū)中,回答者的語言風(fēng)格在很大程度上影響其發(fā)布信息的認(rèn)同度。語言多樣的回答往往比乏味重復(fù)的回答更具有說服力。乏味無力的語言往往會負(fù)面影響瀏覽者對回答的感知[27]。因此本文提出如下假設(shè):
H5:語言多樣性與知識分享用戶感知有用性之間正向相關(guān)。
2.3 回答者特征
2.3.1 回答者中心度
社會化問答社區(qū)不同于傳統(tǒng)問答社區(qū)之處在于其構(gòu)建了用戶之間的社會網(wǎng)絡(luò)關(guān)系。社會網(wǎng)絡(luò)中心度是衡量個體在社會網(wǎng)絡(luò)中影響力的重要指標(biāo),并在一定程度上反映了個人的社會資本[28]。相關(guān)研究表明,個體節(jié)點(diǎn)的網(wǎng)絡(luò)中心度與其信任感之間具有相當(dāng)強(qiáng)的正向相關(guān)性,這也是高中心度節(jié)點(diǎn)社會資本的一種體現(xiàn)[29]。社會網(wǎng)絡(luò)中心度分為點(diǎn)入度和點(diǎn)出度。殷國鵬[30]的研究發(fā)現(xiàn)評論者內(nèi)向、外向中心度會直接影響其發(fā)表評論所獲的有用性評價。同樣地,知乎社區(qū)也提供了關(guān)注功能,將人與人組織起來形成龐大的人際網(wǎng)絡(luò)。因此本文提出如下假設(shè):
H6.1:回答者的內(nèi)向網(wǎng)絡(luò)中心度與知識分享用戶感知有用性之間正向相關(guān);
H6.2:回答者的外向網(wǎng)絡(luò)中心度與知識分享用戶感知有用性之間正向相關(guān)。
2.3.2 回答者可信度
回答者的可信度是其在社會網(wǎng)絡(luò)中建立信任和增加影響力的重要因素[27]?;卮鹫叩目尚哦纫环矫婵梢酝ㄟ^用戶的身份背景來確認(rèn);另一方面也可以通過用戶的知識分享專業(yè)性來判斷。知乎社區(qū)提供的投票機(jī)制和聲望體系在一定程度上為識別回答者的可信度提供了參考。Grewal等[31]的研究表明當(dāng)信息源可信性比較低時信息接受程度較低。Lim等[32]認(rèn)為信息源可信性同樣可以被應(yīng)用到在線環(huán)境中。在社會化問答社區(qū)中,回答者的可信度越高,瀏覽者認(rèn)為其回答有用的可能性越大。因此本文提出如下假設(shè):
H7:回者的可信度與知識分享用戶感知有用性之間正相關(guān)。
3 研究設(shè)計
3.1 數(shù)據(jù)收集
本研究使用Python編寫爬蟲,以知乎首頁熱門收藏夾為爬取入口,共爬取了知乎平臺上2 103個問題下共97 750條回答數(shù)據(jù)及其相關(guān)信息。每條記錄包括回答內(nèi)容、回答發(fā)布時間、回答者昵稱、回答者所獲贊同數(shù)、回答者回答問題數(shù)、回答者被關(guān)注數(shù)、回答者關(guān)注他人數(shù)、回答所對應(yīng)的題目、問題發(fā)布時間等指標(biāo)。并編寫Python程序?qū)?shù)據(jù)進(jìn)行清洗,將回答者回答問題數(shù)為0、回答者所獲總點(diǎn)贊數(shù)小于回答者回答問題所獲點(diǎn)贊數(shù)等錯誤、不一致數(shù)據(jù)刪除。由于本研究涉及對答案內(nèi)部特征的文本分析,因此將回答長度(中英文及數(shù)字)小于10的樣本數(shù)據(jù)刪除,實(shí)際用于實(shí)證分析的數(shù)據(jù)共71 495條。
3.2 變量測量
為了驗(yàn)證本研究所提假設(shè),設(shè)計了如表1所示的變量。其中因變量為用戶感知回答有用性點(diǎn)贊數(shù)。自變量包括回答特征、回答質(zhì)量以及回答者特征共3個部分。
3.2.1 回答特征
回答特征包括回答引用數(shù)(ansCita)和回答及時性(ansTime)兩個變量。其中回答引用數(shù)使用回答中包含的外部鏈接數(shù)量和圖片數(shù)量之和衡量。回答及時性使用回答發(fā)布與提問之間的間隔天數(shù)衡量。
3.2.2 回答質(zhì)量
3.2.3 回答者特征
回答者特征包括內(nèi)向網(wǎng)絡(luò)中心度(inNetCen)、外向網(wǎng)絡(luò)中心度(outNetCen)和可信度(reliability)。其中內(nèi)向網(wǎng)絡(luò)中心度使用回答者被他人關(guān)注的數(shù)量衡量。外向網(wǎng)絡(luò)中心度使用回答者關(guān)注他人的數(shù)量衡量。本研究使用回答者所獲點(diǎn)贊數(shù)量與回答數(shù)量之比來衡量回答者的可信度,見公式(9)。
3.3 分析方法
為了研究回答特征、回答質(zhì)量和回答者特征對回答用戶感知有用性的影響,本文構(gòu)建如下模型:
本研究的因變量為用戶的回答在某段時間內(nèi)所獲得的點(diǎn)贊數(shù),是一個非負(fù)的整數(shù),因此不滿足線性回歸因變量為連續(xù)分布的假設(shè)。由于該變量具有獨(dú)立且非負(fù)的性質(zhì),適用于計數(shù)回歸模型的假設(shè)條件。泊松回歸和負(fù)二項回歸被廣泛應(yīng)用于此類問題中。其中泊松回歸的前提假設(shè)是樣本的均值和方差相等,而負(fù)二項回歸則用于方差與均值不等的情況,由于本研究因變量的方差遠(yuǎn)遠(yuǎn)大于均值,數(shù)據(jù)過度離散,此種情況下采用泊松回歸模型擬合效果不理想,因而采用負(fù)二項回歸模型[33]。負(fù)二項回歸的概率密度函數(shù)為:
4 數(shù)據(jù)分析與結(jié)果
4.1 描述性統(tǒng)計分析
數(shù)據(jù)樣本的描述性統(tǒng)計詳如表2所示,回答有用性數(shù)據(jù)分布分散,對其進(jìn)行頻數(shù)統(tǒng)計發(fā)現(xiàn)其呈現(xiàn)右偏分布(偏度為17.15)。自變量的分布也較為分散。其中回答內(nèi)容中引用數(shù)量均值為2個左右,說明絕大部分回答者習(xí)慣于純文字表達(dá)自己的觀點(diǎn),很少使用超鏈接或圖片;回答者的內(nèi)向網(wǎng)絡(luò)中心度均值約為12 648,外向網(wǎng)絡(luò)中心度的均值約為182,回答者的內(nèi)向中心度要遠(yuǎn)遠(yuǎn)高于外向中心度。說明在知乎社區(qū)中,擁有大量“粉絲”數(shù)的用戶是知識分享的活躍用戶。
各自變量間的相關(guān)系數(shù)如表3所示,變量lingDiv和ansCen相關(guān)系數(shù)絕對值達(dá)到了0.53,其余自變量間的相關(guān)系數(shù)絕對值約小于等于0.3。為了進(jìn)一步驗(yàn)證自變量間是否存在共線性的問題,本研究繼續(xù)對相關(guān)系數(shù)矩陣進(jìn)行秩計算,計算結(jié)果秩為8,說明該相關(guān)系數(shù)矩陣為滿秩矩陣,自變量之間不存在嚴(yán)重的共線性問題[34]。
4.2 回歸分析結(jié)果與討論
為了更好地體現(xiàn)回答特征、回答質(zhì)量以及回答者特征變量對回答感知有用性的影響,本研究共構(gòu)建了3個模型。其中模型1只包含回答特征變量的負(fù)二項回歸模型,模型2包含回答特征和回答質(zhì)量變量的負(fù)二項回歸模型,模型3是全模型。模型回歸結(jié)果如表4所示,發(fā)現(xiàn)模型3的對數(shù)似然值的絕對值比模型1和模型2都要小,表明加入回答
質(zhì)量和回答者特征變量提高了模型的擬合優(yōu)度。模型3相對于模型2的對數(shù)似然值的絕對值減小更明顯,說明在社會化問答社區(qū)中,用戶對回答感知有用性的影響因素主要來源于信息接受模型的邊緣路徑——回答者特征。此外,本研究將模型3的所有變量分別進(jìn)行了負(fù)二項回歸分析和泊松回歸分析,并對分析結(jié)果進(jìn)行了AIC、BIC模型擬合優(yōu)度檢驗(yàn)如表5所示。檢驗(yàn)結(jié)果表明本研究采用的負(fù)二項回歸模型比泊松回歸模型擬合效果更好。
4.2.1 回答特征
回答引用數(shù)量(ansCita)的系數(shù)為正且P值顯著(P<0.001),表明回答引用數(shù)量對用戶感知回答有用性有正向影響,H1假設(shè)得到支持。在回答中添加引用使得內(nèi)容更具有說服力,外部鏈接給瀏覽者提供了了解知識的其他途徑;文字與圖、表相結(jié)合的表達(dá)方式更加吸引瀏覽者進(jìn)行深入閱讀。這從側(cè)面也反映回答者在回答問題過程中端正、嚴(yán)謹(jǐn)?shù)膽B(tài)度。因此回答的引用數(shù)量越多,回答被他人感知有用的可能性越大?;卮鸺皶r性(ansTime)的系數(shù)為負(fù)且P值顯著(P<0.001),表明回答及時性對用戶感知回答有用性有負(fù)向影響,H2假設(shè)得到支持。問題與回答均具有時效性。問題在提出一段時間內(nèi)會有較大的瀏覽量和關(guān)注度,吸引更多的用戶加入討論,此時回答更容易被其他用戶所關(guān)注,進(jìn)而加大回答被認(rèn)同的可能性。因此回答發(fā)布的時間越早,相比于同問題下發(fā)布時間較晚的回答具有更大的曝光度,更有可能獲得更多的點(diǎn)贊數(shù)。
4.2.2 回答質(zhì)量
回答中心度(ansCen)系數(shù)為正且P值顯著(P<0.001),表明回答中心度對用戶感知回答有用性有正向影響,H3假設(shè)得到支持。某一問題下,回答者各抒己見,發(fā)表自己的看法。如果某回答的中心度越大,說明該回答處于所有回答的中心位置,那么該回答被其他用戶認(rèn)可的可能性越大。情感支持(emSup)系數(shù)為正且P值顯著(P<0.001),H4假設(shè)得到支持。回答者在回答問題時不僅針對問題給出自己專業(yè)客觀的解答,還會帶有個人主觀的情感色彩。贊美、肯定、鼓勵等正面情感的表露不僅會增加瀏覽者對該回答的認(rèn)同;還營造了良好的社區(qū)知識分享氛圍,鼓勵更多人在社區(qū)中進(jìn)行提問和回答。因此,情感支持對用戶感知回答的有用性具有正向影響。
語言多樣性(lingDiv)系數(shù)為負(fù)且P值顯著(P<0.001),表明語言多樣性對用戶感知回答有用性有負(fù)向影響,與假設(shè)H5相悖,假設(shè)H5沒有得到支持。語言多樣性是回答者回答問題時的語言表現(xiàn)力。用戶在問答社區(qū)中進(jìn)行信息搜尋時,有可能更關(guān)注于回答是否滿足了自身的信息需求。如果回答對用戶解決自身問題沒有幫助,即使回答本身論述精彩,用戶也不會認(rèn)同其有用性。此外,施國良等[35]研究發(fā)現(xiàn)知乎回答長度與回答有用性之間正相關(guān),本研究也利用樣本數(shù)據(jù)進(jìn)一步探究了文本長度與回答有用性之間的關(guān)系。如表6所示,回答長度正向影響回答有用性。本研究還初步探究了語言多樣性與回答長度之間的關(guān)系。如圖3所示,當(dāng)回答長度較短(小于500字)時,語言多樣性從0.4~1.0的連續(xù)分布,這可能由于回答長度較短,語言多樣性隨機(jī)性較大造成的。當(dāng)回答長度逐漸增長(500~6 500字)時,語言多樣性呈現(xiàn)從0.4到某一具體值(小于1.0)的連續(xù)分布,且該具體值與回答長度成反比關(guān)系。當(dāng)回答長度較長(大于6 500字)時,回答語言多樣性趨于穩(wěn)定,分布在0.4數(shù)值附近。因此,隨著回答長度的增長,回答的平均語言多樣性降低且最終趨于平穩(wěn)?;卮痖L度越長意味著回答所包含的信息量越多,回答越容易得到用戶的認(rèn)同。同時回答越長,回答的語言多樣性會降低。因此,回答的語言多樣性可能負(fù)向影響回答有用性。
4.2.3 回答者特征
回答者內(nèi)向網(wǎng)絡(luò)中心度(inNetCen)的系數(shù)為正且P值顯著(P<0.001),表明回答者內(nèi)向網(wǎng)絡(luò)中心度對用戶感知回答有用性有正向影響,H6.1假設(shè)得到支持?;卮鹫咄庀蚓W(wǎng)絡(luò)中心度(outNetCen)的系數(shù)為正且P值顯著(P<0.001),表明回答者外向網(wǎng)絡(luò)中心度對用戶感知回答有用性有正向影響,H6.2假設(shè)得到支持。其中內(nèi)向網(wǎng)絡(luò)中心度反映個體被其他節(jié)點(diǎn)個體傳播的能力,而外向網(wǎng)絡(luò)中心度反映個體傳播其他節(jié)點(diǎn)個體的能力[36]。網(wǎng)絡(luò)中心度是衡量個體在社會網(wǎng)絡(luò)中影響力的關(guān)鍵指標(biāo),本研究很好地將社會網(wǎng)絡(luò)理論使用在社會化問答社區(qū)的研究中。知乎社區(qū)提供關(guān)注功能將具有共同興趣愛好、共同價值觀的用戶緊密地聯(lián)系在一起,促使用戶之間建立起信任關(guān)系。用戶對其所關(guān)注回答者的回答相較于其未關(guān)注回答者的回答具有更強(qiáng)烈的認(rèn)同感。因此,回答者的中心度越大,回答者的影響力就越大,用戶感知其回答有用性越大?;卮鹫呖尚哦龋╮eliability)的系數(shù)為正且P值顯著(P<0.001),表明回答者可信度對用戶感知回答有用性有正向影響,H7假設(shè)得到支持??尚哦仁菍卮鹫邭v史回答質(zhì)量的衡量。在虛擬社區(qū)中,用戶往往無法得知回答者的真實(shí)身份信息,即使知乎提供了用戶自我介紹信息,其真實(shí)性也無從考量。用戶只能通過回答者歷史回答數(shù)量、其所獲點(diǎn)贊數(shù)等信息對其專業(yè)性、可信度進(jìn)行感知。當(dāng)用戶感知該回答者是可信的,往往會增加對回答者的認(rèn)同感。因此回答者可信度越高,用戶感知其回答有用性可能越大。
對本研究假設(shè)及驗(yàn)證結(jié)果總結(jié)如表7所示。
5 結(jié) 論
本研究以信息接受模型為理論基礎(chǔ),從回答特征、回答質(zhì)量和回答者特征3個方面對社會化問答社區(qū)知識分享用戶感知有用性進(jìn)行研究,并以知乎71 495條回答作為研究對象,利用負(fù)二項回歸模型進(jìn)行分析。分析結(jié)果表明,回答者的特征對用戶感知回答有用性的影響要大于回答質(zhì)量和回答特征?;卮鹫咴谏鐓^(qū)中的社會網(wǎng)絡(luò)關(guān)系,回答者的專業(yè)性、可信度積極影響用戶對其回答有用性的感知?;卮鸬募皶r性和回答的表現(xiàn)方式(圖文結(jié)合)等特征也積極地影響用戶對其回答有用性的感知。同時,回答多以積極向上、正面情感的語言表達(dá)更容易獲得用戶對回答的認(rèn)可。一個問題下,回答處于所有回答的中心位置,回答越容易獲得用戶的點(diǎn)贊?;卮鸬恼Z言多樣性對回答有用性有負(fù)向影響,回答長度對其有正向影響。隨著回答長度的增加,其語言多樣性分布范圍縮小趨于定值。
本研究結(jié)論豐富了社會化問答社區(qū)知識分享相關(guān)方面的理論研究,為在線社區(qū)管理者與用戶具有借鑒作用,具體如下:
1)在回答界面應(yīng)完善回答者的曝光度。目前來看,知乎的回答界面只顯示了回答者的昵稱,個人簡介以及回答數(shù)、文章數(shù)、關(guān)注者數(shù)。一般情況下,用戶在瀏覽問題界面時不太會點(diǎn)開回答者頭像跳轉(zhuǎn)到其個人主頁界面。為解決這個問題,本文建議將用戶個人成就數(shù)據(jù)顯示出來,以增加瀏覽者對回答者的了解程度。
2)完善回答排序和回答折疊算法,將回答外部特征、回答內(nèi)部特征和回答者特征等指標(biāo)納入到算法中,對其進(jìn)行優(yōu)化。從而能夠提供更科學(xué)地回答排序,為提問者提供更精準(zhǔn)的信息搜尋。
3)用戶在為提問者解決問題時,不僅要保證回答的正確性,還要使用通俗易懂,簡單明了的方式表達(dá)自己的觀點(diǎn)。同時要給予提問者關(guān)懷和鼓勵,為提問者提供信息支持的同時給予情感支持。
本研究未來將側(cè)重解決如下問題:由于本研究數(shù)據(jù)采集入口為知乎首頁熱門收藏夾下的問題及其回答,因此收集到的回答基本都有點(diǎn)贊數(shù)。在知乎社區(qū)中存在著大量0點(diǎn)贊數(shù)的回答,這些回答并不是沒有價值的。因此下一步可以將0點(diǎn)贊數(shù)的回答加入到數(shù)據(jù)分析樣本集,進(jìn)行更加系統(tǒng)和完整的研究。
參考文獻(xiàn)
[1]張煜軒.基于外部線索的社會化問答平臺答案信息質(zhì)量感知研究[D].武漢:華中師范大學(xué),2016.
[2]Cao Qing,Duan Wenjing,Gan Qiwei.Exploring Determinants of Voting for the“Helpfulness”of Online User Reviews:A Text Mining Approach[J].Decision Support Systems,2011,50(2):511-521.
[3]寧菁菁.知乎網(wǎng)用戶知識共享研究[D].北京:北京郵電大學(xué),2014.
[4]孫曉寧,趙宇翔,朱慶華.基于SQA系統(tǒng)的社會化搜索答案質(zhì)量評價指標(biāo)構(gòu)建[J].中國圖書館學(xué)報,2015,41(4):65-82.
[5]Zhu Zhemin,Bernhard D,Gurevych I.A Multi-Dimensional Model for Assessing the Quality of Answers in Social Q&A; Sites[EB/OL].http://tuprints.ulb.tu-darmstadt.de/1940/1/TR_dimension_model.pdf,2017-07-20.
[6]John B M,Chua A Y K,Goh D H L.What Makes a High-Quality User-Generated Answer?[J].IEEE Internet Computing,2011,15(1):66-71.
[7]Arai K,Handayani A N.Predicting Quality of Answer in Collaborative Q&A; Community[J].International Journal of Advanced Research in Artificial Intelligence,2013,2(3):21-25.
[8]孔維澤,劉奕群,張敏,等.問答社區(qū)中回答質(zhì)量的評價方法研究[J].中文信息學(xué)報,2011,25(1):3-8.
[9]來社安,蔡中民.基于相似度的問答社區(qū)問答質(zhì)量評價方法[J].計算機(jī)應(yīng)用與軟件,2013,30(2):266-269.
[10]姜雯,許鑫.在線問答社區(qū)信息質(zhì)量評價研究綜述[J].現(xiàn)代圖書情報技術(shù),2014,(6):41-50.
[11]Sussman S W,Siegal W S.Informational Influence in Organizations:An Integrated Approach to Knowledge Adoption[J],Information Systems Research,2003,14(1):47-65.
[12]Petty R E,Cacioppo J T.The Elaboration Likelihood Model of Persuasion[J].Advances in Experimental Social Psychology,1986,19:123-205.
[13]李晶,漆賢軍,陳明紅.信息質(zhì)量感知對信息獲取與信息采納的影響研究[J].情報科學(xué),2015,33(3):123-129.
[14]Kim S,Oh J S,Oh S.Best-Answer Selection Criteria in a Social Q&A; Site from the User-Oriented Relevance Perspective[C].In:Proceedings of the 70th Annual Meeting of American Society for Information Science and Technology(ASIST),2007,44(1):1-15.
[15]Kim S,Oh S.Users Relevance Criteria for Evaluating Answers in a Social Q&A; Site[J].Journal of the American Society for Information Science & Technology,2009,60(4):716-727.
[16]Petty R E,Cacioppo J T.Communication and Persuasion:Central and Peripheral Routes to Attitude Change[M].Springer,1986.
[17]宋雪雁,王萍.信息采納行為概念及影響因素研究[J].情報科學(xué),2010,28(5):760-762,767.
[18]Tian Q,Zhang P,Li B.Towards Predicting the Best Answers in Community-Based Question-Answering Services[C].In:Proceedings of the 7th International AAAI Conference on Weblogs and Social Media,2013.
[19]Shah C,Pomerantz J.Evaluating and Predicting Answer Quality in Community Q&A;[C].In:Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM,2010:411-418.
[20]蔣楠,王鵬程.社會化問答服務(wù)中用戶需求與信息內(nèi)容的相關(guān)性評價研究——以“百度知道”為例[J].信息資源管理學(xué)報,2012,2(3):35-45.
[21]李綱,陳璟浩.突發(fā)事件情境下網(wǎng)絡(luò)問答社區(qū)用戶構(gòu)成和行為分析——基于問題膠囊事件的實(shí)證研究[J].圖書情報工作,2013,57(24):95-100.
[22]Radev D R,Jing H,Stys' M,et al.Centroid-Based Summarization of Multiple Documents[J].Information Processing & Management,2004,40(6):919-938.
[23]金家華.社會化問答社區(qū)中用戶知識行為的影響因素研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2015.
[24]Hwang K O,Ottenbacher A J,Green A P,et al.Social Support in an Internet Weight Loss Community[J].International Journal of Medical Informatics,2010,79(1):5-13.
[25]Joyce E,Kraut R.Predicting Continued Participation in Newsgroups[J].Journal of Computer-Mediated Communication,2006,11(3),723-747.
[26]Huffaker D.Dimensions of Leadership and Social Influence in Online Communities[J].Human Communication Research,2010,36:593-617.
[27]王秀麗.網(wǎng)絡(luò)社區(qū)意見領(lǐng)袖影響機(jī)制研究——以社會化問答社區(qū)“知乎”為例[J].國際新聞界,2014,36(9):47-57.
[28]張榮華.知識問答社區(qū)用戶的知識共享意愿研究[D].南京:南京大學(xué),2014.
[29]Wang G,Liu X,F(xiàn)an W G.A Knowledge Adoption Model Based Framework for Finding Helpful User-Generated Contents in Online Communities[C].In:Proceedings of the 32th International Conference on Information Systems,2011,Shanghai,China.
[30]殷國鵬.消費(fèi)者認(rèn)為怎樣的在線評論更有用?——社會性因素的影響效應(yīng)[J].管理世界,2012,(12):115-124.
[31]Grewal D,Gotlieb J,Marmorstein H.The Moderating Effects of Message Framing and Source Credibility on the Price-Perceived Risk Relationship[J].Journal of Consumer Research,1994,21(1):145-153.
[32]Lim K H,Sia C L,Lee M K.O,et al.How do I Trust You Online,and If so,Will I Buy?An Empirical Study of Two Trust-Building Strategies[J].Journal of Management Information Systems,2006,23(2):233-266.
[33]陳莉.負(fù)二項回歸模型在過度離散車險數(shù)據(jù)中的應(yīng)用[D].貴陽:貴州民族大學(xué),2016.
[34]如何用R進(jìn)行多重共線性檢驗(yàn)與處理?[EB/OL].http://bbs.pinggu.org/thread-1383561-1-1.html,2017-11-02.
[35]施國良,陳旭,杜璐鋒.社會化問答網(wǎng)站答案認(rèn)可度的影響因素研究——以知乎為例[J].現(xiàn)代情報,2016,36 (6):41-45.
[36]劉佩,林如鵬.網(wǎng)絡(luò)問答社區(qū)“知乎”的知識分享與傳播行為研究[J].圖書情報知識,2015,(6):109-119.
(責(zé)任編輯:郭沫含)