張薇薇 朱杰
關鍵詞:在線知識社區(qū);知識貢獻行為;網(wǎng)絡百科;詞條質量;專業(yè)身份;知識質量
以維基百科為代表的在線知識社區(qū)的產(chǎn)生和發(fā)展,解決了傳統(tǒng)百科全書更新速度慢、出版周期長、內(nèi)容審核效率低等問題。我國也相繼出現(xiàn)了百度百科、互動百科等大型中文百科知識社區(qū)。截至2018年10月,百度百科收錄詞條超過1500萬,參與編輯用戶數(shù)超過650萬,幾乎涵蓋了所有已知的知識領域。據(jù)調(diào)查,在線百科受到我國多數(shù)網(wǎng)絡用戶的推崇和使用.知識參與度和使用程度都很高。但是在線百科相比傳統(tǒng)百科,依然存在詞條編輯者專業(yè)水平參差不齊、內(nèi)容質量與可信度較低的問題。例如,通過參考文獻分析發(fā)現(xiàn),維基百科歷史類詞條質量與專業(yè)期刊文獻質量存在較大差距。如今,在線知識社區(qū)越來越重視內(nèi)容貢獻者的專業(yè)身份,大量有專業(yè)知識及其愛好者的用戶逐漸成為知識社區(qū)的核心成員。一些百科知識平臺也制定了一系列與貢獻者專業(yè)身份有關的詞條創(chuàng)建、編輯與審核制度,鼓勵更多具有專業(yè)知識的社區(qū)用戶參與內(nèi)容貢獻。
在線知識社區(qū)的內(nèi)容質量一直是信息學界關注的重要問題。對于網(wǎng)絡百科這類大規(guī)模知識社區(qū)而言,訪問量、詞條編輯次數(shù)、貢獻者數(shù)量、生存期等,都可能成為影響詞條質量的前導因素。st.vilia B等針對維基百科提出一個包含內(nèi)生、關系、聲譽三大類型以及若干細分計量指標的信息質量評估框架.張博等采用層次分析法建立了協(xié)同知識生產(chǎn)社區(qū)的內(nèi)容質量評估模型。知識社區(qū)質量在貢獻者社會網(wǎng)絡“平衡一非平衡一動態(tài)平衡”的演化過程中會呈現(xiàn)螺旋上升趨勢_6]。此外,借助用戶群體認可.以使貢獻者獲得相應的社區(qū)榮譽和知識地位,可以有效提升知識內(nèi)容質量和社區(qū)價值。也有一些研究尋求對知識內(nèi)容質量的自動化評估,這方面文獻尤以維基百科詞條質量的研究居多。例如,Lira EPV等利用在線社區(qū)的協(xié)作屬性.設計相應模型計算詞條質量和貢獻者信譽值,Adler B T等基于詞語粒度構建模型以計算Wikipedia每個語詞的質量與可信度,Zeng H等基于句子分析粒度構建模型計算維基百科詞條每個片段的內(nèi)容質量。,Suzuki Y基于h指數(shù)評估維基百科詞條質量。此外,國內(nèi)學者基于分句粒度和詞條編輯歷史的文本修改記錄提出評估知識貢獻質量的方法,肖奎等應用迭代與向量標準化方法計算某個特定領域內(nèi)各詞條質量值以及貢獻者信譽值。這些研究都十分關注貢獻者專業(yè)背景和信譽值對內(nèi)容質量的評估作用。
目前關于在線百科知識貢獻者身份對內(nèi)容質量作用機理與影響關系的研究并不多見。隨著在線知識社區(qū)的發(fā)展,內(nèi)容更新速度加快,傳統(tǒng)的專職人員質量審核機制已無法滿足用戶需求。本文認為,自動化評估與人工審核各有利弊,前者效率高、成本低但準確性也低,后者準確性高但效率低、成本高。因此,有必要將兩種質量控制途徑結合起來。相比對知識內(nèi)容進行審核的難度,對貢獻者專業(yè)身份的審查與級別認定實現(xiàn)起來要容易得多。因此,關于貢獻者身份對內(nèi)容質量影響效果的研究可以更好地為在線知識社區(qū)管理與內(nèi)容質量改進提供有力的理論指導與實踐參考。
1理論基礎與研究模型
1.1在線社區(qū)用戶身份交流理論
身份交流理論最初由Hecht M L提出,由個體身份、展示身份、關系身份、群組身份4個維度構成。個體可以基于對某個在線社區(qū)的歸屬感構建虛擬層面的社會認同.自我分類是社會認同形成的重要途徑之一。在線社區(qū)身份交流的重要性在于3個方面:幫助用戶有效獲取信息、激勵用戶參與社區(qū)活動、身份展示使用戶獲得更高層次的社區(qū)認同。用戶介紹、自我展示等是在線社區(qū)支持成員身份交流的技術途徑。用戶身份也是社會學習系統(tǒng)的核心概念之一.身份塑造是學習的重要組成部分,身份同時具有社會屬性(別人如何看你)和個體屬性(自己如何看自己)。研究表明來自他人的身份認同對在線社區(qū)成員知識貢獻有顯著影響,這也解釋了為何積分系統(tǒng)和用戶身份標識能夠驅動用戶知識貢獻。社會身份也是社群成員的自我認知,通過社群氛圍間接影響成員貢獻質量。針對維基百科內(nèi)容質量評估模型的實驗研究結果發(fā)現(xiàn).信息來源是內(nèi)容質量最重要的指標,而貢獻者專業(yè)背景在信息來源中的權重遠大于其他指標。即用戶認為貢獻者專業(yè)背景對于內(nèi)容質量的影響程度最大。而貢獻者專業(yè)背景的審核認證與等級標識均屬于用戶身份交流的一部分。
1.2內(nèi)容質量感知的雙過程理論
就概念層面而言,質量被定義為“與卓越或者某些情形下真實度有關的用戶標準”:就操作層面而言,信息質量被定義為用戶認為信息是有用的、好的、及時的、準確的程度。在線知識社區(qū)用戶對內(nèi)容質量的感知過程可用社會認知心理學領域的雙過程理論來解釋。雙加工理論及其模型在很多領域都有所應用,并且能夠成功解釋很多社會性判斷問題,包括說服式傳播、印象形成、個體感知和決策制定等。Petty RECJT在ELM模型中闡釋了說服式傳播的兩種路徑:一種是中樞路徑;一種是外圍路徑。研究表明,信息本身(例如信息組織、詳細程度等)和信息來源共同作用于用戶對知識內(nèi)容的質量感知。根據(jù)推理,用戶對知識社區(qū)內(nèi)容質量的感知同樣源于雙過程:基于線索判斷的啟發(fā)式評估,諸如社區(qū)類型、外觀設計、貢獻者專業(yè)身份等線索;基于內(nèi)容本身的系統(tǒng)評估,即從質量的各個維度來判斷。
1.3研究模型
基于以上理論和實踐研究成果.我們提出本研究的2個假設:
H1:在線知識社區(qū)對貢獻者身份的專業(yè)認證程度越高,用戶感知內(nèi)容質量越高。
H2:在線知識社區(qū)對貢獻者身份的專業(yè)標識等級越高,用戶感知內(nèi)容質量越高。
研究模型示意圖如圖1所示:
2研究設計與數(shù)據(jù)采集
2.1研究設計與測量
如何對在線知識社區(qū)貢獻者身份進行構面區(qū)分和量化處理,以及如何測量百科知識的內(nèi)容質量,是研究中的關鍵問題。
1)內(nèi)容質量感知的測量
根據(jù)現(xiàn)有研究,在線百科內(nèi)容質量可以劃分為內(nèi)容、圖文、規(guī)則、分類、鏈接等多個維度。我們依據(jù)相關文獻研究成果,將在線百科內(nèi)容質量劃分為4個維度:①D1-內(nèi)容正確性;②D2-排版規(guī)范性;③D3-分類準確性;④D4-鏈接參考資料詳盡程度。每個維度采用1~5五級量表測度,分別表示感知內(nèi)容質量從低到高。在各個質量維度上分別獲取被試者對來自不同知識社區(qū)和不同詞條的內(nèi)容質量感知數(shù)據(jù),然后以平均值來作為該詞條內(nèi)容質量感知的度量。這種做法可以提高用戶對詞條內(nèi)容質量感知結果的可靠性和有效性,進而提高研究結果的信度和效度。詞條選取原則遵循文獻的建議,所選素材均為科學、歷史、藝術類等專業(yè)性較強的詞條,排除娛樂、新聞、社會事件等非專業(yè)性內(nèi)容。此外,所選詞條必須同時出現(xiàn)在各個百科社區(qū)中且含義相同或相近,同時控制貢獻者數(shù)量,使之在不同社區(qū)盡可能接近。經(jīng)過反復挑選和比較,最終選定A1-“恩格爾系數(shù)”、A2-“聯(lián)合國”、A3-“RNA病毒”、A4-“C++”、A5-“印象派”5個來自不同專業(yè)領域的詞條。研究素材直接選用在線百科社區(qū)的詞條內(nèi)容,被試者通過在線問卷中所給詞條鏈接進行訪問閱讀。