李 燕
(大連理工大學(xué) 人文與社會(huì)科學(xué)學(xué)部,遼寧 大連 116024)
在全球電子政務(wù)普及應(yīng)用的背景下,政府網(wǎng)站服務(wù)質(zhì)量已成為衡量各國政府電子化公共服務(wù)能力的關(guān)鍵標(biāo)準(zhǔn)??茖W(xué)化、民主化的政府網(wǎng)站質(zhì)量評(píng)價(jià)為構(gòu)建以需求為導(dǎo)向、以公眾為中心的電子政府提供了重要的動(dòng)力機(jī)制。公眾作為政府網(wǎng)站的主要使用者與直接服務(wù)對(duì)象,理應(yīng)在網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)過程中被賦以重要的話語權(quán)。然而,受到公眾認(rèn)知偏差、個(gè)人差異的影響以及服務(wù)質(zhì)量信息不對(duì)稱等因素的制約,傳統(tǒng)政府網(wǎng)站公眾主觀評(píng)價(jià)面臨著信度不高、效度更低的雙重困境,評(píng)價(jià)結(jié)果無法客觀、全面地反映出網(wǎng)站服務(wù)質(zhì)量。因此,如何在促進(jìn)公眾參與、提升評(píng)價(jià)過程民主性的同時(shí),克服公眾主觀評(píng)價(jià)的局限,確保評(píng)價(jià)結(jié)果的科學(xué)性已成為電子政務(wù)評(píng)價(jià)研究乃至政府績(jī)效評(píng)價(jià)研究亟待解決的重要問題。
就此而言,作為一項(xiàng)將眾包機(jī)制運(yùn)用于政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)過程的公共管理創(chuàng)新,由英國學(xué)者西蒙·凱瑞開發(fā)的市政網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)平臺(tái)“市政網(wǎng)站可用性指示板”(以下正文中簡(jiǎn)稱“指示板”)為彌補(bǔ)傳統(tǒng)公眾參與政府網(wǎng)站質(zhì)量評(píng)價(jià)的內(nèi)在缺陷提供了行之有效的解決方案,自2015年正式運(yùn)行以來,該指示板已經(jīng)吸引了632位注冊(cè)用戶參與其中,并完成了70項(xiàng)在線服務(wù)的2250次測(cè)試,所生成的眾包數(shù)據(jù)為改善電子政務(wù)服務(wù)提供了重要的決策支持。那么,該平臺(tái)成功運(yùn)行的背后隱藏著怎樣的理論動(dòng)因?又是基于怎樣的設(shè)計(jì)理念?包含哪些構(gòu)成要素?為我國將眾包方法運(yùn)用于政府績(jī)效評(píng)價(jià)以及更大范圍公共管理領(lǐng)域提供了哪些重要的啟示?
為回答以上問題,筆者將簡(jiǎn)要論述公共管理眾包機(jī)制的理論要義,系統(tǒng)闡釋傳統(tǒng)政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)的局限與眾包體驗(yàn)式評(píng)價(jià)方法,細(xì)致描述英國眾包體驗(yàn)式政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)的設(shè)計(jì)理念、構(gòu)成要素與運(yùn)行機(jī)制,總結(jié)該平臺(tái)對(duì)公共管理眾包機(jī)制應(yīng)用及提升政府服務(wù)質(zhì)量評(píng)價(jià)科學(xué)化與民主化的實(shí)踐啟示。
信息技術(shù)的飛速發(fā)展為政府吸收外部社會(huì)力量與公眾智慧提升公共服務(wù)質(zhì)量、改善政府治理績(jī)效帶來了新的機(jī)遇。自2006年美國《連線》雜志記者 Jeff Howe首次提出眾包概念以來,商業(yè)領(lǐng)域開始關(guān)注如何利用分散的外部社會(huì)力量、智慧和資源來解決商業(yè)組織內(nèi)部問題,為組織提供產(chǎn)品和服務(wù),推動(dòng)商業(yè)模式創(chuàng)新。事實(shí)上,在公共管理領(lǐng)域,群策群力,運(yùn)用大眾集體智慧解決公共問題、提供公共物品的做法早已有之,這不僅是傳統(tǒng)公民參與的本質(zhì)特征,更是信息時(shí)代電子化民主的題中應(yīng)有之義。Web2.0技術(shù)的飛速發(fā)展,極大地拓展了政府吸收社會(huì)力量與民間智慧完善公共管理的行為邊界,眾包機(jī)制也跨越了商業(yè)活動(dòng)領(lǐng)域進(jìn)入公共管理視野。尤其是近年來,從城市規(guī)劃方案到自然災(zāi)害應(yīng)急管理,眾包機(jī)制在歐美各國公共管理實(shí)踐中展示出了巨大潛力,引發(fā)了實(shí)務(wù)界和學(xué)界的廣泛關(guān)注。
學(xué)者常使用“公民眾包”“維基政府”[1-2]等概念來描述眾包機(jī)制在公共管理領(lǐng)域應(yīng)用的潛能。具體而言,公共管理眾包機(jī)制是指將以往由指定的政府機(jī)構(gòu)承擔(dān)的任務(wù)外包給未被定義的、通常是較大規(guī)模數(shù)量的公眾群體的活動(dòng)[3]。將眾包機(jī)制運(yùn)用于公共管理領(lǐng)域,其背后的重要?jiǎng)恿κ恰伴_源式治理”哲學(xué),即將開源運(yùn)動(dòng)與民主原則相結(jié)合,使普通公眾能夠直接參與公共事務(wù)?;ヂ?lián)網(wǎng)對(duì)民主過程的貢獻(xiàn)不僅在于它對(duì)公民間溝通和協(xié)作的促進(jìn)作用,而且在于其能通過設(shè)計(jì)精良的在線協(xié)商過程,運(yùn)用公眾集體智慧解決公共問題?;赪eb2.0技術(shù)的移動(dòng)通信技術(shù)極大地降低了人們相互之間交換信息、組建群體與協(xié)作行動(dòng)的交易成本,世界各國政府越來越多地將眾包機(jī)制運(yùn)用于電子政務(wù)、電子民主與政策倡議之中。眾包不僅有助于克服傳統(tǒng)民主參與的局限性,而且能夠?yàn)楣矄栴}的解決帶來新的洞見與創(chuàng)新,還能賦權(quán)于民,使公眾參與到公共服務(wù)生產(chǎn)與政策創(chuàng)新的過程中,幫助政府降低成本,促進(jìn)創(chuàng)新,增強(qiáng)政府與公民的信任關(guān)系[4]。
在公共管理過程中應(yīng)用眾包機(jī)制就是嘗試?yán)梅稚⒌耐獠可鐣?huì)力量、智慧與資源來解決公共問題,使得公眾從被動(dòng)的政府服務(wù)使用者轉(zhuǎn)變?yōu)檎膭?chuàng)造性合作者。對(duì)公共管理者而言,接受眾包就要將其視為一種通過開放式方法來思考問題的方式,而絕不僅僅將其視為一個(gè)單一的技術(shù)工具[5]。
實(shí)踐中,眾包模式在公共領(lǐng)域的運(yùn)用可以從最簡(jiǎn)單的大眾評(píng)選(如在線投票、民意調(diào)查)到大眾處理(如分布式的在線任務(wù)處理),再到復(fù)雜的大眾創(chuàng)造與大眾解決(政策方案的設(shè)計(jì)、公共問題解決方案的征集)[6]。圖1為公共管理眾包的類型劃分。
大眾處理依賴于大量的同質(zhì)性貢獻(xiàn),參與者的貢獻(xiàn)是相互獨(dú)立的,并且可以單獨(dú)被評(píng)估。此類眾包是將一個(gè)大型或復(fù)雜的任務(wù)分解為許多小任務(wù)環(huán)節(jié),即分而治之的方法。這樣做的目的是結(jié)合個(gè)人的貢獻(xiàn),提供一個(gè)正確的解決方案或結(jié)果給定的任務(wù)。大眾評(píng)選同樣依賴于大量的同質(zhì)性貢獻(xiàn),重點(diǎn)在于邀請(qǐng)參與者對(duì)某一事物的評(píng)價(jià)與排序。不同于大眾處理,大眾評(píng)選參與者的貢獻(xiàn)不是單獨(dú)被評(píng)估,而是使用統(tǒng)計(jì)的方法以集體的方式被評(píng)估。這種眾包行動(dòng)中沒有先驗(yàn)的正確或錯(cuò)誤的結(jié)果,每一個(gè)貢獻(xiàn)都代表一個(gè)特定的投票,眾包過程的可伸縮性使其獲得越來越精確的結(jié)果。大眾解決采用更定性的方法,使用異質(zhì)的激勵(lì)元素以獲得特定問題的解決方案。類似于大眾處理系統(tǒng),對(duì)參與者貢獻(xiàn)是按照一個(gè)客觀、明確的標(biāo)準(zhǔn)被獨(dú)立地評(píng)估,每一個(gè)額外的貢獻(xiàn)可能增加結(jié)果的質(zhì)量,目的在于盡可能獲得最佳的解決方案。當(dāng)發(fā)現(xiàn)最好的解決方案時(shí),大眾解決過 程可以終止。大眾創(chuàng)造也是基于各種異質(zhì)的外部元素,與大眾解決系統(tǒng)的關(guān)鍵區(qū)別在于,參與者的貢獻(xiàn)不能獨(dú)立地評(píng)估,但需要把不同參與者的貢獻(xiàn)聯(lián)系起來。評(píng)價(jià)標(biāo)準(zhǔn)可能是模糊的、沒有明確定義的客觀標(biāo)準(zhǔn),只有相對(duì)的優(yōu)選標(biāo)準(zhǔn)。
圖1 公共管理眾包的類型劃分
政府網(wǎng)站服務(wù)質(zhì)量代表了政府網(wǎng)站使用者對(duì)于電子化公共服務(wù)長(zhǎng)期且穩(wěn)定的主觀評(píng)價(jià)。傳統(tǒng)的政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)可大致歸納為內(nèi)部評(píng)價(jià)與外部評(píng)價(jià)兩種類型。內(nèi)部評(píng)價(jià)是由政府及其相關(guān)部門主導(dǎo)并組織實(shí)施的政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)。外部評(píng)價(jià)又稱“第三方評(píng)價(jià)”,由獨(dú)立于政府組織之外的機(jī)構(gòu)或個(gè)人實(shí)施,是一種非利益相關(guān)者評(píng)價(jià)。政府網(wǎng)站的普及應(yīng)用是一項(xiàng)由技術(shù)驅(qū)動(dòng)的政府管理創(chuàng)新,因此,早期的政府網(wǎng)站質(zhì)量評(píng)價(jià)多從供給端出發(fā),聚焦于網(wǎng)站的技術(shù)性能,評(píng)價(jià)權(quán)力掌握在極少數(shù)的政府官員與技術(shù)專家、學(xué)者手中,而作為政府網(wǎng)站重要服務(wù)對(duì)象的公眾則被排斥在評(píng)價(jià)過程之外。例如,美國“州級(jí)電子治理網(wǎng)站評(píng)估與城市電子化治理網(wǎng)站評(píng)估”從隱私/安全、效用、內(nèi)容、服務(wù)、公民參與五方面對(duì)各州電子治理服務(wù)質(zhì)量進(jìn)行評(píng)價(jià)[7]。加拿大政府則選取了便利性、可訪問性、可信程度、服務(wù)成熟度、用戶接受度、服務(wù)轉(zhuǎn)型、用戶滿意度、安全性、個(gè)人隱私保護(hù)、效益/回報(bào)和創(chuàng)新11個(gè)指標(biāo)來評(píng)估該國的電子政務(wù)績(jī)效水平[8]。貝克以政府網(wǎng)站滿足使用者需求的能力為標(biāo)準(zhǔn),運(yùn)用用途分析的方法,從在線服務(wù)、使用者幫助、導(dǎo)航、信息結(jié)構(gòu)、法制保障與可得性調(diào)整六個(gè)維度對(duì)美國亞利桑那州城市政府網(wǎng)站進(jìn)行了評(píng)估[9]。格萊斯等則從連結(jié)性、準(zhǔn)確性、導(dǎo)航性、可獲得性、互動(dòng)性與透明性六個(gè)方面對(duì)瑞士法語區(qū)的官方網(wǎng)頁的服務(wù)質(zhì)量進(jìn)行了整體評(píng)估[10]。
近年來,受到“公眾滿意導(dǎo)向”政府績(jī)效觀的影響,政府網(wǎng)站質(zhì)量評(píng)價(jià)開始關(guān)注需求端,轉(zhuǎn)向“以用戶為中心”,吸納公眾參與,并將政府網(wǎng)站滿足公眾公共服務(wù)需求的能力作為評(píng)價(jià)網(wǎng)站質(zhì)量的重要標(biāo)準(zhǔn)。托雷斯等從電子化服務(wù)(包括一般性服務(wù)、教育、經(jīng)濟(jì)事務(wù)、社會(huì)服務(wù)、文化、休閑、運(yùn)動(dòng))、電子參與(包括政治維度、財(cái)政責(zé)任、公民對(duì)話)以及網(wǎng)絡(luò)成熟度三個(gè)方面,對(duì)歐盟12個(gè)國家35個(gè)城市網(wǎng)站及50余萬居民進(jìn)行了大規(guī)模的實(shí)證調(diào)查,發(fā)現(xiàn)政府通過提供電子化服務(wù)確實(shí)有助于政府治理的透明度、效能、效率以及顧客服務(wù)取向的整體提升[11]。中國許多學(xué)者也開始在政府網(wǎng)站質(zhì)量評(píng)估中融入公民評(píng)價(jià)的要素,如在對(duì)廣東、四川、山西、湖南等地方政府門戶網(wǎng)站服務(wù)質(zhì)量的研究中,設(shè)計(jì)由普通公眾打分的主觀評(píng)價(jià)指標(biāo)體系,以凸顯評(píng)價(jià)的用戶導(dǎo)向[12-15]。
然而,實(shí)踐中,無論是由政府發(fā)起的內(nèi)部評(píng)價(jià)還是由第三方機(jī)構(gòu)實(shí)施的外部評(píng)價(jià),在將普通公眾的主觀判斷作為評(píng)價(jià)政府網(wǎng)站服務(wù)質(zhì)量的信息來源與主要依據(jù)的過程中,都存在較大的局限性。一方面,在邀請(qǐng)公眾參與由政府部門發(fā)起的評(píng)價(jià)過程中,評(píng)估組織者的蓄意操縱、公眾的政治冷漠、面對(duì)公職人員的顧慮和擔(dān)憂甚至緊張情緒等都會(huì)阻礙其表達(dá)對(duì)網(wǎng)站服務(wù)質(zhì)量的真實(shí)想法,從而極大地降低了評(píng)價(jià)結(jié)果的信度。 另一方面,由學(xué)者或研究機(jī)構(gòu)發(fā)起的第三方評(píng)價(jià)倡導(dǎo)盡可能多地吸收普通公眾參與到評(píng)估過程,將公眾滿意置于核心位置,雖然在一定程度上彌補(bǔ)了內(nèi)部評(píng)價(jià)的局限和不足,但評(píng)估目的多停留于網(wǎng)站排名,而非真正關(guān)注網(wǎng)站質(zhì)量改進(jìn),實(shí)踐中常常呈現(xiàn)出過分強(qiáng)調(diào)評(píng)價(jià)的民主性而輕視科學(xué)性的傾向,使得評(píng)價(jià)結(jié)果無法真實(shí)客觀地反映政府網(wǎng)站服務(wù)的實(shí)際情況,從而削弱了評(píng)價(jià)結(jié)果的效度。
傳統(tǒng)公眾主觀評(píng)價(jià)對(duì)于評(píng)價(jià)結(jié)果的消極影響主要?dú)w因于:第一,公眾評(píng)價(jià)者的認(rèn)知偏差。絕大部分的評(píng)價(jià)通過向公眾發(fā)放服務(wù)質(zhì)量量表的方式展開,由于參評(píng)公眾并非剛剛使用過政府網(wǎng)站服務(wù),通常都是憑借其過去一段時(shí)間甚至是很長(zhǎng)一段時(shí)間關(guān)于網(wǎng)站服務(wù)使用經(jīng)歷的記憶進(jìn)行填答。此外,調(diào)研對(duì)象選擇考慮的首要因素是人口代表性、樣本分布與總體的符合程度而非在近期是否使用過政府網(wǎng)站服務(wù),研究者為了盡可能增加樣本量,相當(dāng)一部分受訪公眾甚至根本沒有使用過政府網(wǎng)站,在評(píng)價(jià)過程中易受到近因效應(yīng)、刻板效應(yīng)、首因效應(yīng)、暈輪效應(yīng)、投射效應(yīng)等認(rèn)知偏差的影響,從而根據(jù)一些表象或虛假的信息來對(duì)政府網(wǎng)站質(zhì)量作出不符合實(shí)際的判斷[16]。第二,公眾個(gè)體差異的影響。收入、年齡、受教育程度、網(wǎng)絡(luò)使用經(jīng)驗(yàn)等個(gè)人特征變量及其他非服務(wù)要素也會(huì)影響公眾對(duì)政府網(wǎng)站服務(wù)質(zhì)量的評(píng)價(jià),導(dǎo)致公眾評(píng)價(jià)不能準(zhǔn)確反映網(wǎng)站服務(wù)質(zhì)量[17]。第三,質(zhì)量評(píng)價(jià)信息的不對(duì)稱與有限獲取。充分的服務(wù)質(zhì)量信息是公眾準(zhǔn)確評(píng)價(jià)政府網(wǎng)站的前提,然而無論是內(nèi)部評(píng)價(jià)還是外部評(píng)價(jià)都具有封閉性的消極特征[10],大量的相關(guān)信息掌握在政府或評(píng)價(jià)機(jī)構(gòu)中,服務(wù)質(zhì)量信息的透明度過低,信息不對(duì)稱情況較為嚴(yán)重。公眾參與水平的逐漸提升將進(jìn)一步刺激其對(duì)于服務(wù)質(zhì)量信息的需求,但政府部門出于各種原因往往采取各種措施限制相關(guān)信息的供給[18-19]。
基于此,有學(xué)者提出在政府服務(wù)質(zhì)量評(píng)價(jià)過程中借鑒企業(yè)管理領(lǐng)域的體驗(yàn)式評(píng)價(jià)以克服傳統(tǒng)公眾評(píng)價(jià)的內(nèi)在缺陷[20]。具體而言,體驗(yàn)式評(píng)價(jià)是指評(píng)價(jià)者按照統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn),通過實(shí)地現(xiàn)場(chǎng)使用特定服務(wù)或產(chǎn)品,依據(jù)其在接受服務(wù)或使用產(chǎn)品過程中的直接觀察所得信息與即時(shí)性感知,對(duì)服務(wù)或產(chǎn)品的質(zhì)量、效果、功能進(jìn)行評(píng)價(jià)的方法。該方法基于接受特定服務(wù)之后的親身體驗(yàn)和直觀感知,評(píng)價(jià)者通過與服務(wù)提供者的互動(dòng)獲得其服務(wù)質(zhì)量的相關(guān)信息,對(duì)實(shí)際服務(wù)質(zhì)量與預(yù)期評(píng)價(jià)標(biāo)準(zhǔn)的一致性程度作出判斷,從而有效增加了評(píng)價(jià)的針對(duì)性、客觀性與確定性。將體驗(yàn)式評(píng)價(jià)應(yīng)用于政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià),即是將評(píng)價(jià)者限定為實(shí)地使用過政府網(wǎng)站服務(wù)的行政相對(duì)人,評(píng)價(jià)之前假設(shè)一系列需要在政府網(wǎng)站上解決或辦理的問題與服務(wù)事項(xiàng),然后通過使用政府網(wǎng)站的“信息查詢”“在線辦理”“公民參與”等功能模塊來進(jìn)行模擬在線辦理[16],據(jù)此監(jiān)測(cè)、診斷與評(píng)估網(wǎng)站服務(wù)質(zhì)量。這種評(píng)價(jià)方式能夠有效糾正公眾主觀評(píng)價(jià)的主觀認(rèn)知偏差與信息不對(duì)稱現(xiàn)象,確保了評(píng)價(jià)結(jié)果的信度與效度。
然而,單純依靠體驗(yàn)式方法進(jìn)行政府服務(wù)質(zhì)量評(píng)價(jià)潛藏著過度追求評(píng)價(jià)結(jié)果的科學(xué)性而忽略評(píng)價(jià)過程民主性的風(fēng)險(xiǎn)。在嘗試運(yùn)用體驗(yàn)式評(píng)價(jià)開展政府服務(wù)質(zhì)量研究的過程中,往往是由經(jīng)過系統(tǒng)培訓(xùn)的研究人員擔(dān)任評(píng)價(jià)者進(jìn)行實(shí)地體驗(yàn)服務(wù)活動(dòng),這樣就將評(píng)價(jià)權(quán)力再次局限于少數(shù)的專業(yè)化的調(diào)研者手中,而將作為真正服務(wù)對(duì)象的絕大多數(shù)普通公眾排斥在評(píng)價(jià)過程之外,固化了評(píng)價(jià)系統(tǒng)的封閉性和神秘性。
鑒于此,在體驗(yàn)式評(píng)價(jià)的基礎(chǔ)上引入眾包機(jī)制,通過在線眾包平臺(tái)將體驗(yàn)式評(píng)價(jià)過程向所有互聯(lián)網(wǎng)用戶完全開放,形成眾包體驗(yàn)式的政府網(wǎng)站服務(wù)評(píng)價(jià)方法,其中,評(píng)價(jià)主體的范圍不僅包括感興趣的專業(yè)技術(shù)人員,而且拓展至所有關(guān)注政府網(wǎng)站服務(wù)質(zhì)量提升、具有一定互聯(lián)網(wǎng)使用經(jīng)驗(yàn)的普通公眾,即便這些公眾近期并未或甚至從未使用過某項(xiàng)政府網(wǎng)站服務(wù),但也可以通過升級(jí)精良的測(cè)試模塊真實(shí)體驗(yàn)該服務(wù)功能,并根據(jù)公開的統(tǒng)一標(biāo)準(zhǔn)評(píng)價(jià)在線服務(wù)質(zhì)量,并對(duì)不同類型的服務(wù)質(zhì)量進(jìn)行比較分析。這種眾包機(jī)制與體驗(yàn)式評(píng)價(jià)的有機(jī)結(jié)合,不僅能最大限度地避免傳統(tǒng)公民“盲評(píng)”政府網(wǎng)站的認(rèn)知偏差,使公眾評(píng)價(jià)者能憑借自身的認(rèn)知能力和學(xué)習(xí)過程主動(dòng)獲取而非由政府部門被動(dòng)提供關(guān)于服務(wù)質(zhì)量的充分信息,以便其作出客觀準(zhǔn)確的評(píng)價(jià),而且更為重要的是,眾包體驗(yàn)式評(píng)價(jià)方法極大地增加了評(píng)價(jià)過程的開放性、透明度與參與性,兼顧了評(píng)價(jià)過程的科學(xué)化與民主化。
作為全球電子政務(wù)的領(lǐng)跑者,英國政府通常運(yùn)用兩種方式對(duì)各地區(qū)市政委員會(huì)網(wǎng)站服務(wù)質(zhì)量進(jìn)行評(píng)估:一是從政府的計(jì)算機(jī)專家?guī)熘羞x擇一些專家自愿組成評(píng)估小組,對(duì)網(wǎng)站可用性進(jìn)行評(píng)估;二是通過每年一次的政府網(wǎng)站調(diào)查(由城市在線網(wǎng)絡(luò)平臺(tái)完成)來評(píng)估地方政府網(wǎng)站的服務(wù)質(zhì)量,該調(diào)查同樣運(yùn)用專家為特定在線政務(wù)服務(wù)質(zhì)量作出判斷。以上兩者在英國市政網(wǎng)站質(zhì)量管理實(shí)踐中發(fā)揮著重要作用,但存在以下三個(gè)局限性:①問題的規(guī)模和評(píng)審人的可獲得性意味著每年只有一小部分“處于服務(wù)列表最頂端的”在線政務(wù)服務(wù)才能得到評(píng)價(jià),每年只有10項(xiàng)網(wǎng)站服務(wù)得到測(cè)試,而每個(gè)市政網(wǎng)站都提供了上百個(gè)服務(wù)項(xiàng)目;②由于成本的問題,詳細(xì)的評(píng)價(jià)結(jié)果只向城市在線網(wǎng)絡(luò)平臺(tái)的付費(fèi)用戶提供;③評(píng)審人只是對(duì)此有興趣的專家,而非擁有不同水平互聯(lián)網(wǎng)技能的普通公民(實(shí)際上他們才是網(wǎng)站的真正用戶)。所以,傳統(tǒng)的評(píng)估無法對(duì)英國市政網(wǎng)站質(zhì)量進(jìn)行全面細(xì)致的評(píng)估,更無法向全體公民展示英國各地市政網(wǎng)站可用性的完整圖景。
為克服傳統(tǒng)政府網(wǎng)站質(zhì)量評(píng)價(jià)在參與者范圍、被評(píng)估服務(wù)數(shù)量以及評(píng)價(jià)結(jié)果公開性等方面的局限性,英國學(xué)者西蒙·凱瑞嘗試將眾包機(jī)制運(yùn)用于政策評(píng)估階段,開發(fā)出指示版來評(píng)估英格蘭、蘇格蘭與威爾士地區(qū)176個(gè)市政委員會(huì)網(wǎng)站的可用性,通過邀請(qǐng)參與者完成一系列的任務(wù)測(cè)試,使用產(chǎn)生的眾包數(shù)據(jù)逐漸構(gòu)建起關(guān)于這些網(wǎng)站所有功能模塊可用性的綜合圖景[21]。指示板邀請(qǐng)參與者以某一市政網(wǎng)站特定的在線公共服務(wù)為測(cè)試對(duì)象,對(duì)谷歌搜索、政府網(wǎng)站搜索、政府網(wǎng)站首頁導(dǎo)航與A-Z分類導(dǎo)航的可用性與便捷性分別排序打分。這種評(píng)估是用參與者對(duì)實(shí)際經(jīng)歷的即時(shí)主觀評(píng)價(jià)來代替以往專家基于對(duì)網(wǎng)站系統(tǒng)運(yùn)行的客觀時(shí)間計(jì)算的評(píng)價(jià)方法。
作為一種典型的大眾評(píng)選式公共管理眾包應(yīng)用,指示板的開發(fā)最初源于公民合作生產(chǎn)與同行生產(chǎn)的理念。根據(jù)公民合作生產(chǎn)理論,政府不應(yīng)僅僅將公眾視為公共服務(wù)的顧客,還應(yīng)將其視為合作伙伴,讓政府與公民社會(huì)共享權(quán)威與責(zé)任[22]。傳統(tǒng)公民合作生產(chǎn)受限于政府有效協(xié)調(diào)公民行動(dòng)的能力不足與普通公民自組織的困難,而互聯(lián)網(wǎng)技術(shù)的普及使公民之間的多邊互動(dòng)與自發(fā)協(xié)作成為可能,社交媒體時(shí)代的公民合作生產(chǎn)極大地改變與淡化了政府和公眾的行為邊界[23]。
指示板為公民合作參與政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)提供了一個(gè)自組織的平臺(tái),讓所有的普通民眾而非少數(shù)的技術(shù)官僚或本地區(qū)民眾通過體驗(yàn)式的方法按照統(tǒng)一的標(biāo)準(zhǔn)對(duì)政府網(wǎng)站服務(wù)質(zhì)量給出客觀公正、具備可比性的評(píng)價(jià)結(jié)果。此外,隨著Web2.0時(shí)代的到來,互聯(lián)網(wǎng)內(nèi)容的創(chuàng)造者已從少數(shù)的網(wǎng)站經(jīng)營(yíng)者轉(zhuǎn)變?yōu)榇蟊?,即依托于?jì)算機(jī)網(wǎng)絡(luò)樂于無償貢獻(xiàn)的業(yè)余人士,形成了“大眾生產(chǎn)”模式。指示板正是大眾生產(chǎn)模式在電子政務(wù)服務(wù)質(zhì)量評(píng)價(jià)領(lǐng)域的應(yīng)用,該網(wǎng)站的開發(fā)者是地方政府網(wǎng)站的專業(yè)人士,這些專業(yè)人士不僅懂得如何發(fā)現(xiàn)用戶數(shù)據(jù),并聚焦于A/B測(cè)試①,同時(shí)也了解地方政府與公民的互動(dòng)行為。
指示板面向全球網(wǎng)互聯(lián)用戶開放,只需簡(jiǎn)單注冊(cè)即能成為網(wǎng)站的志愿測(cè)試者,注冊(cè)過程中會(huì)向參與者收集其年齡、計(jì)算機(jī)水平、身體狀況與專業(yè)能力等相關(guān)信息,使參與者在開始測(cè)評(píng)之前明確了自己作為測(cè)試者的角色定位與所需要的評(píng)估能力,判斷自己是否具備測(cè)試所需的技能,以確保測(cè)試的有效性與順利進(jìn)行。
當(dāng)評(píng)估者點(diǎn)擊首頁的任務(wù)測(cè)試按鈕,進(jìn)入測(cè)試頁面,指示板會(huì)隨機(jī)為測(cè)試者分配一個(gè)測(cè)試任務(wù),圖2為英國“市政網(wǎng)站可用性指示版”測(cè)試頁面的部分截圖,該頁面由7部分組成:
(1)測(cè)試網(wǎng)站名稱。隨機(jī)對(duì)176個(gè)市政委員會(huì)網(wǎng)站進(jìn)行測(cè)試,例如此頁面中是對(duì)卡萊爾市政委員會(huì)網(wǎng)站的測(cè)試,在測(cè)試模塊的上方還自動(dòng)給出被測(cè)試網(wǎng)站的地址,以便測(cè)試者開始測(cè)試。
(2)任務(wù)內(nèi)容。指示板邀請(qǐng)測(cè)試者對(duì)市政委員會(huì)網(wǎng)站的70個(gè)服務(wù)質(zhì)量進(jìn)行隨機(jī)測(cè)試,例如此頁面中是對(duì)“出租車司機(jī)-顧客投訴”服務(wù)的測(cè)試。
(3)測(cè)試結(jié)果打分。指示板邀請(qǐng)測(cè)試者對(duì)四種公共服務(wù)信息查詢服務(wù)方式的可用性進(jìn)行測(cè)試打分(非常簡(jiǎn)便、簡(jiǎn)單、困難與放棄),分別為導(dǎo)航結(jié)果(測(cè)試網(wǎng)站首頁導(dǎo)航的可用性)、A-Z目錄索引(網(wǎng)站首頁查詢索引的可用性,若網(wǎng)站無索引,則忽略)、內(nèi)部搜索(網(wǎng)站內(nèi)部快捷查詢通道的可用性,要求測(cè)試者提供在查詢欄中鍵入的問題)、谷歌搜索引擎(在谷歌搜索結(jié)果中相關(guān)服務(wù)信息的可用性,要求測(cè)試者提供在搜索欄中鍵入的問題)。
(4)可讀性。用于評(píng)估測(cè)試者找到所需信息頁面的難易程度。
(5)形式完整性。如果測(cè)試者正在完成一個(gè)在線事務(wù)辦理任務(wù),請(qǐng)勾選此項(xiàng),然后請(qǐng)測(cè)試者跟蹤完成,測(cè)試者也可以就正在測(cè)試的在線辦理服務(wù)提出具體意見與相關(guān)評(píng)論。
(6)重要性。用于評(píng)估該服務(wù)對(duì)于評(píng)估者而言的重要性。
圖2 英國“市政網(wǎng)站可用性指示板” 的測(cè)試頁面(部分截圖)
(7)測(cè)試所用設(shè)備。備選項(xiàng)包括手提電腦、手機(jī)、電視與平板電腦。
除了由系統(tǒng)隨機(jī)分配測(cè)試任務(wù),測(cè)試者還可以自主選擇自己感興趣的城市與相關(guān)的服務(wù)進(jìn)行測(cè)試。
指示板將評(píng)估結(jié)果按照兩種方式在網(wǎng)站上進(jìn)行展示。圖3為英國176個(gè)市政網(wǎng)站可用性評(píng)估進(jìn)展(部分截圖);圖4為英國市政網(wǎng)站服務(wù)可用性的評(píng)估結(jié)果——以成人教育課程為例(部分截圖)。
(1)英國176個(gè)市政委員會(huì)網(wǎng)站的整體得分情況見圖3。點(diǎn)擊相關(guān)城市名稱,還可以詳細(xì)查詢某一城市的70項(xiàng)在線服務(wù)可用性的測(cè)試結(jié)果,每項(xiàng)得分就是測(cè)試了一整套任務(wù)的平均分?jǐn)?shù),其中,分?jǐn)?shù)賦值規(guī)則為:非常容易=10分、容易=8分、困難=4分、放棄=1分。隨著越來越多的用戶完成任何給定的測(cè)試,每個(gè)任務(wù)的最終得分是所有測(cè)試得分的平均值,因此完成的測(cè)試越多,網(wǎng)站可用性測(cè)試結(jié)果的可靠性就越高??捎眯灾笖?shù)是所有測(cè)試的評(píng)分總和除以該市政委員會(huì)網(wǎng)站被測(cè)試的總次數(shù),取值在1和10之間,6分及以上表示該網(wǎng)站的可用性達(dá)到合格標(biāo)準(zhǔn)。如果某項(xiàng)任務(wù)被測(cè)試次數(shù)小于15,或者整個(gè)網(wǎng)站的測(cè)試項(xiàng)目少于50個(gè),則該網(wǎng)站的各項(xiàng)得分就以灰色標(biāo)識(shí),表明測(cè)試結(jié)果的可靠性仍有待進(jìn)一步確認(rèn)。
(2)各在線服務(wù)的可用性得分見圖4。圖4列舉了英國176個(gè)市政委員會(huì)網(wǎng)站成人教育課程信息查詢服務(wù)可用性的評(píng)價(jià)結(jié)果,其中,賦值規(guī)則為:非常容易=5、簡(jiǎn)單=3、困難=1、放棄=-3,
圖3 英國176個(gè)市政網(wǎng)站可用性評(píng)估進(jìn)展(部分截圖)
圖4 英國市政網(wǎng)站服務(wù)可用性的評(píng)估結(jié)果-以成人教育課程為例(部分截圖)
總得分為各項(xiàng)測(cè)試分?jǐn)?shù)之和,重要性表示所有測(cè)試人員認(rèn)為完成這項(xiàng)任務(wù)所需能力重要性的平均值,從0=不重要到5=非常重要。
自2015年正式上線以來,作為一個(gè)全年運(yùn)行的在線眾包評(píng)價(jià)系統(tǒng),指示板有效補(bǔ)充甚至是部分替代了一年一次的專家評(píng)價(jià)活動(dòng),增強(qiáng)了政府的回應(yīng)性。就此而言,指示板不僅僅是一個(gè)眾包或合作生產(chǎn)的工具,參與者的多元性(政府官員、企業(yè)用戶、普通百姓)表明,它已逐漸成為一個(gè)類似于知識(shí)分享網(wǎng)絡(luò)的參與者驅(qū)動(dòng)的公共服務(wù)改善合作網(wǎng)絡(luò)。此外,指示板的評(píng)價(jià)結(jié)果數(shù)據(jù)庫向所有互聯(lián)網(wǎng)用戶免費(fèi)公開全部的評(píng)價(jià)結(jié)果、相關(guān)概要以及測(cè)試者的自由評(píng)論(測(cè)試者身份信息將會(huì)被隱去),這將有助于網(wǎng)站團(tuán)隊(duì)識(shí)別與分享成功的經(jīng)驗(yàn)與糟糕的實(shí)踐。指示板的開發(fā)者未來將把所有的原始數(shù)據(jù)以網(wǎng)頁格式公開,便于讓感興趣的公眾、專家或組織進(jìn)行更詳盡的分析。
但是,在實(shí)際運(yùn)行中,指示板也面臨著以下困境:①數(shù)據(jù)的稀疏性是運(yùn)用指示版作為績(jī)效評(píng)價(jià)工具的最主要問題。如圖3所示,灰色條塊表示的是評(píng)測(cè)結(jié)果可靠性較低的被測(cè)試網(wǎng)站,還有極少數(shù)的市政委員會(huì)網(wǎng)站迄今未被測(cè)試,這表明數(shù)據(jù)的稀疏性是影響指示板有效運(yùn)行的重要限制。②參與者的內(nèi)部自評(píng)傾向。參與評(píng)價(jià)的大部分是政府官員與同行專業(yè)人士,如1198個(gè)評(píng)估者中的999個(gè)(83%)是由具有g(shù)ov.uk的郵箱后綴的參與者提交的,517個(gè)(43%)評(píng)估者的郵箱后綴與被評(píng)價(jià)網(wǎng)站后綴相同,也就是說他們是內(nèi)部評(píng)估者而非外部同行或普通公眾。③評(píng)價(jià)結(jié)果影響的有限性。關(guān)注指示板評(píng)價(jià)結(jié)果的并不是公眾,而是同行專業(yè)人士與政府官員,因此,即便評(píng)估數(shù)據(jù)是公開的,它也并未增加政府的課責(zé)性。④參與者激勵(lì)不足。由于指示板是邀請(qǐng)用戶自愿參與測(cè)評(píng),所以參與者對(duì)指定任務(wù)的完成度較低。
綜上所述,指示板的出現(xiàn),一方面是由于實(shí)踐中傳統(tǒng)政府網(wǎng)站質(zhì)量評(píng)價(jià)在參與者范圍、被評(píng)估服務(wù)數(shù)量以及評(píng)價(jià)結(jié)果公開性等方面的局限性。不同于以往的“第三方評(píng)價(jià)”將評(píng)價(jià)主體限定為具有某些資格條件的公眾(如必須具備一定的計(jì)算機(jī)能力),為了盡可能運(yùn)用分散的外部社會(huì)力量、智慧與資源來共同參與公共事務(wù)的協(xié)同治理,指示板將政府網(wǎng)站績(jī)效評(píng)價(jià)的全過程向全社會(huì)開放,不設(shè)任何門檻與限制性條件,讓任何一個(gè)普通公眾都可以通過親自體驗(yàn)網(wǎng)站服務(wù),并基于其用戶體驗(yàn)感知對(duì)網(wǎng)站給出較為客觀的即時(shí)評(píng)價(jià),減少了主觀認(rèn)知偏差的影響。另一方面,指示板的出現(xiàn)也是對(duì)Web2.0時(shí)代開放式政府理論創(chuàng)新的積極回應(yīng)。開放式政府立基于通過新技術(shù)來實(shí)現(xiàn)政治民主這一樂觀構(gòu)想之上,超越了傳統(tǒng)以信息技術(shù)為中心的電子政務(wù)模式,是一種以公民為中心擴(kuò)大政府信息公開,在保障公民知情權(quán)的同時(shí),促進(jìn)公民參與權(quán),提升公共服務(wù)質(zhì)量和效率[24]。指示板的出現(xiàn)恰恰體現(xiàn)出開放式政府“透明、參與、協(xié)作”的核心特征。
指示板起初是作為一個(gè)學(xué)術(shù)嘗試而出現(xiàn)的,其設(shè)計(jì)者西蒙博士在2017年底對(duì)網(wǎng)站數(shù)據(jù)進(jìn)行了深入的統(tǒng)計(jì)分析,形成了具有說服力的評(píng)估報(bào)告并依托牛津大學(xué)互聯(lián)網(wǎng)研究中心將評(píng)估報(bào)告公開發(fā)表。該報(bào)告一經(jīng)發(fā)布,立刻吸引了數(shù)十個(gè)英格蘭、蘇格蘭與威爾士地區(qū)市議會(huì)的注意,進(jìn)而引發(fā)了決策者與社會(huì)公眾的廣泛關(guān)注。從2018年起,過半數(shù)的英格蘭、蘇格蘭與威爾士地區(qū)的市政府都自愿參與并配合指示板的建設(shè)和運(yùn)行,將指示板產(chǎn)生的評(píng)估數(shù)據(jù)作為本地政府網(wǎng)站評(píng)估的一部分,同時(shí)積極宣傳、鼓勵(lì)當(dāng)?shù)孛癖娡ㄟ^親身的用戶測(cè)評(píng)來發(fā)現(xiàn)網(wǎng)站存在的具體問題,并能夠根據(jù)網(wǎng)站定期的評(píng)估數(shù)據(jù)及時(shí)地改進(jìn)網(wǎng)站服務(wù)。
當(dāng)前,中國政府網(wǎng)站服務(wù)質(zhì)量評(píng)價(jià)多采取兩種做法:一是自上而下的數(shù)據(jù)填報(bào)與自評(píng)報(bào)告、工作總結(jié),同時(shí)結(jié)合上級(jí)部門的政府網(wǎng)站常態(tài)化監(jiān)管和季度抽查情況,由各地區(qū)的電子政務(wù)主管部門組織政府工作人員進(jìn)行互評(píng)打分,如2017年11月湖南省人民政府發(fā)布的《全省政府網(wǎng)站績(jī)效評(píng)估工作方案及指標(biāo)體系》②、2018年10月廣西壯族自治區(qū)人民政府發(fā)布的《全區(qū)政府網(wǎng)站績(jī)效評(píng)估實(shí)施方案(2018-2020年)》③。二是自下而上的數(shù)據(jù)采樣,即第三方評(píng)估。政府相關(guān)部門委托科研機(jī)構(gòu)、學(xué)術(shù)團(tuán)體或咨詢公司通過不定時(shí)的數(shù)據(jù)采樣進(jìn)行分析測(cè)評(píng),如中華人民共和國工業(yè)和信息化部等國家部委依托中國電子信息產(chǎn)業(yè)發(fā)展研究院與中國軟件評(píng)測(cè)中心等科研機(jī)構(gòu)每年一次的全國政府網(wǎng)站績(jī)效評(píng)價(jià)。
然而,以上兩種做法均存在評(píng)價(jià)過程透明度不足、公民參與缺位等問題??紤]到中國與西方國家行政管理體制的差異,為充分發(fā)揮眾包機(jī)制在政府網(wǎng)站服務(wù)質(zhì)量評(píng)估中的價(jià)值,實(shí)踐中較為可行的做法是將體驗(yàn)式眾包評(píng)價(jià)增加至已有的評(píng)價(jià)體系之中,無論是在自上而下的自評(píng)還是自下而上的他評(píng)過程中,都可以嘗試在已有的評(píng)價(jià)指標(biāo)系統(tǒng)中嵌入公民體驗(yàn)式眾包評(píng)價(jià)模塊,并將評(píng)價(jià)結(jié)果賦予適當(dāng)權(quán)重,將其與其他評(píng)價(jià)方式產(chǎn)生的數(shù)據(jù)進(jìn)行綜合分析,以期增加評(píng)價(jià)結(jié)果的科學(xué)性與民主性。
指示板的成功運(yùn)用為我們揭示了將眾包方法運(yùn)用于政府績(jī)效評(píng)價(jià)以及更大范圍公共管理領(lǐng)域的巨大潛能:
(1)充分運(yùn)用在線社區(qū)的眾包力量,增加評(píng)價(jià)過程的開放性、透明度與參與性,拓展政府績(jī)效評(píng)價(jià)民主化的廣度與深度。在已有電子政務(wù)服務(wù)平臺(tái)的基礎(chǔ)上,增加相應(yīng)的測(cè)評(píng)功能模塊,賦權(quán)于民,邀請(qǐng)感興趣的專業(yè)技術(shù)人員與關(guān)注政府網(wǎng)站服務(wù)質(zhì)量提升、具有一定互聯(lián)網(wǎng)使用經(jīng)驗(yàn)的普通公眾,根據(jù)公開的統(tǒng)一標(biāo)準(zhǔn)評(píng)價(jià)在線服務(wù)質(zhì)量,并對(duì)不同類型的服務(wù)質(zhì)量進(jìn)行比較分析,以避免傳統(tǒng)公民“盲評(píng)”政府網(wǎng)站的認(rèn)知偏差,使公眾評(píng)價(jià)者能憑借自身的認(rèn)知能力和學(xué)習(xí)過程主動(dòng)獲取而非由政府部門被動(dòng)提供關(guān)于服務(wù)質(zhì)量的充分信息,以便其作出客觀準(zhǔn)確的評(píng)價(jià),增加在線公共服務(wù)政府績(jī)效評(píng)價(jià)民主化的深度與廣度,實(shí)現(xiàn)公民參與的有效性。
(2)以信息技術(shù)為支撐,增強(qiáng)政府績(jī)效信息的可獲得性、完整性和及時(shí)性,保障公眾知情權(quán),以常態(tài)化的政府績(jī)效評(píng)價(jià)推動(dòng)服務(wù)型政府建設(shè)。指示板基于網(wǎng)站的政府績(jī)效信息管理模式,“具有信息傳播和存儲(chǔ)成本低、信息受益面廣、信息可溯性強(qiáng)和實(shí)時(shí)動(dòng)態(tài)持續(xù)記錄的特點(diǎn)”[20]。一方面,這種模式通過同步公開績(jī)效測(cè)試評(píng)分的方式,讓公眾及時(shí)、全面地了解政府在不同的公共服務(wù)中提供存在的各類問題,糾正政府績(jī)效管理過程中的信息不對(duì)稱,確保公民知情權(quán);另一方面,這種即時(shí)性、隨機(jī)性的政府績(jī)效信息生成模式有助于建立常態(tài)化的政府績(jī)效評(píng)價(jià)制度,能夠有效克服我國政府績(jī)效評(píng)價(jià)過程中的“形式主義”,避免“運(yùn)動(dòng)式評(píng)價(jià)”“數(shù)據(jù)造假”等績(jī)效評(píng)價(jià)亂象,促使政府部門在日常工作中時(shí)刻樹立“以公民為中心”的服務(wù)理念,加快建設(shè)服務(wù)型政府。
(3)公共管理過程中引入眾包機(jī)制,為復(fù)雜的公共問題尋求解決方案,提升政府治理能力。除了將眾包機(jī)制運(yùn)用于政府服務(wù)績(jī)效評(píng)價(jià),政府部門還可嘗試?yán)迷诰€社區(qū)搜集各種信息以改善公共決策,優(yōu)化資源配置[25]。借助于大眾力量拓展政府的數(shù)據(jù)分析能力,眾包機(jī)制還可幫助政府預(yù)測(cè)公民行為,例如協(xié)助相關(guān)部門預(yù)測(cè)公眾對(duì)公共交通等公共服務(wù)的使用情況,或者為公共健康政策與環(huán)境政策的制定提供依據(jù)。如此以來,使公眾參與到公共服務(wù)生產(chǎn)與政策創(chuàng)新過程之中,幫助政府降低成本,促進(jìn)創(chuàng)新,增強(qiáng)政府與公民的信任關(guān)系。
注釋:
①AB測(cè)試是為Web或App界面或流程制作兩個(gè)(A/B)或多個(gè)(A/B/n)版本,在同一時(shí)間維度,分別讓組成成分相同(相似)的訪客群組隨機(jī)地訪問這些版本,收集各群組的用戶體驗(yàn)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),最后分析評(píng)估出最好版本正式采用。
②參見:2017年全省政府網(wǎng)站績(jī)效評(píng)估工作方案及指標(biāo)體系(http://www.yuelu.gov.cn/yuelugov/yl_xxgk/xxgkgd/1479882/index.html)。
③參見:廣西壯族自治區(qū)人民政府辦公廳關(guān)于印發(fā)《全區(qū)政府網(wǎng)站績(jī)效評(píng)估實(shí)施方案(2018-2020年)》的通知(http://www.gxzf.gov.cn/zwgk/zfwj/20181016-717349.shtml)。