商容軒 張 斌 米加寧
(1.哈爾濱工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院 黑龍江哈爾濱 150001)
(2.湖南農(nóng)業(yè)大學(xué)公共管理與法學(xué)學(xué)院 湖南長沙 410000)
隨著第四次工業(yè)革命進(jìn)程的深化,移動(dòng)智能技術(shù)與地方政府治理正進(jìn)行深度融合。在新冠肺炎疫情爆發(fā)后,“非接觸”的疫情防控原則推動(dòng)政府公共服務(wù)供給模式加速走向“缺場”。隨著移動(dòng)互聯(lián)網(wǎng)應(yīng)用滲透率的提升,截至2020年12月,中國在線政務(wù)服務(wù)用戶規(guī)模已達(dá)8.43億[1],在線政務(wù)服務(wù)供給模式也逐漸從“網(wǎng)上辦”轉(zhuǎn)向“指尖辦”。移動(dòng)政務(wù)APP以其移動(dòng)性、伴隨性、滲透性、公開性等優(yōu)勢迅速成為各地方政府深化政務(wù)公開、提升地方數(shù)字治理水平的重要載體。
當(dāng)前,在中央“放管服”改革與移動(dòng)智能技術(shù)的雙重驅(qū)動(dòng)作用下,我國移動(dòng)政務(wù)APP普遍開通了在線評(píng)論功能,公眾作為地方政府移動(dòng)政務(wù)產(chǎn)品的用戶可以通過對(duì)政務(wù)APP評(píng)級(jí)或留言的方式對(duì)應(yīng)用質(zhì)量進(jìn)行評(píng)價(jià)與意見反饋[2]。政務(wù)APP在線評(píng)論數(shù)據(jù)每天以指數(shù)級(jí)趨勢增長,形成了潛在的口碑傳播效應(yīng)[3],同時(shí)由于移動(dòng)政務(wù)產(chǎn)品的特殊性,移動(dòng)政務(wù)產(chǎn)品在線評(píng)論的情感傾向性會(huì)對(duì)用戶線上政務(wù)滿意度與政府公信力產(chǎn)生重要影響。當(dāng)前,隨著各地方政府政務(wù)APP的上線與普及,下載量、用戶量、線上業(yè)務(wù)辦理量等相關(guān)客觀數(shù)據(jù)逐漸成為考核各地線上政務(wù)能力的重要指標(biāo)。部分地區(qū)基于上級(jí)壓力下的基層數(shù)字治理出現(xiàn)“唯數(shù)字”的傾向,其政務(wù)APP的功能也隨之產(chǎn)生了異化,“線上”比“線下”更麻煩的報(bào)道層出不窮,本應(yīng)是便民利民的移動(dòng)應(yīng)用卻反向成為了約束公眾的“異己力量”,有部分學(xué)者稱政務(wù)APP的普及成為“指尖上的形式主義的泛化”[4]。因此,對(duì)移動(dòng)政務(wù)用戶進(jìn)行細(xì)粒度情感分析以提升群眾滿意度、認(rèn)可度尤為重要。如何利用移動(dòng)政務(wù)用戶的情感分析結(jié)果實(shí)現(xiàn)公眾需求的精準(zhǔn)性滿足,幫助地方政府把握移動(dòng)政務(wù)發(fā)展的痛點(diǎn)并提升政府移動(dòng)公共服務(wù)的供給質(zhì)量與效率,不僅是學(xué)術(shù)界需要深入探究的熱點(diǎn)問題,也是地方政府作為公共服務(wù)供給主體亟須解決的現(xiàn)實(shí)問題。
情感分析(Sentiment Analysis,SA)是通過對(duì)于評(píng)論、問題、事件、案例、新聞等文本信息的研究而挖掘出隱藏在文本中的情緒、觀點(diǎn)的一種研究方法[5]。ABSA是情感分析中的屬性級(jí)情感分析任務(wù),該方法由兩大任務(wù)構(gòu)成——方面抽取與情感分析。ABSA的目標(biāo)是通過提取不同評(píng)論實(shí)體以及不同屬性方面的情感意見,得到方面級(jí)別的<方面,情感>的二元組[6],以確定意見的極性、結(jié)果的匯總以及多維度的對(duì)比(具體實(shí)現(xiàn)過程見圖1)。
圖1 基于方面級(jí)評(píng)論文本情感分析(ABSA)框架圖
ABSA方法相較于傳統(tǒng)的情感分析任務(wù)具有一定的優(yōu)勢,近年來已經(jīng)成為自然語言處理領(lǐng)域研究的熱點(diǎn)之一[7]??傮w來看,ABSA方法有以下顯著特征:
首先,ABSA方法包含方面抽取與情感極性分析兩大任務(wù)目標(biāo)[8]。在方面抽取任務(wù)中,既要完成對(duì)評(píng)論實(shí)體的抽?。ˋspect Term Extraction,ATE),又要完成對(duì)于方面類別的抽?。ˋspect Category Extraction,ACE)。評(píng)論實(shí)體(Aspect Term,AT)是評(píng)論文本中的顯示詞匯,是文本中的固有實(shí)體;而方面類別(Aspect Category,AC)經(jīng)過預(yù)定義的評(píng)論描述角度,可以是文本中的實(shí)體詞匯,也可以是文本中待挖掘的隱式主題。
其次,ABSA方法可以實(shí)現(xiàn)細(xì)粒度的情感分析任務(wù)。在SA中,根據(jù)細(xì)粒度的不同,可分為三個(gè)級(jí)別[9]:一是文檔級(jí)的情感分析,用于分析整篇文檔的情感傾向。但往往一篇評(píng)論型文檔的情感態(tài)度并不是單一的,該方法對(duì)于進(jìn)行辯證分析的文本內(nèi)容是沒辦法進(jìn)行細(xì)致挖掘的;二是語句級(jí)的情感分析,用于分析評(píng)論數(shù)據(jù)可以判斷以語句為單位的情感走向,是目前大多數(shù)文本分析研究中運(yùn)用的方法。但此方法存在著認(rèn)為一條語句僅存在著一種情感的假設(shè)前提,但在現(xiàn)實(shí)情況中一條評(píng)論語句可能是對(duì)多方面問題的評(píng)述,甚至對(duì)不同方面會(huì)存在完全不同的轉(zhuǎn)折情感態(tài)度。同時(shí),由于詞袋中相同情感詞匯在不同領(lǐng)域所表達(dá)的情感極性也存在截然不同的可能性,因此在應(yīng)用于跨領(lǐng)域的遷移學(xué)習(xí)時(shí),其分析結(jié)果的準(zhǔn)確性十分有限;三是方面級(jí)的情感分析即ABSA,該方法通過其兩階段的任務(wù)目標(biāo),實(shí)現(xiàn)了對(duì)文本數(shù)據(jù)的細(xì)粒度挖掘,彌補(bǔ)了粗粒度文本分析的局限。
在移動(dòng)政務(wù)問題背景下,移動(dòng)政務(wù)用戶作為政務(wù)APP的實(shí)際體驗(yàn)者和功能的使用者,使用過程中會(huì)對(duì)移動(dòng)政務(wù)系統(tǒng)或服務(wù)產(chǎn)生具有差異傾向性的情感。通過對(duì)政務(wù)APP的用戶評(píng)論與反饋進(jìn)行情感分析與方面級(jí)情感匹配,可以探究我國政務(wù)用戶對(duì)于政務(wù)APP基于方面級(jí)的屬性需求與情感滿足情況??紤]到移動(dòng)政務(wù)的用戶評(píng)論均為較短的文本數(shù)據(jù),并且每條評(píng)論數(shù)據(jù)往往包含對(duì)政務(wù)APP多方面的評(píng)價(jià),因此綜合考量ABSA會(huì)是一個(gè)較為適合的分析方法。它一方面能夠通過主題模型進(jìn)行方面抽取,實(shí)現(xiàn)細(xì)粒度的情感差異分析;另一方面也能通過多角度的情感強(qiáng)度測量,得到可驗(yàn)證的普遍性結(jié)論,進(jìn)而關(guān)照本文的研究旨趣。另外,該方法已在商品評(píng)價(jià)、酒店評(píng)論、購物類APP等研究領(lǐng)域中得到使用和驗(yàn)證,因此方法選擇上具備較成熟的適用性。
目前對(duì)于移動(dòng)政務(wù)的研究主要基于以下幾種視角:(1)技術(shù)采納視角認(rèn)為用戶對(duì)于移動(dòng)政務(wù)的采納在本質(zhì)上屬于信息系統(tǒng)采納行為,基于此理論研究者提出了技術(shù)接受模型(TAM)[10]、技術(shù)接受與利用整合理論(UTAUT)[11]與創(chuàng)新擴(kuò)散理論(IDT)[12];(2)用戶需要視角認(rèn)為,移動(dòng)政務(wù)的使用應(yīng)旨在滿足用戶需求[13],要想完善移動(dòng)政務(wù)服務(wù)機(jī)制,就要強(qiáng)調(diào)公眾需求的重要性,將公眾需求與移動(dòng)政務(wù)建設(shè)有機(jī)地聯(lián)系在一起[14];(3)公眾信任視角認(rèn)為信任因素是影響公眾的移動(dòng)政務(wù)使用意愿的重要因素[15],從類別上可以細(xì)分為政府信任與技術(shù)信任[16],從時(shí)間上可以細(xì)分為初始信任與持續(xù)信任[17];(4)用戶滿意視角將提升用戶滿意度作為信息系統(tǒng)成功的目標(biāo),D&M模型認(rèn)為系統(tǒng)質(zhì)量、信息質(zhì)量與服務(wù)質(zhì)量共同影響著用戶的滿意程度[18-19],使用行為的滿意度又會(huì)影響用戶后續(xù)的媒介接觸行為[20-22];(5)用戶持續(xù)使用視角基于綜合理論模型,對(duì)用戶對(duì)政務(wù)系統(tǒng)的持續(xù)使用與不持續(xù)使用行為進(jìn)行了多角度的實(shí)證研究[23-25]。總體而言,現(xiàn)有研究已從多主體的角度,通過實(shí)證研究或者案例研究的方式,探究了多種因素在移動(dòng)政務(wù)用戶使用滿意度方面的影響,并據(jù)此對(duì)政府改進(jìn)移動(dòng)政務(wù)工作提出優(yōu)化建議?!叭绾翁嵘苿?dòng)政務(wù)服務(wù)質(zhì)量和水平”已然成為學(xué)者關(guān)注的焦點(diǎn)與研究落腳點(diǎn)。
隨著移動(dòng)政務(wù)研究方法的多元化,對(duì)用戶評(píng)論數(shù)據(jù)進(jìn)行情感分析的研究方法,因其對(duì)用戶評(píng)論情感趨勢的獨(dú)特甄別與對(duì)用戶痛點(diǎn)的精準(zhǔn)挖掘,也逐漸受到電子政務(wù)研究學(xué)者的青睞。馮小東等通過文本挖掘的方式發(fā)現(xiàn)公眾對(duì)于政務(wù)信息的情感傾向程度會(huì)顯著影響政務(wù)信息的傳播效果[26]。劉桂琴采用LDA主題模型對(duì)政府?dāng)?shù)據(jù)開放網(wǎng)站數(shù)據(jù)進(jìn)行訓(xùn)練,并對(duì)不同主題類型的評(píng)論情感差異進(jìn)行探討[27]。劉曉娟和王晨琳將政務(wù)微博評(píng)論數(shù)據(jù)作為研究對(duì)象,基于SnowNLP模型計(jì)算社會(huì)情緒以求分析輿情演化趨勢[28]。紀(jì)雪梅等構(gòu)建情感詞典對(duì)政務(wù)微博公眾評(píng)論情感進(jìn)行計(jì)算并進(jìn)行多因素方差分析,以探究政務(wù)回應(yīng)對(duì)公眾情緒的影響機(jī)制[29]。但目前運(yùn)用情感分析方法深度挖掘多用于商品評(píng)論,而將其運(yùn)用于移動(dòng)政務(wù)評(píng)論領(lǐng)域的文章數(shù)量整體較少。同時(shí),在情感分析方法的選擇中,運(yùn)用傳統(tǒng)情感分類方法如情感詞典的文章較多,但傳統(tǒng)情感分類方法主要依賴于情感詞典的構(gòu)建和判斷規(guī)則質(zhì)量,而兩者都需要耗費(fèi)很多人力(包括人工設(shè)計(jì)和先驗(yàn)知識(shí)),規(guī)則的質(zhì)量實(shí)質(zhì)上就決定了情感分類質(zhì)量。因此,結(jié)合以上背景與文獻(xiàn)梳理,本文嘗試探究的問題為:運(yùn)用方面級(jí)情感分析方法對(duì)移動(dòng)政務(wù)用戶評(píng)論進(jìn)行細(xì)粒度的情感挖掘,實(shí)現(xiàn)移動(dòng)政務(wù)用戶的情感傾向性測度與分析。
本文構(gòu)建的基于ABSA方法的移動(dòng)政務(wù)用戶情感傾向性評(píng)估基本流程具體步驟包括:(1)獲取用戶在線評(píng)論文本,并對(duì)評(píng)論文本進(jìn)行預(yù)處理,其中預(yù)處理包括設(shè)置停用詞、設(shè)定關(guān)鍵詞、分詞、詞性標(biāo)注、轉(zhuǎn)詞向量等標(biāo)準(zhǔn)化工作;(2)將進(jìn)行預(yù)處理后的評(píng)論文本輸入LDA主題模型,以實(shí)現(xiàn)關(guān)鍵評(píng)論實(shí)體的抽取與方面類別的抽取任務(wù);(3)將評(píng)論文本直接輸入BERT模型完成ABSA方法中情感傾向性判定的任務(wù);(4)測量評(píng)論實(shí)體級(jí)別的情感距離,進(jìn)而根據(jù)評(píng)論實(shí)體所屬方面的中心相關(guān)度計(jì)算方面級(jí)情感傾向性;(5)結(jié)合移動(dòng)政務(wù)用戶期待模型中劃分的方面層級(jí),根據(jù)次級(jí)方面的情感傾向性強(qiáng)度測量一級(jí)方面的情感傾向指數(shù),從而實(shí)現(xiàn)對(duì)地方政府政務(wù)APP的多維細(xì)粒度評(píng)估測量。
本文以APPStore上的政務(wù)APP為研究對(duì)象,篩選出截至2021年5月23日在APPStore上線期間評(píng)論量超過1000條的18個(gè)便民服務(wù)類政務(wù)APP,具體包括:浙里辦、江蘇政務(wù)服務(wù)、天府通辦、皖事通、云上貴州多彩寶、閩政通、遼事通、隨申辦、北京通、i深圳、鄭好辦、智慧南京、智慧青島、e福州、鄂匯辦、辦事通—一部手機(jī)辦事通、我的寧夏、椰城市民云。其中以省級(jí)政務(wù)APP為主,為滿足深度學(xué)習(xí)模型訓(xùn)練需求,爬取部分市級(jí)APP評(píng)論數(shù)據(jù)進(jìn)行訓(xùn)練集的補(bǔ)充,共采集數(shù)據(jù)42125條評(píng)論信息,并采集各APP的用戶在線評(píng)論進(jìn)行量化分析(數(shù)據(jù)采集格式示例見表1)。
表1 評(píng)論數(shù)據(jù)采集格式示例
數(shù)據(jù)采集后對(duì)評(píng)論數(shù)據(jù)進(jìn)行預(yù)處理工作,合并評(píng)論標(biāo)題與評(píng)論內(nèi)容,將其作為主要的文本研究數(shù)據(jù)。通過設(shè)置停用詞、進(jìn)行去重等方式,過濾掉無效評(píng)論,對(duì)評(píng)論文本進(jìn)行標(biāo)準(zhǔn)化清洗處理,清洗后的文本數(shù)據(jù)作為待使用數(shù)據(jù),共35744條評(píng)論信息。在數(shù)據(jù)清洗完成后,對(duì)采集的APP用戶在線評(píng)論語料進(jìn)行jieba分詞操作,對(duì)特征提取的輸入語料進(jìn)行初始化操作,以完成對(duì)輸入數(shù)據(jù)的預(yù)處理工作。
方面級(jí)情感分析可以拆解為兩項(xiàng)任務(wù)目標(biāo):子任務(wù)一的目標(biāo)是實(shí)現(xiàn)方面提取,而子任務(wù)二的目標(biāo)是實(shí)現(xiàn)情感分析。本文選取兩項(xiàng)子任務(wù)互相獨(dú)立的方式進(jìn)行實(shí)驗(yàn),其中兩項(xiàng)子任務(wù)可同時(shí)進(jìn)行,互不干擾。最終<方面,情感>二元組由子任務(wù)目標(biāo)的規(guī)則匹配進(jìn)行生成。
本文運(yùn)用LDA主題模型完成方面級(jí)情感分析子任務(wù)一——方面提取。LDA模型結(jié)構(gòu)包括三層:文檔、主題和詞語,可以進(jìn)行文本降維及主題聚類[30]。通過LDA主題模型的訓(xùn)練可以獲得“主題—詞”概率分布為p(wi|k|zk),wi|k是通過LDA主題模型抽取出的評(píng)論實(shí)體,代表了第k個(gè)主題下的第i個(gè)詞。評(píng)論文本語料經(jīng)過分詞處理后的其集合為D,LDA主題模型抽取出的評(píng)論實(shí)體所組成的集合為W,存在集合W∪D,對(duì)于元素中的集合存在wi|k∈D。p(wi|k|zk)在本質(zhì)上是LDA模型所抽取的評(píng)論實(shí)體與其所屬方面主題的中心相關(guān)度。
本文選擇運(yùn)用BERT模型完成方面級(jí)情感分析子任務(wù)二——情感分析。BERT是Google在2018年公開推出的一個(gè)基于深度雙向編碼器預(yù)訓(xùn)練的語言理解模型,已在評(píng)論實(shí)體識(shí)別、文本分類等多個(gè)NLP任務(wù)實(shí)驗(yàn)中取得比以前方法模型更高的精度[31]。情感分析任務(wù)的目的是給定評(píng)論實(shí)體,根據(jù)文本特征以及上下文內(nèi)容,按照分類目的給評(píng)論實(shí)體加上情感傾向標(biāo)簽并且得到具體評(píng)論實(shí)體的情感分布概率(積極、中性、消極)以實(shí)現(xiàn)傾向性情感判定。本文將數(shù)據(jù)采集中的移動(dòng)政務(wù)評(píng)分直接作為BERT輸入所需的情感分類標(biāo)簽,其中1、5分別定義為消極與積極情感,其余評(píng)分定義為中性情感。嘗試運(yùn)用BERT、LSTM、CNN、SVM以及KNN完成評(píng)論文本情感分類任務(wù),并對(duì)比了多模型的精確度、召回率與F1值,實(shí)驗(yàn)中訓(xùn)練集、驗(yàn)證集、測試集的劃分比例為6:2:2(多模型文本分類結(jié)果見表2)。
表2 多模型實(shí)驗(yàn)參數(shù)對(duì)比
由表2可以看出,BERT網(wǎng)絡(luò)對(duì)移動(dòng)政務(wù)評(píng)論文本識(shí)別F1值達(dá)到0.92以上,并且運(yùn)用BERT模型實(shí)現(xiàn)ABSA中的情感分類任務(wù)是有效的能夠獲得較高的精確度與召回率。
通過BERT模型所訓(xùn)練出的評(píng)論實(shí)體級(jí)別積極文本分布概率為p(pos|wi),代表了全部評(píng)論文本中第i個(gè)評(píng)論實(shí)體的積極情感傾向指數(shù);消極文本分布概率為p(neg|wi),代表了全部評(píng)論文本中第i個(gè)評(píng)論實(shí)體的消極情感傾向指數(shù)。θ為標(biāo)準(zhǔn)化系數(shù),通過對(duì)于同一主題方面類別的評(píng)論實(shí)體與主題的情感級(jí)別求加權(quán)平均值,可以分別得到該主題方面級(jí)別的積極情感指數(shù)(Aspectpos|zk)與消極情感指數(shù)(Aspectneg|zk),分別在式(1)與式(2)中定義:
本文借鑒了Kohavi和Wolpert提出的K-W差異模型[32],通過分析方面級(jí)別積極與消極情感的情感距離[33]可以得到評(píng)論文本方面級(jí)情感傾向指數(shù)(Aspect-levelzk),在式(3)中定義:
需要注意的是,本文對(duì)于方面屬性定義了兩個(gè)級(jí)別,分別是:一級(jí)方面和次級(jí)方面。因此,在本文的方面級(jí)情感傾向指數(shù)測算中,當(dāng)topic作為一級(jí)方面時(shí),k∈[1,4];而當(dāng)topic作為次級(jí)方面時(shí),k∈[1,10]。當(dāng)方面級(jí)的情感傾向指數(shù)小于0時(shí),證明該方面屬性的用戶消極情感相對(duì)較為強(qiáng)烈,公眾期待的滿足程度較低;反之,證明該方面屬性的用戶積極情感相對(duì)較為強(qiáng)烈,公眾期待的滿足程度較高。同時(shí),經(jīng)過多方面級(jí)別間的橫向?qū)Ρ龋梢园l(fā)現(xiàn)公眾期待的滿足程度較低的方面級(jí)因素,從而挖掘出當(dāng)前移動(dòng)政務(wù)工作的用戶痛點(diǎn)。
通過LDA主題模型的訓(xùn)練,可以得到形式為<方面,評(píng)論實(shí)體>的二元組合,通過LDA主題模型的評(píng)論文本進(jìn)行挖掘,得出結(jié)果(見表3),方面類別按照“文章—主題”相關(guān)度降序排列。用戶對(duì)于移動(dòng)政務(wù)的期待與需求主要圍繞使用自愿性、系統(tǒng)穩(wěn)定性、服務(wù)響應(yīng)性、功能協(xié)同性、系統(tǒng)適配性、內(nèi)容趣味性、內(nèi)容豐富性、界面交互性、系統(tǒng)流暢性、功能實(shí)用性這十個(gè)主題方面類別展開。
表3 LDA主題模型評(píng)論文本挖掘結(jié)果
本文結(jié)合期望確認(rèn)理論與信息系統(tǒng)成功模型,對(duì)LDA模型實(shí)現(xiàn)的評(píng)論詞聚類進(jìn)行評(píng)論目標(biāo)識(shí)別與特征歸類,認(rèn)為使用動(dòng)機(jī)、服務(wù)質(zhì)量、系統(tǒng)質(zhì)量與信息質(zhì)量是當(dāng)前中國公眾對(duì)于移動(dòng)政務(wù)的主要期待維度,并依此構(gòu)建移動(dòng)政務(wù)用戶需求模型(見圖2)。
圖2 移動(dòng)政務(wù)用戶需求模型
整體來看,移動(dòng)政務(wù)用戶需求模型為雙層模型,本文將LDA主題模型訓(xùn)練得到的主題方面屬性設(shè)定為次級(jí)方面,而將根據(jù)理論總結(jié)與主題歸類的四個(gè)維度屬性(使用動(dòng)機(jī)、服務(wù)質(zhì)量、系統(tǒng)質(zhì)量、信息質(zhì)量)設(shè)定為一級(jí)方面。
具體來看,公眾對(duì)于使用動(dòng)機(jī)的期待包括內(nèi)在因素與外在因素,內(nèi)在動(dòng)機(jī)主要指使用目標(biāo)的實(shí)現(xiàn),而外在動(dòng)機(jī)主要體現(xiàn)為社會(huì)接納。對(duì)于公眾而言,如“健康碼”等業(yè)務(wù)的普及成為公眾出行生活的常態(tài)化需求。從政府的角度來看,移動(dòng)政務(wù)應(yīng)用的下載量與使用量成為了衡量地區(qū)移動(dòng)政務(wù)發(fā)展水平和網(wǎng)絡(luò)可見度[34]的重要指標(biāo),于是有部分地區(qū)強(qiáng)迫基層公職單位與所屬事業(yè)單位部門人員進(jìn)行下載與推廣。而在LDA主題模型的文本挖掘的結(jié)果中,使用自愿性這一主題的文檔相關(guān)度最高,因此可以發(fā)現(xiàn)中國公眾對(duì)于使用自愿性的期待是十分強(qiáng)烈的。
公眾對(duì)于服務(wù)質(zhì)量的期待主要體現(xiàn)為服務(wù)響應(yīng)性與服務(wù)可靠性,當(dāng)前中國公眾對(duì)于移動(dòng)政務(wù)的可靠性期待基于對(duì)政府的信任,但當(dāng)科技公司成為移動(dòng)政務(wù)發(fā)展的重要中介時(shí),對(duì)技術(shù)以及科技公司的信任也會(huì)逐漸影響公眾對(duì)于可靠性期待的滿足。公眾對(duì)于服務(wù)響應(yīng)性的期待既包括對(duì)于用戶個(gè)性化需求反饋的期待,又包括部分便民業(yè)務(wù)辦理的即時(shí)性需求即對(duì)于響應(yīng)速度的期待。
中國公眾對(duì)于移動(dòng)政務(wù)系統(tǒng)質(zhì)量這一維度的期待屬性相對(duì)豐富,具體包括穩(wěn)定性期待、流暢性期待、適配性期待以及易用性期待。系統(tǒng)的穩(wěn)定性與流暢性可以提供給用戶愉悅的使用感受,產(chǎn)生心流體驗(yàn)從而提升用戶的持續(xù)使用能力。系統(tǒng)的適配性期待主要指向系統(tǒng)的運(yùn)行與維護(hù)狀況,由于移動(dòng)終端設(shè)備的多樣,統(tǒng)一的界面與程序就不可能滿足公眾的多樣化需求。系統(tǒng)的易用性期待旨在提升用戶完成目標(biāo)任務(wù)的能力以及使用實(shí)際產(chǎn)品的能力。從本質(zhì)上是提升公眾使用移動(dòng)政務(wù)應(yīng)用的能力,超過他們使用相應(yīng)非數(shù)字化產(chǎn)品的能力,以弱化實(shí)體政務(wù)大廳的可替代性,展現(xiàn)具有泛在化特征的移動(dòng)政務(wù)優(yōu)勢。
中國公眾在信息質(zhì)量這一層面上,期待咨詢獲取信息內(nèi)容的豐富性、完整性與趣味性。同時(shí),中國公眾強(qiáng)調(diào)共享性體驗(yàn)即信息功能的協(xié)同性需求,公眾期待在政務(wù)應(yīng)用內(nèi)部或同一地區(qū)多政務(wù)應(yīng)用間的個(gè)人數(shù)據(jù)是聯(lián)通的,不需要用戶進(jìn)行反復(fù)地填寫與驗(yàn)證。公眾期待存在于數(shù)字空間的移動(dòng)政務(wù)可以完全脫離物理空間的現(xiàn)實(shí)世界而存在,避免多次現(xiàn)實(shí)的交互,以增強(qiáng)政務(wù)應(yīng)用使用的沉浸感與持續(xù)性。最后,與一般性的移動(dòng)應(yīng)用相似,公眾對(duì)信息質(zhì)量也同樣存在著功能效用性的期待,移動(dòng)政務(wù)應(yīng)用使用行為的產(chǎn)生與持續(xù)需要有效觸發(fā)的連續(xù)呈現(xiàn),并且用戶的動(dòng)機(jī)和能力要高于臨界值才能激活觸發(fā)并做出行為。為了在移動(dòng)政務(wù)應(yīng)用設(shè)計(jì)中有效地利用觸發(fā),需要優(yōu)化界面設(shè)計(jì)、精簡流程,在操作流程中適當(dāng)?shù)那榫澈臀恢脼槔^續(xù)行動(dòng)提供行為號(hào)召。
本文對(duì)于評(píng)論文本數(shù)據(jù)通過BERT情感分析模型進(jìn)行情感3分類,測算出通過LDA抽取出的關(guān)鍵實(shí)體的積極情感分布概率與消極情感分布概率。并結(jié)合主題-詞匯相關(guān)度為情感分布概率賦值,測度出不同次級(jí)方面的Aspect-level。通過對(duì)于主題情感強(qiáng)度正負(fù)的判斷與情感傾向性指數(shù)可以了解當(dāng)前移動(dòng)政務(wù)在不同方面級(jí)別的情感滿足程度(其情感滿足程度見表4)。
表4 政務(wù)APP方面級(jí)情感傾向強(qiáng)度指數(shù)表
根據(jù)政務(wù)APP方面級(jí)情感傾向強(qiáng)度指數(shù)表可以發(fā)現(xiàn),在使用動(dòng)機(jī)、服務(wù)質(zhì)量、系統(tǒng)質(zhì)量、信息質(zhì)量四個(gè)公眾關(guān)注的方面之中,僅有服務(wù)質(zhì)量的Aspectlevel為正值,可見當(dāng)前中國公眾對(duì)移動(dòng)政務(wù)發(fā)展在服務(wù)質(zhì)量方面的需要被滿足程度較高。同時(shí),在一級(jí)方面層次進(jìn)行橫向?qū)Ρ?,可以發(fā)現(xiàn)中國公眾對(duì)移動(dòng)政務(wù)服務(wù)質(zhì)量總體上情感滿足程度相對(duì)較高,究其原因,一是電子證照的推廣重塑了行政審批的流程與形態(tài);二是“放管服”改革縮減了審批環(huán)節(jié)、壓縮了審批時(shí)間,縮減了公眾辦理業(yè)務(wù)的時(shí)間成本;三是對(duì)于用戶評(píng)論的問題以及建議反饋的及時(shí)性,匯聚民智,吸納民意有助于改善移動(dòng)政務(wù)服務(wù)質(zhì)量。
系統(tǒng)質(zhì)量和信息質(zhì)量兩個(gè)一級(jí)方面的消極情感傾向較為強(qiáng)烈,情感滿足程度較低。在信息質(zhì)量方面,功能協(xié)同性和內(nèi)容的豐富性是公眾產(chǎn)生消極情緒的主要因素。從具體的功能以及業(yè)務(wù)上看,登錄功能、身份認(rèn)證功能、健康碼功能是從評(píng)論文本中挖掘到的公眾使用熱點(diǎn)功能,但以上幾項(xiàng)功能卻在推廣過程中普遍的存在問題。究其原因:一是數(shù)據(jù)孤島的存在,數(shù)據(jù)共享問題仍廣泛的影響著民眾的使用感受;二是功能的流程設(shè)計(jì)仍然較為機(jī)械化,重復(fù)填寫數(shù)據(jù)與表單的問題仍然存在;三是功能與服務(wù)器的聯(lián)動(dòng)性需要加強(qiáng),許多公眾在評(píng)論中反饋到“無法接收驗(yàn)證碼”的問題,短信驗(yàn)證碼的延遲原因可能包括網(wǎng)絡(luò)延遲或服務(wù)器的通信延遲,要求政府部門在移動(dòng)政務(wù)的建設(shè)中既要在技術(shù)層面關(guān)注服務(wù)器的運(yùn)營與維護(hù),又要在功能設(shè)計(jì)中注意流程與通訊技術(shù)的適配環(huán)節(jié)。
在公眾較為關(guān)注的四個(gè)一級(jí)方面之中,系統(tǒng)質(zhì)量的Aspect-level最低,消極情感傾向強(qiáng)度最為強(qiáng)烈。但細(xì)化來看,該方面整體的消極情緒主要受系統(tǒng)流暢性的影響,其他三因素:系統(tǒng)穩(wěn)定性、系統(tǒng)適配性與界面易用性情感影響較小,甚至其中系統(tǒng)適配性會(huì)產(chǎn)生正向情緒影響。在現(xiàn)有關(guān)于移動(dòng)政務(wù)發(fā)展的研究中,尤其是結(jié)合信息系統(tǒng)領(lǐng)域的研究,學(xué)者多數(shù)在對(duì)策建議方面指出需要提升系統(tǒng)的整體質(zhì)量。從本研究結(jié)果來看,雖然系統(tǒng)質(zhì)量的確是移動(dòng)政務(wù)亟需改進(jìn)的方面,但其成為移動(dòng)政務(wù)發(fā)展的痛點(diǎn)的主觀原因是源于公眾在使用過程中的使用感受不佳:出現(xiàn)“閃退”“卡頓”“延遲”“加載”的現(xiàn)象,系統(tǒng)的流暢性不足嚴(yán)重削弱了公眾使用政務(wù)APP的滿足感,加劇了用戶的負(fù)面情緒。
對(duì)次級(jí)方面的情感傾向強(qiáng)度進(jìn)行橫向?qū)Ρ龋ㄒ妶D3)。首先,公眾對(duì)于政務(wù)APP的系統(tǒng)流暢性整體期待較高,但需求滿足程度卻呈現(xiàn)較低的狀態(tài),消極情緒在多個(gè)主題方面中最為強(qiáng)烈。且在系統(tǒng)流暢性方面,70%評(píng)論實(shí)體的消極情感傾向超過50%,政府相關(guān)的技術(shù)部門與所委托的科技公司的工作質(zhì)量在用戶登錄、信息加載、程序運(yùn)行、網(wǎng)絡(luò)流暢度等實(shí)體層次均亟需進(jìn)行提升;其次,功能的協(xié)同性也是當(dāng)前中國移動(dòng)政務(wù)發(fā)展的痛點(diǎn),尤其是公眾高頻業(yè)務(wù)的使用與系統(tǒng)承載力的協(xié)調(diào)問題;最后,在使用自愿性方面,許多學(xué)者都研究了持續(xù)使用政務(wù)APP的影響因素,但實(shí)際上個(gè)體的使用意愿在對(duì)政務(wù)APP的使用感受是存在顯著影響的。在APP的下載與使用動(dòng)機(jī)方面,使用者開始使用移動(dòng)政務(wù)本應(yīng)基于便利的實(shí)用性需求,但實(shí)際上政務(wù)APP被動(dòng)使用的情況是廣泛存在的。部分地區(qū)政務(wù)APP的評(píng)論中可以發(fā)現(xiàn),“攤派下載”的情況十分嚴(yán)重,從LDA主題模型訓(xùn)練出的“主題-詞”分布可以看到,在使用自愿性主體方面中,“強(qiáng)制”“下載”“任務(wù)”都是被訓(xùn)練得到的關(guān)鍵評(píng)論實(shí)體,同時(shí)“政府”“學(xué)?!薄搬t(yī)院”這些體制內(nèi)及其下屬單位都是承擔(dān)攤派下載任務(wù)的重要人群,從側(cè)面印證了當(dāng)前公眾在移動(dòng)政務(wù)發(fā)展中很關(guān)注使用行為的自愿性,強(qiáng)制性的使用要求會(huì)增加公眾的消極與厭煩情緒,不利于政府移動(dòng)政務(wù)相關(guān)工作滿意度的提升。
圖3 次級(jí)方面的情感傾向橫向?qū)Ρ?/p>
本文利用以上方法計(jì)算在線評(píng)論的情感強(qiáng)度,將評(píng)論集的四維屬性即使用動(dòng)機(jī)、服務(wù)質(zhì)量、系統(tǒng)質(zhì)量以及信息質(zhì)量作為政務(wù)APP在線評(píng)論的四維度屬性值計(jì)算方面級(jí)情感強(qiáng)度值,并通過該計(jì)算結(jié)果對(duì)各省級(jí)地方政府政務(wù)APP進(jìn)行排序(部分省級(jí)政務(wù)APP用戶口碑情感測量結(jié)果見表5)。
表5 政務(wù)APP用戶口碑情感測量結(jié)果
根據(jù)等級(jí)劃分規(guī)則和實(shí)驗(yàn)測量數(shù)據(jù),正面口碑效用排序結(jié)果從大到小依次為:浙里辦、云上貴州多彩寶、江蘇政務(wù)服務(wù)、天府通辦、鄂匯辦、皖事通、辦事通、閩政通、遼事通。用戶情感口碑計(jì)算結(jié)果較高的政務(wù)APP是浙里辦、云上貴州多彩寶、江蘇政務(wù)服務(wù)和天府通辦等,用戶對(duì)于這些政務(wù)APP的評(píng)論在整體評(píng)論中呈現(xiàn)積極正面的情感態(tài)度。用戶情感口碑等級(jí)稍低的政務(wù)APP是辦事通、閩政通和遼事通。
由于政務(wù)APP的特殊性導(dǎo)致用戶無法自由選擇替代性產(chǎn)品,導(dǎo)致用戶使用動(dòng)機(jī)的被動(dòng)性較高,加劇了用戶使用政務(wù)APP的負(fù)面情感傾向。自主選擇能力與人的自由需求息息相關(guān),具有內(nèi)在主動(dòng)性而進(jìn)行下載使用的用戶因其自由需求得到相對(duì)的滿足,因此更易對(duì)該軟件產(chǎn)生積極的情感傾向;反之,在個(gè)體被委派以“任務(wù)”的形式進(jìn)行強(qiáng)制性的政務(wù)APP的下載與推廣時(shí),就會(huì)引發(fā)個(gè)體抵抗與厭煩的消極情緒。因此,從研究結(jié)果來看,當(dāng)前中國公眾在對(duì)政務(wù)APP的使用自愿性上情感滿足是缺失的,為提升公眾的情感滿足程度,政府要實(shí)現(xiàn)體制內(nèi)的“凈化”,摒棄“唯數(shù)字”的傾向,改進(jìn)移動(dòng)政務(wù)的宣傳方式,通過不斷拓寬宣傳渠道讓公眾了解并自愿下載使用政務(wù)APP。
同時(shí),通過對(duì)在線評(píng)論的挖掘可以發(fā)現(xiàn),系統(tǒng)質(zhì)量是影響政務(wù)服務(wù)APP公眾滿意度的最主要因素,雖然在系統(tǒng)質(zhì)量這一維度中,系統(tǒng)穩(wěn)定性、系統(tǒng)適配性、界面友好性與系統(tǒng)流暢性都是公眾對(duì)移動(dòng)政務(wù)建設(shè)較為關(guān)注的方面維度。但從其實(shí)際的情感影響來看,系統(tǒng)流暢性是公眾對(duì)系統(tǒng)質(zhì)量所做出的情感反饋具有強(qiáng)度最高的情感影響。系統(tǒng)的流暢性直接影響著政務(wù)APP的可用程度,進(jìn)而影響著政務(wù)APP的口碑評(píng)價(jià)與普及。政府在開發(fā)政務(wù)APP的過程中,除了要在系統(tǒng)正式上線前要反復(fù)測試,確保系統(tǒng)流暢、可用,同時(shí)也要在系統(tǒng)正式上線后持續(xù)保持關(guān)注,實(shí)現(xiàn)技術(shù)部門或技術(shù)公司的定期系統(tǒng)維護(hù)工作,避免與手機(jī)系統(tǒng)版本不適配的問題發(fā)生,對(duì)發(fā)現(xiàn)的系統(tǒng)問題及時(shí)進(jìn)行版本的更新。
政務(wù)APP作為以政府為發(fā)布主體的移動(dòng)應(yīng)用仍應(yīng)遵循APP的基本設(shè)計(jì)邏輯。中國政府相對(duì)于企業(yè)而言,在收集公眾數(shù)據(jù)方面具有更強(qiáng)的天然優(yōu)勢。那么政府如何更好地去管理數(shù)據(jù)池,如何在部門間實(shí)現(xiàn)數(shù)據(jù)共享的同時(shí)去實(shí)現(xiàn)有效的數(shù)據(jù)治理就成為了“數(shù)字空間”政府發(fā)展的關(guān)鍵。從本文情感分析的研究結(jié)果來看,當(dāng)前中國公眾雖然對(duì)于移動(dòng)政務(wù)信息供給的創(chuàng)新性、趣味性、豐富性的情感反饋偏向中性態(tài)度,可見信息推送與供給的質(zhì)量并不是當(dāng)前中國移動(dòng)政務(wù)發(fā)展的重點(diǎn)。但從本文需求分析的研究結(jié)果來看,中國公眾對(duì)移動(dòng)政務(wù)信息推送的精準(zhǔn)度、更新的及時(shí)性、內(nèi)容的趣味性等方面是存在一定期待的。因此,在部分移動(dòng)政務(wù)發(fā)展較為先進(jìn)的地區(qū),在改善移動(dòng)政務(wù)痛點(diǎn)的基礎(chǔ)上,考慮如何運(yùn)用人工智能等新興數(shù)字技術(shù)提升政務(wù)APP信息供給的質(zhì)量是下一步移動(dòng)政務(wù)發(fā)展的重點(diǎn)。
為了進(jìn)一步驗(yàn)證本文所提出的基于ABSA方法測量情感傾向性強(qiáng)度方法的有效性,借鑒李吉等[35]論文的實(shí)驗(yàn)結(jié)果驗(yàn)證方式,將9個(gè)省級(jí)政務(wù)APP用戶評(píng)論的情感傾向性強(qiáng)度測量結(jié)果與專家評(píng)分結(jié)果進(jìn)行對(duì)比實(shí)驗(yàn)。筆者邀請(qǐng)了12名具有副高以上職稱的專家、7名第三方政務(wù)評(píng)估機(jī)構(gòu)工作人員以及15名高校碩士以上學(xué)歷的研究生組成專家組進(jìn)行政務(wù)APP使用情感評(píng)分。
專家組具有豐富的政務(wù)研究與評(píng)估經(jīng)驗(yàn),因此評(píng)分具有較大的可信度以及可靠性。實(shí)驗(yàn)過程中,需要專家組成員閱讀被隨機(jī)抽取的政務(wù)APP用戶評(píng)論,并從使用動(dòng)機(jī)、服務(wù)質(zhì)量、系統(tǒng)質(zhì)量以及信息質(zhì)量4個(gè)維度分別打分,然后對(duì)打分結(jié)果進(jìn)行加權(quán)平均,并最終匯總成情感傾向性強(qiáng)度得分。將其與本文計(jì)算結(jié)果進(jìn)行比較得到政務(wù)APP情感傾向性差異度(具體內(nèi)容見圖4)。
圖4 省級(jí)政務(wù)APP情感傾向性測量差異度
從圖4結(jié)果來看,本文提出的方法與人工方法的差異度值都小于0.4。其中,浙里辦、江蘇政務(wù)服務(wù)、天府通辦、云上貴州等政務(wù)APP情感強(qiáng)度測量差異較小,均低于0.25。遼事通和辦事通等政務(wù)APP情感強(qiáng)度測量差異度稍大,但總體仍小于0.4。由于很多服務(wù)事項(xiàng)在線上辦理過程中才能獲得最為真實(shí)的體驗(yàn),且專家組成員對(duì)于方面主題的內(nèi)涵認(rèn)知存在差異,導(dǎo)致專家組評(píng)分結(jié)果與情感強(qiáng)度計(jì)算結(jié)果稍有不同,但通過有效性測量可以發(fā)現(xiàn)結(jié)果分歧度較小。因此,本文運(yùn)用ABSA方法對(duì)移動(dòng)政務(wù)用戶評(píng)論進(jìn)行的細(xì)粒度情感分析結(jié)果具有較高的可信性與有效性。
本文結(jié)合系統(tǒng)成功模型與期望確認(rèn)模型將政務(wù)APP情感傾向性測度模型劃分為使用動(dòng)機(jī)、服務(wù)質(zhì)量、系統(tǒng)質(zhì)量以及信息質(zhì)量4個(gè)一級(jí)方面,運(yùn)用LDA模型挖掘了政務(wù)APP評(píng)論文本的隱式方面并定義為次級(jí)方面,通過BERT模型將關(guān)鍵評(píng)論實(shí)體情感傾向概率映射到評(píng)論實(shí)體所屬方面層級(jí)中并測量情感傾向度,實(shí)現(xiàn)了用戶需求隱式方面的抽取與情感傾向分析的細(xì)粒度分析。同時(shí)爬取18個(gè)政務(wù)APP在線評(píng)論數(shù)據(jù)用于模型訓(xùn)練,并選取9個(gè)在線評(píng)論量較多的省級(jí)政務(wù)APP進(jìn)行實(shí)例驗(yàn)證。
該研究在進(jìn)行過程中仍存在一些局限:首先,在系統(tǒng)穩(wěn)定性方面,根據(jù)情感傾向性指數(shù)測算結(jié)果發(fā)現(xiàn),積極情感與消極情感均較為強(qiáng)烈。其原因,是選取的18個(gè)不同地區(qū)的政務(wù)APP在系統(tǒng)穩(wěn)定性方面差距較大,兩級(jí)分化狀態(tài)較為明顯,在今后的研究中可以對(duì)多方面的正負(fù)情感分歧度進(jìn)行進(jìn)一步的橫向?qū)Ρ妊芯浚黄浯?,公眾關(guān)注的多重維度在情感上實(shí)際上是相互作用的。那么多種條件方面如何組合發(fā)揮作用,可以在后續(xù)研究中運(yùn)用fsQCA的方法,以全國各地方政府APP作為研究對(duì)象,運(yùn)用研究組態(tài)思想,以探究提升移動(dòng)政務(wù)工作的組合策略。