國 帥,王曉平,馬於帥,司海平
(1.河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,鄭州 450046;2.河南省金囤種業(yè)有限公司,鄭州 450000)
農(nóng)業(yè)綜合信息服務(wù)平臺依托現(xiàn)代信息技術(shù),以數(shù)據(jù)庫為核心,高度集成農(nóng)業(yè)實用技術(shù)、市場供求、產(chǎn)銷對接、生產(chǎn)經(jīng)營狀況、產(chǎn)業(yè)產(chǎn)值和農(nóng)作物產(chǎn)量等信息資源,以互聯(lián)網(wǎng)及各類終端設(shè)備為通信與共享渠道,面向空間離散、地域廣布、需求多樣的涉農(nóng)部門、企業(yè)與人員提供便捷、高效、全面的交互式、專業(yè)化、個性化的農(nóng)業(yè)信息服務(wù),為加強(qiáng)農(nóng)業(yè)信息服務(wù)監(jiān)管、落實農(nóng)業(yè)部門自身業(yè)務(wù)工作開展提供數(shù)據(jù)和信息技術(shù)支撐[1]。
隨著中國經(jīng)濟(jì)建設(shè)的快速發(fā)展,農(nóng)業(yè)已經(jīng)進(jìn)入了快速成長期,隨之也暴露出農(nóng)業(yè)綜合平臺的缺點以及不足之處,要更加客觀地評估平臺的綜合指標(biāo),就需要通過綜合績效提升平臺系統(tǒng)的易用性和便捷性。周友勝[2]對綜合信息服務(wù)平臺用戶需求及影響因素進(jìn)行了研究,通過整理農(nóng)戶個人基本信息特征、農(nóng)村綜合信息服務(wù)平臺需求的內(nèi)容、對信息平臺的使用和信息意識4個方面的數(shù)據(jù),利用Probit模型對變量進(jìn)行了定量分析,分析農(nóng)戶對農(nóng)村綜合信息服務(wù)平臺的了解狀況、用戶使用平臺信息的需求意愿及影響因素,最后根據(jù)得出的結(jié)論提出合理的建議對策。陳偉[3]分析了當(dāng)前農(nóng)業(yè)信息化建設(shè)存在的問題,將云計算模型引入農(nóng)業(yè)綜合信息服務(wù)平臺建設(shè)中,分析了云計算特點及其在農(nóng)業(yè)信息化中的優(yōu)勢,介紹了基于云技術(shù)的農(nóng)業(yè)綜合信息服務(wù)平臺建設(shè)方案,分析了平臺建設(shè)框架、服務(wù)分層、功能架構(gòu)以及在農(nóng)業(yè)生產(chǎn)過程中智能化的應(yīng)用,提出的建設(shè)方案對整合松散的農(nóng)業(yè)信息化資源、形成初步農(nóng)業(yè)信息云資源平臺具有一定的參考價值。
農(nóng)業(yè)綜合信息服務(wù)平臺屬于公益類、義務(wù)類、非營利性服務(wù)平臺,平臺升級與服務(wù)優(yōu)化缺乏競爭意識、用戶導(dǎo)向意識[4-6],構(gòu)建更完備的平臺績效評價體系并對平臺績效進(jìn)行量化評價分析,有利于整體推動農(nóng)業(yè)綜合信息服務(wù)平臺運(yùn)行效率的提升,各省級平臺績效的橫向?qū)Ρ纫灿欣谄脚_之間打破慣性思維、抓差補(bǔ)缺,更好地服務(wù)于區(qū)域農(nóng)業(yè)與經(jīng)濟(jì)的協(xié)調(diào)發(fā)展[7]?,F(xiàn)有平臺都是站在用戶使用角度以及便利性和方便性考慮,沒有提及客觀的績效評價指標(biāo),無法綜合多個維度方面來評價信息服務(wù)平臺的好壞。本研究在現(xiàn)有技術(shù)的基礎(chǔ)上,結(jié)合自然語言處理技術(shù)以及智能化技術(shù),提出基于本體的農(nóng)業(yè)綜合信息服務(wù)平臺績效評價模型。該模型綜合平臺資源、用戶體驗、服務(wù)效能3個維度評價系統(tǒng)平臺的績效,并引入層次結(jié)構(gòu)模型得出每個指標(biāo)的重要程度,便于量化指標(biāo),以期將所有的平臺進(jìn)行綜合評價對比,刻畫系統(tǒng)的便捷性與易用性。
非營利性服務(wù)平臺評價框架研究集中在評價指標(biāo)體系構(gòu)建、評價方法或模型設(shè)計以及指標(biāo)數(shù)據(jù)源獲取3個方面。
鑒于非營利性服務(wù)平臺的服務(wù)對象、服務(wù)內(nèi)容與服務(wù)特性,現(xiàn)有對平臺績效的評價指標(biāo)多圍繞其服務(wù)能力展開,包括界面設(shè)計、系統(tǒng)性能、網(wǎng)站質(zhì)量、內(nèi)容豐富度、網(wǎng)絡(luò)顯示度等平臺輸出式單向硬性指標(biāo),較少納入用戶評價、訪問頻率、使用效益等用戶反饋式軟性指標(biāo),未能構(gòu)建平臺與用戶雙向互動式的評價指標(biāo)體系。
當(dāng)前對于服務(wù)型平臺的績效評價指標(biāo)數(shù)據(jù)獲取或采用主觀調(diào)研方法,如專家評議內(nèi)容豐富度與網(wǎng)站質(zhì)量,或采用客觀量化方法,如借助網(wǎng)絡(luò)爬蟲提取網(wǎng)站鏈接數(shù)、網(wǎng)站PR值、網(wǎng)站在線訪問量,模擬多用戶并發(fā)訪問網(wǎng)站以統(tǒng)計服務(wù)器CPU與內(nèi)存消耗等。指標(biāo)數(shù)據(jù)具有不同的時效與顆粒度,如網(wǎng)站在線訪問量可以日為單位加以統(tǒng)計,內(nèi)容豐富度的獲取時效則由專家根據(jù)評議周期決定。此外,指標(biāo)數(shù)據(jù)體系龐大且無統(tǒng)一的規(guī)范性標(biāo)準(zhǔn),以人工收集與整理的指標(biāo)數(shù)據(jù)源獲取工作面臨較重的壓力。
在非營利性服務(wù)平臺績效評價模型方面,現(xiàn)有研究多沿用計算機(jī)、應(yīng)用數(shù)學(xué)等領(lǐng)域的成型理論與方法,如線性模型、Logistic回歸模型、層次分析法、模糊層次分析法、支撐向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)驅(qū)動模型更關(guān)注數(shù)理規(guī)律,較少關(guān)注評價對象和概念的語義關(guān)聯(lián)關(guān)系,未能建立動態(tài)評價機(jī)制[7]。
人工智能領(lǐng)域的學(xué)者Neches等對本體定義如下:給出構(gòu)成有關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,并運(yùn)用這些術(shù)語和關(guān)系組成規(guī)定這些詞匯外延的法則[8]。該定義中涉及4個關(guān)鍵詞,“領(lǐng)域”是指本體所描述的特定領(lǐng)域,如本文所研究的領(lǐng)域為農(nóng)業(yè);“術(shù)語”是指特定領(lǐng)域中的重要概念,如農(nóng)業(yè)領(lǐng)域中的生產(chǎn)對象、農(nóng)機(jī)設(shè)備、涉農(nóng)技術(shù)、生產(chǎn)過程等;“關(guān)系”是指基本術(shù)語之間的關(guān)系,可理解為類的層次結(jié)構(gòu),如術(shù)語“農(nóng)機(jī)設(shè)備”中包含了術(shù)語“插秧機(jī)”“收割機(jī)”,術(shù)語“插秧機(jī)”具有“插秧”用途屬性;詞匯外延法則是指對本體的約束,包括值約束、不相交描述、屬性約束等,如只有“插秧機(jī)技工”才能維修“插秧機(jī)”。在互聯(lián)網(wǎng)中,用戶可能會用不同的術(shù)語來表達(dá)相同的含義,或者一個術(shù)語含有多個含義,因此,消除術(shù)語差異是很有必要的。目前的解決方案是,對某個領(lǐng)域建立一個公共的本體,在涉及該領(lǐng)域時充分使用公共本體里的術(shù)語和規(guī)則,以便信息共享與理解。
根據(jù)工作原理與理論支撐的不同,本體評價方法可分為基本本體評價法、基于認(rèn)知心理學(xué)的本體評價法和以需求為導(dǎo)向的本體評價法3類[9]?;颈倔w評價法是其中惟一的量化方法,其主要包括黃金標(biāo)準(zhǔn)評價法、基于標(biāo)準(zhǔn)的本體評價法、基于具體任務(wù)的本體評價法,前2種方法或因局限于本體領(lǐng)域內(nèi)部研究而缺乏實用性,或因側(cè)重于外觀特性而忽略本體實際應(yīng)用,均不適用于本研究關(guān)于農(nóng)業(yè)綜合信息服務(wù)平臺績效評價?;诰唧w任務(wù)的本體評價法著眼于評價任務(wù)中的本體庫構(gòu)建,利用某一評價指標(biāo)與目標(biāo)本體間的相似度評價該指標(biāo)完成的有效程度,綜合具體任務(wù)的諸多評價指標(biāo)完成情況,以全面、客觀地評判具體任務(wù)。
績效評價指標(biāo)的選取與評價指標(biāo)體系的建立是農(nóng)業(yè)綜合信息服務(wù)平臺績效評價的首要環(huán)節(jié),農(nóng)業(yè)綜合信息服務(wù)平臺績效評價指標(biāo)選擇時,通常需要考慮其指標(biāo)數(shù)據(jù)的可獲取性、橫縱向可對比性、可量化表達(dá)的程度、量化數(shù)據(jù)的層次性以及評價體系對農(nóng)業(yè)綜合信息服務(wù)平臺績效的系統(tǒng)性刻畫與描述能力等。從系統(tǒng)性層面來看,評價體系框架應(yīng)能量化反映平臺運(yùn)用主體如農(nóng)技推廣部門、各級各類涉農(nóng)企業(yè)、農(nóng)業(yè)組織、農(nóng)村實用人才的相關(guān)活動,能為各類主體提供多樣化、個性化的農(nóng)業(yè)信息服務(wù),包括技術(shù)指導(dǎo)、數(shù)據(jù)查詢、市場分析等。從層次性層面來看,評價體系應(yīng)跳出當(dāng)前平臺功能定位,立足于農(nóng)業(yè)綜合信息服務(wù)內(nèi)容與服務(wù)成效設(shè)計評價指標(biāo)并劃分層次、匯總歸類,使得整個評價體系具有等級層次性與易操作性。從可對比性層面來看,評價指標(biāo)應(yīng)當(dāng)具有同級地區(qū)橫向可對比性與動態(tài)縱向可對比性,兼顧指標(biāo)的先進(jìn)性與關(guān)注度。最后,需要綜合考慮平臺績效與評價指標(biāo)以及指標(biāo)之間的關(guān)系,盡可能消除評價指標(biāo)之間的關(guān)聯(lián)性與重復(fù)性,提煉相關(guān)性較弱且能較全面表達(dá)平臺績效的影響因素作為農(nóng)業(yè)綜合信息服務(wù)平臺績效評價指標(biāo),從而構(gòu)建科學(xué)、合理、可行、全面的農(nóng)業(yè)綜合信息服務(wù)平臺績效評價指標(biāo)體系。
基于上述原則,農(nóng)業(yè)綜合信息服務(wù)平臺可從3個角度構(gòu)建“平臺-用戶”雙向互動式綜合績效評價指標(biāo)體系。
3.2.1 平臺資源 反映平臺的內(nèi)部業(yè)績與性能。農(nóng)業(yè)綜合信息服務(wù)平臺的資源主要分為2個部分,一是平臺信息內(nèi)容,包括平臺信息的數(shù)量和時效性等;二是平臺展示性能,包括平臺界面設(shè)計狀況、網(wǎng)站PR值、網(wǎng)站訪問速度和運(yùn)行穩(wěn)定性等。
平臺信息數(shù)量可由平臺管理員對所發(fā)布的信息總量加以統(tǒng)計;平臺信息的時效性即為平臺信息更新頻率,可由平臺管理員對每日新增信息進(jìn)行統(tǒng)計,按一定時間周期計算平臺信息更新頻率。平臺界面設(shè)計狀況可根據(jù)用戶對平臺的評論解析獲得,用戶評論是用戶在平臺中發(fā)表的評論,闡述其使用平臺的感受與想法,利用自然語言處理方法對評論進(jìn)行中文分詞和本體映射,提取出用戶對界面設(shè)計相關(guān)評論的關(guān)鍵詞,經(jīng)語義分析確定評論態(tài)度與觀點;網(wǎng)站PR值可利用Google PR值查詢工具查詢得到;網(wǎng)站訪問速度可通過模擬多用戶并發(fā)訪問操作,抓取頁面響應(yīng)時間作為網(wǎng)站訪問速度;通過多線程并發(fā)登錄的模擬測試,獲得網(wǎng)站最大訪問用戶量,作為運(yùn)行穩(wěn)定性指標(biāo)值。
3.2.2 用戶體驗 反映用戶對平臺使用的滿意程度。作為農(nóng)業(yè)綜合信息服務(wù)平臺的服務(wù)對象,用戶滿意度直接關(guān)系到平臺績效。用戶體驗由用戶自發(fā)式反饋,可體現(xiàn)在平臺信息瀏覽量、網(wǎng)站日平均訪問量、平臺信息轉(zhuǎn)發(fā)量、用戶評分和用戶使用情感等方面。
平臺信息瀏覽量可對信息鏈接的點擊量進(jìn)行統(tǒng)計;網(wǎng)站日均訪問量可運(yùn)行訪問量統(tǒng)計代碼,對單日內(nèi)平臺的用戶訪問量進(jìn)行匯總統(tǒng)計;平臺信息轉(zhuǎn)發(fā)量可利用網(wǎng)頁集成open install jssdk與域名等進(jìn)行統(tǒng)計;用戶評分是農(nóng)業(yè)綜合信息服務(wù)平臺向用戶提供的服務(wù)評分機(jī)制,統(tǒng)計用戶對平臺服務(wù)的打分;用戶評論中蘊(yùn)含的情感可直接體現(xiàn)用戶對平臺使用的滿意度。
3.2.3 服務(wù)效能 反映平臺在提供服務(wù)過程中所產(chǎn)生的效益。農(nóng)業(yè)綜合信息服務(wù)平臺向用戶提供農(nóng)業(yè)信息咨詢與技術(shù)推廣服務(wù),由用戶將所學(xué)所得轉(zhuǎn)為實際生產(chǎn)力與生產(chǎn)效益,因此平臺的服務(wù)效能主要體現(xiàn)在作物產(chǎn)量、作物收益等方面??紤]到農(nóng)業(yè)綜合信息服務(wù)平臺僅為知識或服務(wù)輸出型系統(tǒng),不涉及后續(xù)服務(wù)跟蹤與回訪,可對用戶有效評論進(jìn)行中文分詞、特征項提取和本體庫映射,提取有關(guān)服務(wù)效能的關(guān)鍵詞句。
根據(jù)上述構(gòu)建的評價指標(biāo)體系以及數(shù)據(jù)來源分析,結(jié)合獲取數(shù)據(jù)的屬性特性,設(shè)計農(nóng)業(yè)綜合信息服務(wù)平臺評價指標(biāo)及數(shù)據(jù)類型,如表1所示。
表1 農(nóng)業(yè)綜合信息服務(wù)平臺評價指標(biāo)及數(shù)據(jù)類型
根據(jù)“3.2”評價指標(biāo)數(shù)據(jù)來源可知,平臺界面設(shè)計狀況、用戶使用情感、作物產(chǎn)量增幅和生產(chǎn)效益增幅均無法通過網(wǎng)絡(luò)爬蟲技術(shù)或并發(fā)模擬統(tǒng)計得到,而是來源于用戶評論文本,需要對用戶評論加以解析與理解。文本語義解析的基礎(chǔ)即構(gòu)建績效評價本體庫,以該本體庫作為抽象知識,將用戶評論中的分詞特征項映射到本體庫中進(jìn)行語義相似度計算,實現(xiàn)對用戶評論的語義分析與理解,對用戶評論中涉及的指標(biāo)進(jìn)行數(shù)值提取或等級分類。本研究選擇OWL作為農(nóng)業(yè)綜合信息服務(wù)平臺績效評價本體描述語言[10],并基于此構(gòu)建績效評價本體庫,具體實現(xiàn)流程如下。
3.3.1 概念抽象 針對本研究平臺績效評價中需要進(jìn)行語義分析的指標(biāo),對其實體重要概念與主要特征進(jìn)行描述,主要包括界面設(shè)計、農(nóng)作物和生產(chǎn)效益,對上述概念進(jìn)一步細(xì)化,界面設(shè)計包括美觀設(shè)計、交互設(shè)計和邏輯設(shè)計等,農(nóng)作物包括大豆、玉米和小麥等,生產(chǎn)效益包括農(nóng)作物產(chǎn)量、產(chǎn)值和經(jīng)濟(jì)收入等。
3.3.2 概念定義 對“3.3.1”中抽象出的概念進(jìn)行定義,在本體庫中,所有的類都是物品“Thing”類的子類,上述概念“界面設(shè)計”“農(nóng)作物”“生產(chǎn)效益”的類分別定義為“Inference”“Crop”“Benefits”,上述概念所具備的屬性與詳細(xì)描述如表2所示。
表2 績效評價領(lǐng)域部分實體類的屬性與詳細(xì)描述
3.3.3 約束條件定義 對上述實體之間的約束條件加以定義,如“Crop”類中的農(nóng)作物產(chǎn)值與“Benefits”類中的生產(chǎn)效益等級二者之間是互為互逆關(guān)系的。
3.3.4 本體庫構(gòu)建 在農(nóng)業(yè)綜合信息服務(wù)平臺績效評價領(lǐng)域的實體、屬性、約束條件等定義的基礎(chǔ)上,采用Protégé軟件對本體進(jìn)行編輯,以O(shè)WL為本體描述語言,構(gòu)建績效評價本體庫。
3.3.5 創(chuàng)建本體實例 上述步驟可以實現(xiàn)基于OWL與Protégé的農(nóng)業(yè)綜合信息服務(wù)平臺績效評價領(lǐng)域本體庫構(gòu)建[11],在具體應(yīng)用中,需要對本體與屬性進(jìn)行實例化,創(chuàng)建績效評價的本體實例。
在績效評價指標(biāo)體系確定的基礎(chǔ)上,農(nóng)業(yè)綜合信息服務(wù)平臺的績效評價模型可分解為3步。
3.4.1 定義評價標(biāo)準(zhǔn) 對表1中的績效評價指標(biāo)需逐一確定評價標(biāo)準(zhǔn)。將研究對象集中在省級層面農(nóng)業(yè)綜合信息服務(wù)平臺,對于數(shù)值型指標(biāo),根據(jù)省級層面平臺績效的要求設(shè)置指標(biāo)分類等級共分為5級(優(yōu)、良、中、及格、不及格,值分別為4、3、2、1、0),如平臺信息數(shù)量在[0,102)定義為不及格;在[102,103)定義為及格;在[103,104)定義為中;在[104,105)定義為良,在[105,∞)定義為優(yōu)。對于等級類別型指標(biāo),提取出用戶評論關(guān)于指標(biāo)與指標(biāo)值的特征項后,利用本體映射與語義分析將指標(biāo)值映射到等級分類中,如“作物產(chǎn)量狀況”映射到“生產(chǎn)效益等級”中,確定具體的等級分類(優(yōu)、良、中、及格、不及格)。
3.4.2 確定指標(biāo)權(quán)重 對于農(nóng)業(yè)綜合信息服務(wù)平臺績效評價而言,本研究所構(gòu)建的評價指標(biāo)體系龐大、指標(biāo)眾多、對平臺績效的影響力不等,需要對指標(biāo)權(quán)重進(jìn)行確定。本研究采用層次分析法確定各指標(biāo)的權(quán)重,具體步驟如下。
1)建立遞階層次結(jié)構(gòu)模型。以省級農(nóng)業(yè)綜合信息服務(wù)平臺績效評價為研究對象,對影響平臺績效的一級指標(biāo)與二級指標(biāo)構(gòu)建遞階層次結(jié)構(gòu)模型。
2)構(gòu)造判斷矩陣。根據(jù)遞階層次結(jié)構(gòu)模型,按照從上至下的順序構(gòu)造判斷矩陣,判斷矩陣的取值來源于平臺績效評價準(zhǔn)則,根據(jù)對準(zhǔn)則的理解對矩陣中的元素進(jìn)行兩兩重要性對比分析,然后對判斷矩陣進(jìn)行權(quán)重賦值,判斷矩陣的取值采用如表3所示的九級標(biāo)度法。如將2個元素進(jìn)行對比,準(zhǔn)則中認(rèn)定前一個元素比后一個元素更為重要,且重要程度為強(qiáng)烈,則判斷矩陣的取值為7。
表3 判斷矩陣取值方法
3)層次單排序與一致性檢驗。對所構(gòu)造的判斷矩陣A進(jìn)行最大特征值λmax求解,其計算公式如下。
式中,A為判斷矩陣,W為判斷矩陣的特征向量,(AW)i為AW的第i個分量,λmax為判斷矩陣的最大特征值,n為影響因素數(shù)量。
由于判斷矩陣的結(jié)果具有一定的客觀性,因此需要進(jìn)行一致性檢驗分析,根據(jù)最大特征值計算判斷矩陣的一致性指標(biāo),其計算公式如下。
式中,C.I.為一致性指標(biāo)。
基于一致性指標(biāo)C.I.與平均隨機(jī)一致性指標(biāo)R.I.,可計算出隨機(jī)一致性比率檢驗數(shù),其計算公式如下。
式中,C.R.為隨機(jī)一致性比率檢驗數(shù),R.I.的取值與指標(biāo)數(shù)量有關(guān),在已知指標(biāo)數(shù)量n的前提下,可以通過查詢相關(guān)表得到R.I.的取值。對計算得到的C.R.進(jìn)行分析,若C.R.≤0.1,則表明判斷矩陣的一致性較好,否則認(rèn)為檢驗不合格,要修正判斷矩陣,直至符合滿意的一致性標(biāo)準(zhǔn)。
4)層次總排序。從上至下逐層計算各項評價指標(biāo)相對于平臺績效的影響綜合權(quán)重,最后得出各指標(biāo)對農(nóng)業(yè)綜合信息服務(wù)平臺績效影響值的排序結(jié)果。層次分析法采用優(yōu)先權(quán)重作為區(qū)分指標(biāo)影響程度的指標(biāo),權(quán)重的值域為[0,1],權(quán)重越大表明指標(biāo)重要性越高。
3.4.3 評價指標(biāo)賦分與評價結(jié)果計算 對照評分標(biāo)準(zhǔn),逐一對評價指標(biāo)進(jìn)行等級劃分與賦值(0、1、2、3、4),再利用各指標(biāo)權(quán)重對分值進(jìn)行加權(quán)計算,推算出農(nóng)業(yè)綜合信息服務(wù)平臺績效的綜合評價值。
表1所構(gòu)建的農(nóng)業(yè)綜合信息服務(wù)平臺績效評價指標(biāo)體系中,平臺信息數(shù)量、平臺信息更新頻率、平臺信息瀏覽量、網(wǎng)站日平均訪問量和平臺信息轉(zhuǎn)發(fā)量等指標(biāo)可由后臺統(tǒng)計獲得;網(wǎng)站PR值與用戶評分可由網(wǎng)絡(luò)爬蟲技術(shù)從Google PR值查詢頁面與平臺用戶評分頁面提取得到;網(wǎng)站訪問速度、運(yùn)行穩(wěn)定性則可以通過LoadRunner對平臺進(jìn)行多用戶并發(fā)訪問模擬獲得。本研究重點對用戶使用情感以及基于本體與語義分析的平臺界面設(shè)計狀況、作物產(chǎn)量狀況和經(jīng)濟(jì)收益狀況等數(shù)據(jù)獲取與處理過程進(jìn)行詳述。
4.1.1 用戶使用情感 利用網(wǎng)絡(luò)爬蟲技術(shù)獲取用戶在農(nóng)業(yè)綜合信息服務(wù)平臺上的評論,對用戶評論數(shù)據(jù)中暗含的情感進(jìn)行剖析,計算用戶對平臺的情感態(tài)度分值(0~1:消極至積極),其實現(xiàn)流程如下。
1)評論分詞。首先對用戶評論進(jìn)行分詞,本研究中利用Python的jieba庫進(jìn)行分詞,但是所分出來的詞中會帶有很多常見冠詞、連詞、名詞等,如“我”“的”等詞語,為減少后續(xù)情感分析的工作量,需要去除這些停用詞。先讀取本地的停用詞表,創(chuàng)建一個停用詞列表stopwordslist,然后讀取用戶評論,通過jieba庫進(jìn)行中文分詞,再與停用詞表中的詞進(jìn)行對比,相同的詞替換成空白,最終生成想要的分詞表。
2)情感分析。Python的中文NLP庫snowNLP可以根據(jù)輸入的評論分詞進(jìn)行判斷生成0~1的值,超過0.5就說明該評論是積極的,反之,就是消極的,數(shù)值越逼近0、1兩側(cè),評論中蘊(yùn)藏的情感越極端。snowNLP調(diào)用流程為在使用過程中將評論分詞讀取在鏈表中,由s=SnowNLP()逐個選取,然后通過s.sentiments進(jìn)行判斷得出情感態(tài)度分析結(jié)果,最后通過條形圖直觀地表現(xiàn)情感態(tài)度結(jié)果,snowNLP庫中對情感態(tài)度加以判斷使用的是貝葉斯算法。
4.1.2 基于本體的用戶評論語義分析與指標(biāo)分類賦值 從用戶評論的構(gòu)成來看,其基本元素為漢字和標(biāo)點符號,詞匯由漢字構(gòu)成,短語由詞匯構(gòu)成,最終形成完整的句子以及具有上下文的評論文章。在對自然語言進(jìn)行統(tǒng)計處理時(分詞、詞性標(biāo)注、句法淺層分析),需要對句子進(jìn)行精煉與形式化表達(dá),以便進(jìn)行后續(xù)的自然語言處理與理解。
向量空間模型VSM是當(dāng)前最為常用的句子形式化表示模型,本研究將其應(yīng)用于對用戶評論中各語義特征項進(jìn)行形式化表達(dá)。VSM中的項是指用戶評論中的特征項,包括字、詞匯、短語等,定義ti為用戶評論中的特征項,則中文句子可表達(dá)為:
式中,SE為中文句子的特征項表達(dá),n為中文句子的特征項數(shù)量。
對用戶評論進(jìn)行向量化表示,通常一個中文句子對應(yīng)一個向量,其結(jié)構(gòu)如公式(4)所示,則擁有多個句子的用戶評論可表示為由多個向量構(gòu)成的矩陣。本體映射可以通過句子向量與本體向量之間的內(nèi)積或夾角余弦等進(jìn)行計算與表示。
利用規(guī)則方法對用戶評論文本進(jìn)行深層次分析??紤]到用戶評論的隨意性與自發(fā)性特征,如果使用詞類與句法范疇編寫文法規(guī)則,難以對其進(jìn)行規(guī)則套用與語法分析,因此,本研究采用語義類對文法規(guī)則進(jìn)行編寫。與句法結(jié)構(gòu)類似,基于語義類對文法規(guī)則進(jìn)行表達(dá)與刻畫的方式沿用樹形結(jié)構(gòu),在編寫好農(nóng)業(yè)綜合信息服務(wù)平臺績效評價領(lǐng)域的語義語法后,可利用規(guī)則方法對該領(lǐng)域用戶評論進(jìn)行句法分析。本研究采用基于動態(tài)文法的Phoenix分析器進(jìn)行句法分析,實現(xiàn)流程如下。
2)從句子的左端開始,依次匹配每個活動槽,通過詞序列與本體的匹配生成句子的語義樹結(jié)構(gòu),并將語義樹結(jié)構(gòu)存儲在節(jié)點序列中,其數(shù)據(jù)結(jié)構(gòu)如下。
3)將構(gòu)建好的語義樹結(jié)構(gòu)按照XML格式進(jìn)行存儲與表達(dá),如用戶評論“咨詢了平臺專家關(guān)于水稻種子霉?fàn)€蛀蟲問題,采納了專家的處理方法,種子的出芽率高了一些”,可將其按照類別進(jìn)行標(biāo)記,如其根節(jié)點標(biāo)記為Query-Benefits,意為“咨詢成效”,其子 節(jié) 點 標(biāo) 記 為“Data-Seed”“Problem-Moth”“Benefits-Effective”“Data-Seed”的 子 節(jié) 點 為“Attribute-Bud”,具體結(jié)構(gòu)通過規(guī)則分析、語義樹結(jié)構(gòu)構(gòu)建,最終可用XML表達(dá)如下。
首先確定一級指標(biāo)的權(quán)重。本研究中一級指標(biāo)包括平臺資源、用戶體驗和服務(wù)效能3個評價指標(biāo),立足于省級農(nóng)業(yè)綜合信息服務(wù)平臺績效考評準(zhǔn)則,對一級評價指標(biāo)兩兩之間的對比重要性進(jìn)行分析,并標(biāo)度各一級指標(biāo)的重要性,一級評價指標(biāo)的重要性標(biāo)度如表4所示,平臺資源與服務(wù)效能相比,其重要性之比為2∶1。
表4 一級指標(biāo)的重要性標(biāo)度
通過表4構(gòu)造判斷矩陣:
根據(jù)判斷矩陣計算最大特征值λmax為1.042,一致性指標(biāo)C.I.為0.011 67,C.R.=0.024 3≤0.1,則表明判斷矩陣的一致性較好,符合一致性標(biāo)準(zhǔn),無需對判斷矩陣進(jìn)行修正。平臺資源的權(quán)重為0.4,用戶體驗的權(quán)重為0.4,服務(wù)效能的權(quán)重為0.2。
同樣基于績效考評準(zhǔn)則對一級指標(biāo)下細(xì)分的各二級指標(biāo)兩兩之間的對比重要性進(jìn)行分析,在對所有二級指標(biāo)的權(quán)重計算完畢后,得到各一級指標(biāo)下的層次單排序:
根據(jù)確定好的一級指標(biāo)權(quán)重以及上述層次單排序,從上至下逐層計算各二級指標(biāo)影響農(nóng)業(yè)綜合信息服務(wù)平臺績效的綜合權(quán)重,結(jié)果如表5所示。
由表5可知,平臺資源和用戶體驗對農(nóng)業(yè)綜合信息服務(wù)平臺績效影響較大,其權(quán)重均為0.4,比服務(wù)效能指標(biāo)權(quán)重高0.2,權(quán)重越大表示其影響因子越大,對結(jié)果貢獻(xiàn)度越高。在平臺資源二級指標(biāo)中,網(wǎng)站訪問速度權(quán)重最大,為0.084,是影響較大的一個因素;在用戶體驗二級指標(biāo)中,用戶評分和網(wǎng)站日平均訪問量權(quán)重較大,均為0.092,是影響較大的因素;在服務(wù)效能二級指標(biāo)中,作物產(chǎn)量狀況權(quán)重最大,為0.112,且在所有二級指標(biāo)中影響最大,主要原因是農(nóng)業(yè)綜合信息服務(wù)平臺主要是為了便捷地解決用戶的問題,而作物產(chǎn)量狀況直接影響到用戶的表達(dá)傾向和訴求傾向。
表5 農(nóng)業(yè)綜合信息服務(wù)平臺績效影響因素的權(quán)重
通過爬取與搜集中國東部、中部、西部地區(qū)的代表省份江蘇、河南、云南3省2020年的平臺日志信息以及用戶評論信息,按照上文中的指標(biāo)維度進(jìn)行劃分,并對用戶評論文本進(jìn)行清洗和分詞,運(yùn)用NLP技術(shù)將評論數(shù)據(jù)轉(zhuǎn)化成情感指標(biāo)數(shù)據(jù),情感值越大表示用戶對系統(tǒng)的喜歡程度越高,更能體現(xiàn)系統(tǒng)的用戶黏性。得到對應(yīng)指標(biāo)后,通過本研究提出的層次分析法確定各指標(biāo)的權(quán)重,并根據(jù)表5的權(quán)重對應(yīng)加權(quán)和,得到江蘇省、河南省、云南省的農(nóng)業(yè)綜合信息服務(wù)平臺的績效分別為3.17、3.25、2.86,即河南?。窘K?。驹颇鲜?。為了測試結(jié)果的準(zhǔn)確性,本研究隨機(jī)抽取各平臺的1 000個用戶,并參考本研究中的二級指標(biāo)對用戶進(jìn)行調(diào)研,每個指標(biāo)滿分為100分,最后將所有指標(biāo)加權(quán)求平均值,得到河南省、云南省、江蘇省的農(nóng)業(yè)綜合信息服務(wù)平臺績效評分分別為83.25、80.32、83.07分,其排序結(jié)果為河南?。窘K?。驹颇鲜?,與本研究對農(nóng)業(yè)綜合信息服務(wù)平臺的績效評價結(jié)果相符,因此證明本研究評價方法具有實際使用價值。
農(nóng)業(yè)綜合信息服務(wù)平臺是農(nóng)業(yè)信息服務(wù)體系的重要組成部分,在農(nóng)業(yè)信息化時代發(fā)揮重要作用。本研究針對農(nóng)業(yè)綜合信息服務(wù)平臺的非營利性特征,從平臺資源、用戶體驗和服務(wù)效能3個角度構(gòu)建“平臺-用戶”雙向互動式綜合績效評價指標(biāo)體系?;诖?,綜合網(wǎng)絡(luò)爬蟲技術(shù)、本體評價法、自然語言處理與語義分析技術(shù)對農(nóng)業(yè)綜合信息服務(wù)平臺的績效數(shù)據(jù)源進(jìn)行采集與處理;利用層次分析法確定績效評價指標(biāo)權(quán)重;并利用加權(quán)計算法獲得農(nóng)業(yè)綜合信息服務(wù)平臺績效,以量化評定各省級平臺的農(nóng)業(yè)信息服務(wù)成效。結(jié)果表明,平臺資源和用戶體驗對農(nóng)業(yè)綜合信息服務(wù)平臺績效影響較大;江蘇省、河南省和云南省農(nóng)業(yè)綜合信息服務(wù)平臺績效評價結(jié)果分別為3.17、3.25、2.86,經(jīng)驗證本研究評價方法具有實際使用價值。對于低績效的省份,應(yīng)根據(jù)指標(biāo)的重要程度,提升對應(yīng)的服務(wù)質(zhì)量;對于高績效的省份,應(yīng)樹立標(biāo)桿,加強(qiáng)省份之間的合作,為共同建立高質(zhì)量的服務(wù)平臺打下堅實的基礎(chǔ)。
當(dāng)前全國涉農(nóng)服務(wù)平臺網(wǎng)站很多,但是規(guī)模大、綜合服務(wù)水平高的不多,農(nóng)業(yè)綜合信息服務(wù)平臺作為面向涉農(nóng)人員提供知識與技術(shù)支持的公益性平臺,應(yīng)當(dāng)著力增加特色農(nóng)業(yè)專題數(shù)據(jù)庫量、互補(bǔ)性資源鏈接量,根據(jù)當(dāng)?shù)靥厣l(fā)展特色化服務(wù);同時,平臺應(yīng)順應(yīng)潮流推出相應(yīng)的App,融合微博、微信等不同應(yīng)用軟件,提供更加全面的服務(wù),以滿足不同群體的涉農(nóng)用戶需求。