關(guān)鍵詞:Fisher判別;農(nóng)事氣象;問答服務(wù);技術(shù)與應(yīng)用;浙江省
中圖分類號:P409;TP399 文獻(xiàn)標(biāo)識碼:A
文章編號:0439-8114(2025)07-0182-04
DOI:10.14088/j.cnki.issn0439-8114.2025.07.031 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Technology and application of agrometeorological Qamp;A service based on Fisher discriminant
CHENChong1,XIAOJing-jing2,LIJian1
(1.ZhejiangMeteorologicalServiceCenter,Hangzhou310o53,China;2.ZhejiangClimateCenter,Hangzhou310o3,Cina)
Abstract:TotthedemandforefcintagrometeorologicalservicsnagrometeorologicalQamp;AservicethologysedF erdiscrminantasproposd.Tesecificiplementationprocesoftistcholgyasescibed,indngdatacolltioatue extraction,modelconstructionandQamp;Asystemconstruction.Byintegratingthistechnologyintothe“Zhihui Qixiang”applicationreleasedbyZhejiang meteorologicaldepartment,theintellgentQamp;Ainteractionfunctionbetweenusersandteaplicationwasrealized. Testsandapplicationsshowedthatthisechologyhadertainefectsinimprovingtheficiencyofagrometeorologicalservices,enhancing service convenience and increasing user satisfaction.
Key Words:Fisher discriminant;agrometeorology;Qamp;A service;technology and application; Zhejiang Province
農(nóng)業(yè)作為國民經(jīng)濟(jì)的重要支柱產(chǎn)業(yè),在推動區(qū)域經(jīng)濟(jì)增長、保障糧食安全的同時,顯著提升了農(nóng)戶收入水平,為鄉(xiāng)村振興戰(zhàn)略實施提供了關(guān)鍵支撐。傳統(tǒng)農(nóng)業(yè)氣象服務(wù)渠道存在智能化水平不足、服務(wù)效率低與及時性差等問題,難以滿足農(nóng)戶日益增長的多樣化需求[1-4],因此研究高效便捷的農(nóng)業(yè)氣象信息對接技術(shù)顯得尤為重要,
Hua等5提出輕量化與低成本的分布式農(nóng)業(yè)服務(wù)系統(tǒng),通過整合社會與物理信息為農(nóng)戶提供決策支持;Qian等創(chuàng)新性地將知識圖譜與自然語言處理技術(shù)相結(jié)合,構(gòu)建了面向農(nóng)業(yè)種植的智能決策支持系統(tǒng),該系統(tǒng)能夠基于區(qū)域環(huán)境特征為農(nóng)戶提供精準(zhǔn)的種植建議和病蟲害防治方案。 Li[7] 設(shè)計了農(nóng)業(yè)耕作技術(shù)的知識圖模型,基于現(xiàn)有的深文本匹配算法提出BERT ?+ DSSM算法,提高了農(nóng)戶在相關(guān)知識問答方面的精準(zhǔn)性;Zhao等8提出氣候智能型農(nóng)業(yè)框架,通過技術(shù)創(chuàng)新與全球合作機(jī)制,提升糧食系統(tǒng)韌性,為農(nóng)戶提供可持續(xù)農(nóng)業(yè)發(fā)展途徑;Talwani等[9]提出農(nóng)業(yè)智能技術(shù)整合框架,通過融合機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、大數(shù)據(jù)與網(wǎng)絡(luò)技術(shù),優(yōu)化現(xiàn)有農(nóng)業(yè)系統(tǒng)效能并強(qiáng)化安全性,為農(nóng)戶提供精準(zhǔn)化生產(chǎn)支持;Venkata等[10闡述了基于自然語言處理技術(shù)的對話式智能機(jī)器人的相關(guān)內(nèi)容,通過集成物聯(lián)網(wǎng)智能農(nóng)業(yè)系統(tǒng),為大多數(shù)農(nóng)戶提供種植指導(dǎo)與市場對接支持,實現(xiàn)降本增效。
本研究基于Fisher判別的統(tǒng)計模式識別算法構(gòu)建智能問答系統(tǒng)。首先采集并預(yù)處理用戶提問內(nèi)容,完成特征提取與選擇;然后進(jìn)行模型構(gòu)建與訓(xùn)練,用于確定農(nóng)事問題類別;最后通過問答系統(tǒng)在農(nóng)業(yè)氣象服務(wù)知識庫中檢索相關(guān)知識并返回答案,以此實現(xiàn)高效便捷的農(nóng)事氣象問答服務(wù)。
1 資料來源與處理
1.1 作物
農(nóng)業(yè)氣象服務(wù)所涉及的作物主要針對南方地區(qū)廣泛種植的品類,其涵蓋了糧食作物、林果作物及經(jīng)濟(jì)作物三大類型。糧食作物主要為雙季早晚稻與單季稻;林果作物主要為柑橘、楊梅和葡萄;經(jīng)濟(jì)作物主要為茶樹等。
1.2 氣象數(shù)據(jù)
氣象數(shù)據(jù)分為監(jiān)測數(shù)據(jù)和預(yù)報數(shù)據(jù)兩部分。監(jiān)測數(shù)據(jù)來自浙江省多要素自動氣象站,采用插值法生成網(wǎng)格數(shù)據(jù),其中,分鐘監(jiān)測數(shù)據(jù)的更新頻率為每10min 1 次,小時監(jiān)測數(shù)據(jù)為每1h1次,網(wǎng)格規(guī)格為5km×5km 。預(yù)報數(shù)據(jù)采用浙江省智能網(wǎng)格預(yù)報的多要素資料,預(yù)報更新頻次為 24h 內(nèi)每1h1次, 24~ 72h 每 6h1 次, 72~168h 每 12h1 次,網(wǎng)格規(guī)格為2.5km×2.5km 。
1.3 Fisher判別
Fisher判別[11-14]是將高維數(shù)據(jù)投影到低維空間,通過計算各類別樣本均值向量、類內(nèi)散度矩陣和類間散度矩陣求解廣義特征值問題,得到投影向量,構(gòu)建Fisher判別函數(shù)。采用一對多或一對一策略處理多類別問題,依據(jù)判別值確定新樣本類別,最終將原始高維數(shù)據(jù)乘以投影矩陣完成投影,實現(xiàn)數(shù)據(jù)有效分類。在農(nóng)事氣象問答服務(wù)場景中,用戶提問數(shù)據(jù)維度豐富且復(fù)雜,常涵蓋氣象要素數(shù)據(jù)、作物數(shù)據(jù)等,F(xiàn)isher判別能夠有效處理這類多維數(shù)據(jù),對問題分類能起到關(guān)鍵作用。
1.4 算法實現(xiàn)
1.4.1用戶提問與預(yù)處理農(nóng)戶根據(jù)自身需求通過問答服務(wù)對話框輸入文字咨詢,包括氣象災(zāi)害影響類、作物生長適宜度氣候類、農(nóng)事操作建議類、農(nóng)情應(yīng)對措施類、作物病蟲害防治類、農(nóng)業(yè)生產(chǎn)資料選用類、農(nóng)產(chǎn)品市場信息類及農(nóng)業(yè)政策法規(guī)解讀類相關(guān)信息。當(dāng)農(nóng)戶輸人農(nóng)事問題時,對問題進(jìn)行自然語言預(yù)處理,通過分詞、詞性標(biāo)注等方法進(jìn)行分析。首先將用戶提問文本切分為多個詞語;然后去除無實際意義的停用詞,獲取關(guān)鍵詞;最后對部分詞語進(jìn)行詞形還原,以便后續(xù)處理,文本預(yù)處理流程如圖1所示。1.4.2特征提取針對不同類型的問題內(nèi)容,采用多模態(tài)特征提取策略。對于常規(guī)氣象信息,如溫度、風(fēng)速、壓強(qiáng)及濕度等,標(biāo)準(zhǔn)化處理后直接作為數(shù)值型特征;對于農(nóng)業(yè)領(lǐng)域相關(guān)的作物信息,提取其關(guān)鍵農(nóng)藝特征(作物品種、生育時期及生長狀態(tài)等);其他文本信息采用 TF-IDF(Term frequency-inverse docu-mentfrequency)加權(quán)[i5與文本嵌入相結(jié)合的方法進(jìn)行特征表示。通過特征拼接融合生成最終的多維特征向量,該向量為氣象特征、農(nóng)藝特征及其他文本特征的集合。
圖1文本預(yù)處理流程
1)氣象特征。將天氣現(xiàn)象描述(如陰天)轉(zhuǎn)換為國際標(biāo)準(zhǔn)天氣代碼體系的對應(yīng)數(shù)值;對于溫度的相關(guān)表述,通過對比浙江省氣象局歷史同期溫度基準(zhǔn)數(shù)據(jù),計算溫度特征值,計算式如下。
式中 Ψ,fT 為溫度特征值; Tcur 為當(dāng)前溫度; Tthr 為歷史同期溫度 ;fE 為其他氣象要素的特征值; Ecur 為當(dāng)前其他氣象要素; Ethr 對應(yīng)要素歷史同期值。
2)農(nóng)藝特征。依據(jù)特定的作物名稱確定作物類型,根據(jù)作物生長狀態(tài)描述確定作物生長階段。對作物類型和生長階段分別進(jìn)行編碼,問答服務(wù)涉及作物類型編碼 (v) 和作物生長階段編碼 (u) 。
3)其他文本特征。采用TF-IDF算法將處理后的文本轉(zhuǎn)化為數(shù)值特征向量。
TF-IDF(w,d)=TF(w,d)×IDF(w)
式中, TF(w,d) 為詞語 w 在文檔 d 中的標(biāo)準(zhǔn)化詞頻; nw,d 為詞語 w 在文檔中 d 出現(xiàn)的次數(shù); 為文檔 d 中所有詞語的出現(xiàn)次數(shù)之和; IDF(w) 為逆文檔頻率; |D| 為文檔總數(shù);
為包含詞語 w 的文檔數(shù)。 TF/-IDF(w,d) 為詞語 w 在文檔 d 中的 TF-IDF 值。提取關(guān)鍵詞和關(guān)鍵短語作為特征,將所有詞語的 TF/-IDF(w,d) 組合成一個特征向量 (vtext) 。
1.4.3 模型構(gòu)建與訓(xùn)練
1)模型構(gòu)建。結(jié)合文獻(xiàn)[16,17]對農(nóng)業(yè)氣象服務(wù)的研究,確立了8個農(nóng)業(yè)氣象服務(wù)問題類別,分別為氣象災(zāi)害影響類、作物生長適宜度氣候類、農(nóng)事操作建議類、農(nóng)情應(yīng)對措施類、作物病蟲害防治類、農(nóng)業(yè)生產(chǎn)資料選用類、農(nóng)產(chǎn)品市場信息類及農(nóng)業(yè)政策法規(guī)解讀類?;贔isher判別構(gòu)建農(nóng)事氣象問答服務(wù)模型將經(jīng)過特征提取和選擇的數(shù)據(jù)作為輸入,模型的輸出為對應(yīng)的農(nóng)事問題類別。模型結(jié)構(gòu)包括輸入層、投影層和輸出層。輸人層接收特征向量,輸出層根據(jù)投影后的特征進(jìn)行分類預(yù)測,得到問題的答案類別。
2)訓(xùn)練。基于選定的特征訓(xùn)練樣本并優(yōu)化模型參數(shù),生成判別函數(shù)(圖2);根據(jù)后驗概率最大準(zhǔn)則對農(nóng)業(yè)氣象服務(wù)問題進(jìn)行分類。
圖2判別函數(shù)生成過程
1.4.4 問答系統(tǒng)實現(xiàn)
Step1:當(dāng)用戶輸入農(nóng)事問題時,系統(tǒng)對問題進(jìn)行自然語言處理,將其轉(zhuǎn)化為機(jī)器能夠理解的特征向量。通過分詞、去除停用詞、詞形還原等技術(shù)提取問題中的關(guān)鍵信息。
Step2:從用戶提問中提取氣象特征、農(nóng)藝特征、其他文本特征。
Step3:隨機(jī)選取部分農(nóng)業(yè)氣象服務(wù)問題數(shù)據(jù)進(jìn)行樣本訓(xùn)練,確定判別函數(shù)。
Step4:根據(jù)問題分類結(jié)果,通過關(guān)鍵詞匹配,在農(nóng)業(yè)氣象服務(wù)知識庫中檢索相關(guān)知識,篩選出最相關(guān)內(nèi)容。
Step5:將生成的答案通過信息服務(wù)端反饋給用戶,完成問答服務(wù)流程
2 試驗結(jié)果與分析
針對農(nóng)業(yè)氣象問題分類任務(wù),基于約80000條用戶問題數(shù)據(jù),從分類準(zhǔn)確性和系統(tǒng)應(yīng)用效果2個維度開展綜合評估。
2.1 準(zhǔn)確性評估
從80000條問題中按8個類別(氣象災(zāi)害影響類、作物生長適宜度氣候類、農(nóng)事操作建議類、農(nóng)情應(yīng)對措施類、作物病蟲害防治類、農(nóng)業(yè)生產(chǎn)資料選用類、農(nóng)產(chǎn)品市場信息類及農(nóng)業(yè)政策法規(guī)解讀類)進(jìn)行抽樣,每個類別選取1000條樣本(共8000條)?;跇?gòu)建的分類模型進(jìn)行智能識別,分類結(jié)果如圖3、表1所示,其中零散點(diǎn)為未正確歸類樣本。結(jié)果表明,基于Fisher算法構(gòu)建的農(nóng)業(yè)氣象問答分類模型在測試集上的準(zhǔn)確率達(dá) 86.5% ,充分驗證了訓(xùn)練數(shù)據(jù)集的可靠性及該算法在本場景中的適用性。
圖3分類效果分布
對剩余72000條問題進(jìn)行批量分類處理,從分類結(jié)果中選取 10% 的樣本(共7200條)開展可靠性驗證工作,將驗證結(jié)果繪制成ROC曲線(圖4)。結(jié)果表明,基于Fisher算法構(gòu)建的農(nóng)業(yè)氣象問答分類模型表現(xiàn)良好, .AUC 達(dá) 84% ,表明抽取樣本的分類效果達(dá)到預(yù)期標(biāo)準(zhǔn)。這一驗證過程充分證明了分類模型在實際應(yīng)用中的可靠性。
表1分類模型識別結(jié)果 (單位:條)
注:1~8分別為氣象災(zāi)害影響類、作物生長適宜度氣候類、農(nóng)事操作建議類、農(nóng)情應(yīng)對措施類、作物病蟲害防治類、農(nóng)業(yè)生產(chǎn)資料選用類、農(nóng)產(chǎn)品市場信息類及農(nóng)業(yè)政策法規(guī)解讀類
圖4樣本分類驗證的ROC曲線
圖5農(nóng)事問答服務(wù)界面
2.2 應(yīng)用效果評估
農(nóng)事氣象智能問答系統(tǒng)在“智慧氣象”APP的“天氣小諸葛”模塊成功落地應(yīng)用。自2023年系統(tǒng)上線至2025年3月,該模塊月均訪問量達(dá)46.7萬次,較技術(shù)應(yīng)用前提升 32.6% 。問答服務(wù)界面如圖5所示。實證研究表明,農(nóng)事氣象智能問答系統(tǒng)的部署提升了平臺用戶活躍度并優(yōu)化了用戶體驗滿意度。
3 小結(jié)
Fisher算法在農(nóng)事氣象問答服務(wù)領(lǐng)域展現(xiàn)出顯著優(yōu)勢。通過數(shù)據(jù)采集與預(yù)處理、特征提取與選擇、模型構(gòu)建與訓(xùn)練以及開發(fā)問答系統(tǒng)等步驟,為農(nóng)戶提供了高效的農(nóng)事服務(wù)。該技術(shù)為農(nóng)戶生產(chǎn)問題提供了智能答疑解決方案,有效提升了農(nóng)事咨詢效率,但在實際應(yīng)用中仍存在改進(jìn)空間。當(dāng)前系統(tǒng)對復(fù)雜語義問題的處理能力有待加強(qiáng),且服務(wù)范圍主要局限于氣象相關(guān)的農(nóng)業(yè)場景。針對這些局限性,未來研究計劃重點(diǎn)從三個方向進(jìn)行優(yōu)化升級,包括引入深度學(xué)習(xí)技術(shù)、提升語義理解深度,整合多模態(tài)數(shù)據(jù)、拓展應(yīng)用場景覆蓋面及建立動態(tài)知識更新體系、保障信息時效性,從而全面提升系統(tǒng)的智能化水平和實用價值。
參考文獻(xiàn):
[1]WANGC,GAOY,AZIZ A,et al.Agricultural disaster risk management and capability assessment usingbig data analytics[J].Big data,2022,10(3):246-261.
[2]付世軍,盧淞巖,李夢,等.基于B/S架構(gòu)的智慧農(nóng)業(yè)管理系 統(tǒng)的設(shè)計與實現(xiàn)[J].湖北農(nóng)業(yè)科學(xué),2025,64(1):154-161.
[3]CHARALAMPOPOULOSI,DROULIA F.A pathway towards climateservicesfortheagricultural sector[J].Climate,2O24,12(2): 18.
[4]陳沖,肖晶晶,王偉.基于LBS的農(nóng)業(yè)氣象系統(tǒng)設(shè)計與實現(xiàn) [J].農(nóng)業(yè)工程,2024,14(7):37-41.
[5]HUAJ,WANGH,KANGM,etal.Thedesignand implementationofadistributedagricultural service system forsmallholder farmersin China[J].International journal of agricultural sustainability, 2023,21(1):2221108.
[6]QIANP,MAALLA A,WENHAIH,etal.Agricultural planting big dataqamp;a system technology research based on knowledge graph [A].2023 IEEE 3rd international conference on information technology,big data and artificial intelligence(ICIBA)[C].Chongqing,China:IEEE,2023.
[7]LI Y.A knowledge graph-based Q and A system for agricultural planting technology[A].Second international conference on electronic information engineering and computer communication(EIECC2022)[C].Xi'an,China:SPIE,2023.
[8]ZHAOJ,LIUD,HUANGR.A review ofclimate-smart agriculture:Recent advancements,challenges,and future directions[J]. Sustainability,2023,15(4):3404.
[9]TALWANI S,RAKHRA M,SARKART.Perspectiveson the futureofagriculture and recent developmentsinagricultural technology[A].2O24 11th International conference on reliability,infocom technologiesandoptimization(trendsand futuredirections)(ICRITO)[C].Noida,India:IEEE,2024.
[10]VENKATAR PS,NANDINIP KS,PUTTAMADAPPAC. Farmer’s friend:Conversational AIBoTfor smart agriculture[J]. Journal of positive school psychology,2022,6(2):2541-2549.
[11]ZHAO S,ZHANGB,YANGJ,etal.Linear discriminant analysis [J].Nature reviews methods primers,2024,4(1):70.
[12]LUCAAV,SIMON-VARHELYIM,MIHALYNB,etal.Fault type diagnosis of the WWTPdissolved oxygen sensor based on fisherdiscriminant analysis and assessment of associated environmental and economic impact[J].Applied sciences,2023,13(4):2554.
[13]AJITHAK M,INDRA NC.Fisher lineardiscriminantand discreteglobal swarm based task schedulingin cloud environment [J].Cluster computing,2022,25(5):3145-3160.
[14]XUE K,YANGJ,YAO F.Optimal linear discriminant analysis forhigh-dimensional functional data[J].Journal of the American statistical association,2024,119(546):1055-1064.
[15]JAINS,JAINSK,VASAL S.AneffectiveTF-IDF model to improve the text classification performance[A].2O24 IEEE 13thinternational conference on communication systems and network technologies(CSNT)[C].Jabalpur,India:IEEE,2024.
[16]HARINATHD,PATIL A,BANDIM,et al. Smart farming system-Anefficient techniquebypredictingagricultureyieldsbased onmachinelearning[J].Technische sicherheit(technical security)journal,2024,24(5):82-88.
[17]SOUSSI A,ZERO E,SACILER,et al. Smart sensors and smart data forprecision agriculture:A review[J].Sensors,2O24,24 (8):2647.
(責(zé)任編輯雷霄飛)