1引言
農(nóng)業(yè)科學(xué)數(shù)據(jù)是支撐國家農(nóng)業(yè)科技創(chuàng)新和農(nóng)業(yè)農(nóng)村經(jīng)濟(jì)發(fā)展的重要基礎(chǔ)性、戰(zhàn)略性資源[1]。隨著人工智能、大數(shù)據(jù)技術(shù)為代表的數(shù)字時(shí)代的來臨,數(shù)據(jù)已作為重要生產(chǎn)要素之一,被正式納入國家要素市場化配置之中,蘊(yùn)含重大意義[2]。同時(shí),數(shù)據(jù)資源已成為與糧食、能源同等重要的戰(zhàn)略資源[3],數(shù)據(jù)驅(qū)動(dòng)的研究模式給傳統(tǒng)科學(xué)研究領(lǐng)域帶來了新的研究方法與科學(xué)研究范式,推動(dòng)以農(nóng)業(yè)科學(xué)數(shù)據(jù)為重要內(nèi)核的農(nóng)業(yè)農(nóng)村大數(shù)據(jù)科技創(chuàng)新,也為農(nóng)業(yè)農(nóng)村現(xiàn)代化發(fā)展帶來了新的機(jī)遇[4。
隨著數(shù)據(jù)驅(qū)動(dòng)科學(xué)研究范式的發(fā)展,農(nóng)業(yè)科學(xué)數(shù)據(jù)在科技創(chuàng)新中的作用越來越突出[5],隨之而來的是,農(nóng)業(yè)科學(xué)數(shù)據(jù)分析挖掘和應(yīng)用的方法與技術(shù)研究,以及相關(guān)工具軟件的研發(fā),受到了科技界和產(chǎn)業(yè)界的高度重視[。國外歐美發(fā)達(dá)國家在農(nóng)業(yè)領(lǐng)域科學(xué)數(shù)據(jù)挖掘技術(shù)和軟件研究與應(yīng)用上積累雄厚,總體處于領(lǐng)先地位,國內(nèi)在農(nóng)業(yè)領(lǐng)域科學(xué)數(shù)據(jù)挖掘技術(shù)和軟件研究與應(yīng)用上進(jìn)步迅速,但總體處于追趕的狀態(tài)7。通用數(shù)據(jù)挖掘分析方法和技術(shù)進(jìn)展迅速[8],例如 SAS、SPSS、Weka、Matlab等數(shù)據(jù)挖掘分析工具在金融、醫(yī)藥、農(nóng)業(yè)等行業(yè)得到廣泛引用;領(lǐng)域數(shù)據(jù)挖掘分析方法與技術(shù)也不斷發(fā)展[9-10],例如在育種數(shù)據(jù)和土地?cái)?shù)據(jù)挖掘軟件上,Agronomix、Genstat、IBP(BMS)、Agrobase等商業(yè)軟件也在世界范圍內(nèi)被廣泛應(yīng)用。
場景驅(qū)動(dòng)的農(nóng)業(yè)科學(xué)數(shù)據(jù)挖掘方法、技術(shù)、系統(tǒng)的研究與應(yīng)用是當(dāng)前的熱點(diǎn),并具有良好的發(fā)展前景[11]。一是,從單一尺度到大數(shù)據(jù)尺度的跨尺度挖掘。隨著技術(shù)發(fā)展,尤其是隨著基因組、表型組、遙感技術(shù)的發(fā)展,不同尺度的數(shù)據(jù)不斷積累,針對(duì)不同場景的不同尺度數(shù)據(jù),誕生了不同挖掘工具和挖掘方法[12],形成了跨尺度挖掘的發(fā)展趨勢。二是,從單模型到多種模型組合的跨模型分析。農(nóng)業(yè)科學(xué)數(shù)據(jù)是多維復(fù)雜數(shù)據(jù),不同方向具有不同學(xué)科背景的模型,單一模型已經(jīng)不足以滿足數(shù)據(jù)分析和挖掘的需求[13]。如作物表型數(shù)據(jù)挖掘中,科學(xué)家大多開始使用多種模型相互組合,首先使用圖像檢測模型尋找定位作物表型器官,然后對(duì)相應(yīng)的器官進(jìn)行圖像識(shí)別和計(jì)數(shù),通過圖像分割、精準(zhǔn)測量、智能評(píng)估等多種模型進(jìn)行處理,這些模型的組合使用,表明農(nóng)業(yè)科學(xué)數(shù)據(jù)的挖掘已經(jīng)邁入跨模型分析階段。
農(nóng)業(yè)科學(xué)數(shù)據(jù)具有異構(gòu)性、數(shù)據(jù)規(guī)模大、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一的特點(diǎn)[14],其中包含著大量模糊、不完整、冗余的信息。圍繞農(nóng)業(yè)科學(xué)數(shù)據(jù)分析挖掘還存在數(shù)據(jù)語義孤島嚴(yán)重,以及數(shù)據(jù)挖掘工具不全、不配套與場景適應(yīng)性差等突出問題[15],本文以面向育種、耕地評(píng)價(jià)、農(nóng)業(yè)綠色發(fā)展領(lǐng)域的13個(gè)場景智能分析挖掘應(yīng)用能力提升為目標(biāo),研建農(nóng)業(yè)科學(xué)數(shù)據(jù)在線協(xié)同分析引擎,集成科學(xué)數(shù)據(jù)自動(dòng)化分析核心框架、典型挖掘算法工具,以及面向育種的專用挖掘工具,開發(fā)農(nóng)業(yè)科學(xué)數(shù)據(jù)分析挖掘平臺(tái),支撐超大規(guī)模數(shù)據(jù)及不同場景分析應(yīng)用的并發(fā)在線交互計(jì)算分析,突破\"數(shù)據(jù)資源—分析工具—應(yīng)用場景\"銜接不暢的問題,助力提高農(nóng)業(yè)科學(xué)研究效率。
2 平臺(tái)設(shè)計(jì)
2.1 平臺(tái)構(gòu)架設(shè)計(jì)
面向從事農(nóng)業(yè)數(shù)據(jù)領(lǐng)域工作者的需求,以及大規(guī)模用戶使用的需求,設(shè)計(jì)了農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘平臺(tái),整個(gè)平臺(tái)分為5層結(jié)構(gòu),自下而上分別是數(shù)據(jù)層、領(lǐng)域數(shù)據(jù)分析工具層、自動(dòng)化挖掘框架層、在線分析引擎層,以及用戶界面層。該平臺(tái)針對(duì)農(nóng)業(yè)科學(xué)數(shù)據(jù)分析挖掘存在的數(shù)據(jù)語義孤島嚴(yán)重、數(shù)據(jù)挖掘工具不全、場景適應(yīng)性差等突出問題,將數(shù)據(jù)、模型、場景組建在一起,突破\"數(shù)據(jù)資源—分析工具一應(yīng)用場景\"銜接不暢的問題,形成集數(shù)據(jù)資源、分析模型、組件工具、場景分析和標(biāo)準(zhǔn)流程于一體的在線分析挖掘應(yīng)用環(huán)境,支撐從“數(shù)據(jù)聚合一挖掘分析鏈—在線分析—場景應(yīng)用\"的農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘全過程,示范應(yīng)用面向育種、土評(píng)和農(nóng)業(yè)綠色發(fā)展等13個(gè)場景的分析挖掘技術(shù),形成農(nóng)業(yè)科學(xué)數(shù)據(jù)挖掘分析關(guān)鍵技術(shù)典型應(yīng)用案例。平臺(tái)構(gòu)架設(shè)計(jì)如圖1所示。
2.2分析挖掘引擎設(shè)計(jì)
以python作為分析引擎,以python為基礎(chǔ)的模型算子作為封裝對(duì)象,建立java與python的通信與調(diào)用函數(shù)關(guān)系,形成以python編譯器為核心的“ Spring+Springboot+SpringCloud+redis+mysql+Oauth2+python”農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘引擎。
分析挖掘流程如圖2所示:通過python封裝典型與專業(yè)模型算子;使用java與python的通信與調(diào)用函數(shù),調(diào)用python編譯器執(zhí)行封裝后模型算子的運(yùn)行;返回python運(yùn)行結(jié)果給java。
分析挖掘引擎中包含統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)三種典型算子,具體專業(yè)算子如表1所示。
通過構(gòu)建農(nóng)業(yè)科學(xué)數(shù)據(jù)在線協(xié)同分析引擎,提供數(shù)據(jù)資源發(fā)現(xiàn)與高效加載、數(shù)據(jù)與分析工具自動(dòng)匹配、異構(gòu)分析工具協(xié)同、在線編程分析與工作流分析、多分析任務(wù)并發(fā)調(diào)度執(zhí)行能力,支撐超大規(guī)模農(nóng)業(yè)科學(xué)數(shù)據(jù)的在線交互式并發(fā)分析。
2.3功能設(shè)計(jì)
農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘平臺(tái)以場景智能分析挖掘應(yīng)用能力提升為自標(biāo),開發(fā)了數(shù)據(jù)管理、組件管理、場景管理、挖掘分析4大功能模塊,具備應(yīng)用場景管理、在線分析、自動(dòng)化挖掘等功能。平臺(tái)功能結(jié)構(gòu)如圖3所示。
數(shù)據(jù)管理模塊主要用于管理用戶上傳的本地?cái)?shù)據(jù)、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心數(shù)據(jù)以及網(wǎng)絡(luò)數(shù)據(jù),支持?jǐn)?shù)據(jù)管理,包括數(shù)據(jù)的增刪查改,以及數(shù)據(jù)分類查找;組件管理模塊以統(tǒng)計(jì)分析類算子組件、機(jī)器學(xué)習(xí)類算子組件、深度學(xué)習(xí)類算子組件以及其他分類算子組件的管理為主,包括組件的查找、詳情查看以及組件分析跳轉(zhuǎn);場景管理模塊包括作物育種類場景、耕地評(píng)價(jià)類場景以及農(nóng)業(yè)綠色發(fā)展類場景的管理,通過構(gòu)建算法流程,預(yù)測各種場景數(shù)據(jù);挖掘分析模塊適用于單個(gè)組件的數(shù)據(jù)分析和多個(gè)算子組成的場景分享,通過輸入數(shù)據(jù)到單個(gè)組件或建立流程,得到相應(yīng)數(shù)據(jù)結(jié)果,該模塊主要包括算子分析和場景分析,其中,算子分析通過運(yùn)行數(shù)據(jù)集得出相應(yīng)的運(yùn)行結(jié)果,場景分析從育種、耕地、農(nóng)業(yè)綠色發(fā)展3個(gè)方面出發(fā),利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法建立模擬多個(gè)場景,實(shí)現(xiàn)育種預(yù)測、耕地評(píng)價(jià)、用水預(yù)測等功能。
3 平臺(tái)實(shí)現(xiàn)
3.1 前端可視化技術(shù)
前端基于Vue和Element-ui前端框架開發(fā)操作界面,依托后端集成各類數(shù)據(jù)庫AP1,利用流程圖等可視化組件關(guān)聯(lián)后端數(shù)據(jù)庫,通過axios前后端交互技術(shù)與后端數(shù)據(jù)交互,具有數(shù)據(jù)驅(qū)動(dòng)、組件化、虛擬DOM三大核心特征。
通過關(guān)聯(lián)后端開發(fā)組件構(gòu)建數(shù)據(jù)挖掘任務(wù),將任務(wù)提交至流程引擎生成后端編程代碼,根據(jù)調(diào)度周期及其他環(huán)境參數(shù)設(shè)計(jì) HTML(Hyper TextMarkupLanguage,超文本標(biāo)記語言)提交表單,調(diào)整各類參數(shù)并提交至后端數(shù)據(jù)挖掘模型,對(duì)新的實(shí)時(shí)數(shù)據(jù)進(jìn)行模型應(yīng)用,通過可視化界面將設(shè)備運(yùn)行狀態(tài)反饋給管理層并調(diào)整決策策略。
3.2 后端技術(shù)路線
服務(wù)端基于SpringBoot構(gòu)建,采用SpringCloud微服務(wù)框架及SpringCloudAlibaba框架的相關(guān)組件搭建而成。平臺(tái)后端技術(shù)路線如圖4所示,持久層:MySQL、Redis、Oss等;數(shù)據(jù)訪問層:Mybatis、Mybatis-plus等;消息中間件:RabbitMQ等;業(yè)務(wù)層:SpringIOC、Aop事務(wù)控制、SpringTask任務(wù)調(diào)度、Feign、Ribbon、SpringDataRedis等;控制層:SpringMVC等;微服務(wù)治理:Nacos、Hy strix、SpringCloud Config、Spring Security、Oauth2、 JWT等。將系統(tǒng)部署到指定的公有云或私有云上,能夠更容易、更快速以及低成本地實(shí)現(xiàn)系統(tǒng)功能的部署,同時(shí)也能保證系統(tǒng)運(yùn)行的高可靠、低成本與高擴(kuò)展性。
3.3 界面展示
3.3.1主頁
在農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘平臺(tái)登錄界面輸入賬號(hào)、密碼以及驗(yàn)證碼登錄系統(tǒng),登錄成功跳轉(zhuǎn)到主頁,如圖5所示,平臺(tái)主頁包括農(nóng)業(yè)數(shù)據(jù)管理模塊、算子組件管理模塊、應(yīng)用場景管理模塊和數(shù)據(jù)挖掘分析四大功能模塊,各模塊的功能說明分別展示在模塊下方。
3.3.2 數(shù)據(jù)管理模塊
數(shù)據(jù)管理頁面包括左側(cè)兩個(gè)篩選條件,篩選條件1為數(shù)據(jù)來源分類,包括:平臺(tái)數(shù)據(jù)、數(shù)據(jù)中心數(shù)據(jù)以及互聯(lián)網(wǎng)數(shù)據(jù);篩選條件2為所屬場景類型分類,包括:育種場景數(shù)據(jù)、耕地場景數(shù)據(jù)、農(nóng)業(yè)綠色發(fā)展場景數(shù)據(jù)以及其他場景數(shù)據(jù),右側(cè)以列表形式向用戶展示相應(yīng)數(shù)據(jù)信息,通過篩選或檢索指定數(shù)據(jù),對(duì)相應(yīng)數(shù)據(jù)進(jìn)行刪除和下載。數(shù)據(jù)管理模塊界面如圖6所示。
3.3.3 組件管理模塊
算子組件管理頁面包括左側(cè)篩選條件以及組件類別簡介,算子分類為統(tǒng)計(jì)分析類算子組件、機(jī)器學(xué)習(xí)類算子組件、深度學(xué)習(xí)類算子組件以及其他分類算子
組件,右側(cè)以列表形式向用戶展示相應(yīng)組件信息,通過篩選或檢索指定算子組件,能夠查看相應(yīng)數(shù)據(jù)詳細(xì)信息。組件管理模塊界面如圖7所示。
3.3.4場景管理模塊
場景管理模塊包括作物育種類場景、耕地評(píng)價(jià)類場景以及農(nóng)業(yè)綠色發(fā)展類場景,頁面左側(cè)為該類應(yīng)用場景的介紹,右側(cè)則以列表形式向用戶展示場景名稱、類型、時(shí)間、概述,用戶可以通過檢索框檢索指定場景,并對(duì)相應(yīng)場景信息進(jìn)行新增、編輯、刪除。場景管理模塊界面如圖8所示。
3.3.5 挖掘分析模塊
挖掘分析模塊包括算子分析和場景分析,場景分析頁面包括場景選擇、場景簡介以及場景運(yùn)行和編輯,用戶可以根據(jù)頁面上方選擇需要運(yùn)行的場景,面板根據(jù)用戶選擇顯示不同的場景流程。雙擊打開模塊編輯頁面,根據(jù)模塊對(duì)應(yīng)的算子選擇參數(shù)以及數(shù)據(jù)文件,運(yùn)行編輯完成的場景即可得出運(yùn)行結(jié)果。挖掘分析模塊界面如圖9所示。
4挖掘分析測試
4.1算子分析測試
為了驗(yàn)證農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘平臺(tái)的功能,在算子分析模塊中,選擇經(jīng)典的深度學(xué)習(xí)算子Yolov7。該算子具有速度更快、精度更高等優(yōu)勢,特別是在育種場景下能夠快速檢測作物表型信息,在作物育種場景中的應(yīng)用潛力巨大,同時(shí)其模型結(jié)構(gòu)復(fù)雜,需要配備相應(yīng)的計(jì)算資源,以此算法進(jìn)行測試,既能夠測試平臺(tái)計(jì)算資源的承載能力,又能夠測試平臺(tái)的計(jì)算能力。因此,以Yolov7玉米雄穗數(shù)據(jù)集為例,對(duì)平臺(tái)功能進(jìn)行測試,具體操作步驟與測試結(jié)果如圖10所示:圖10A中,點(diǎn)擊左上角添加算子組件,組件類型選擇深度學(xué)習(xí)算子組件中的Yolov7;圖10B中,從右側(cè)本地?cái)?shù)據(jù)庫中拖拽Yolov7數(shù)據(jù)集至下方黃色虛線框;圖10C中,點(diǎn)擊運(yùn)行得出運(yùn)行結(jié)果,并下載所有結(jié)果。
4.2 場景分析測試
育種是農(nóng)業(yè)科學(xué)研究的重要部分,大量基因型與表型數(shù)據(jù)的處理是品種選育的難點(diǎn),平臺(tái)設(shè)計(jì)的挖掘分析模塊能夠快速準(zhǔn)確地處理DNA序列數(shù)據(jù),減輕育種家的工作量,提高育種效率。因此,為了驗(yàn)證挖掘分析模塊的場景分析功能,以育種場景的高品質(zhì)小麥品種選育為測試對(duì)象,具體操作步驟與測試結(jié)果如圖11所示:圖11A中,在上方選擇需要分析的場景;圖11B中,點(diǎn)擊流程圖中對(duì)應(yīng)的模塊,上傳本地基因型數(shù)據(jù);圖11C中,點(diǎn)擊運(yùn)行按鈕,等待運(yùn)行結(jié)果;圖11D中,下載全部的運(yùn)行結(jié)果。
5 結(jié)論與展望
本文通過研建農(nóng)業(yè)科學(xué)數(shù)據(jù)在線協(xié)同分析引擎,集成科學(xué)數(shù)據(jù)自動(dòng)化分析核心框架、典型挖掘算法工具,以及面向育種的專用挖掘工具,針對(duì)性地設(shè)計(jì)了農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘平臺(tái)。系統(tǒng)具備數(shù)據(jù)管理、組件管理、場景管理、挖掘分析4大功能,能夠?qū)崿F(xiàn)“數(shù)據(jù)聚合一挖掘分析鏈—在線分析—場景應(yīng)用”的農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘全過程,為農(nóng)業(yè)數(shù)據(jù)的存儲(chǔ)、管理、挖掘及應(yīng)用提供了有效工具,解決農(nóng)業(yè)數(shù)據(jù)處理難、有效信息提取難的問題,充分發(fā)揮數(shù)據(jù)驅(qū)動(dòng)農(nóng)業(yè)發(fā)展的作用,提高農(nóng)業(yè)科學(xué)數(shù)據(jù)處理效率和利用價(jià)值。
在未來,隨著農(nóng)業(yè)科學(xué)數(shù)據(jù)的積累,與此同時(shí)農(nóng)業(yè)科學(xué)數(shù)據(jù)分析挖掘技術(shù)也發(fā)生相應(yīng)的轉(zhuǎn)變。首先,在模型方面從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)轉(zhuǎn)變、從小模型向大模型轉(zhuǎn)變、從單模型向多模型轉(zhuǎn)變;其次,在數(shù)據(jù)方面從稀疏樣本數(shù)據(jù)向海量數(shù)據(jù)轉(zhuǎn)變、從單一來源數(shù)據(jù)向多源異構(gòu)數(shù)據(jù)轉(zhuǎn)變;最后,在領(lǐng)域方面,AI與領(lǐng)域相結(jié)合越來越深入,各個(gè)領(lǐng)域AI分析挖掘模型將會(huì)日新月異。
隨著農(nóng)業(yè)智能化的發(fā)展,農(nóng)業(yè)數(shù)據(jù)挖掘技術(shù)的發(fā)展?jié)摿薮骩,以推動(dòng)農(nóng)業(yè)生產(chǎn)精準(zhǔn)化發(fā)展、提高育種效率、實(shí)現(xiàn)農(nóng)業(yè)數(shù)據(jù)存儲(chǔ)管理等為目標(biāo),通過分析農(nóng)業(yè)數(shù)據(jù)特點(diǎn),設(shè)計(jì)出更具針對(duì)性的數(shù)據(jù)挖掘算法,形成農(nóng)業(yè)領(lǐng)域的專業(yè)數(shù)據(jù)挖掘技術(shù),將成為農(nóng)業(yè)生產(chǎn)與科研的助推劑,以解決農(nóng)業(yè)領(lǐng)域“數(shù)據(jù)量大,價(jià)值低”的痛點(diǎn)難點(diǎn),充分發(fā)揮農(nóng)業(yè)科學(xué)數(shù)據(jù)的價(jià)值,從海量的數(shù)據(jù)中挖掘有用的信息,形成以農(nóng)業(yè)科學(xué)數(shù)據(jù)為重要內(nèi)核的農(nóng)業(yè)農(nóng)村大數(shù)據(jù)科技創(chuàng)新,引領(lǐng)農(nóng)業(yè)深度數(shù)字化、智能化發(fā)展。
參考文獻(xiàn)
[1] 溫孚江.農(nóng)業(yè)大數(shù)據(jù)研究的戰(zhàn)略意義與協(xié)同機(jī)制.高等農(nóng)業(yè)教育,2013(11):3-6.
[2]孫曉勇,劉子瑋,孫濤,等.大數(shù)據(jù)在農(nóng)業(yè)研究領(lǐng)域中的應(yīng)用與發(fā)展中國蔬菜,2015 (10):1-5.
[3]張浩然,李中良,鄒騰飛,等.農(nóng)業(yè)大數(shù)據(jù)綜述.計(jì)算機(jī)科學(xué),2014,41(S2):387-392.
[4]葉煜,雷靜,任華.數(shù)據(jù)挖掘在農(nóng)業(yè)信息化中的應(yīng)用.工業(yè)控制計(jì)算機(jī),2020,33(7):127-128.
[5]王鵬.基于數(shù)據(jù)挖掘的智慧農(nóng)業(yè)平臺(tái)設(shè)計(jì).農(nóng)業(yè)工程,2017,7(6):40-42.
[6]劉春玲,崔凌云,賈冬青,等.數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用.農(nóng)機(jī)化研究,2010,32(7):201-204.
[7]黎玲萍,毛克彪,付秀麗,等.國內(nèi)外農(nóng)業(yè)大數(shù)據(jù)應(yīng)用研究分析.高技術(shù)通訊,2016,26(4):414-422.
[8]李笑巖.大數(shù)據(jù)分析常用軟件工具綜述.數(shù)字技術(shù)與應(yīng)用,2015(11):241.
[9]張白艷.數(shù)據(jù)挖掘在農(nóng)業(yè)信息化中的應(yīng)用進(jìn)展.山西農(nóng)經(jīng),2018(4):44.
[10]SALI GMONACOF,MAZZOCCHI C,et al. Exploring land usescenariosinmetropolitanareas:Food balanceina local agriculturalsystem by using a multi-objective optimization model. Agriculture andAgricultural Science Procedia,20l6(8): 211-212.
[11]PAULJK,VIVEK B.A tutorial on data mining for Bayesiannetworks,withaspecific focuson IoTfor agriculture.Internet ofThings,2023,22.
[12] ZHIWEI R, JIE Y. Data mining and statistics issues of precision andintelligent agriculture basedon big data analysis.Acta AgriculturaeScandinavica, SectionB—Soil Plant Science,2021,71(9):870-883.
[13]SELVI TM, JAISON B.Adaptive Lemuria: A progressive future cropprediction algorithm using data mining. Sustainable Computing:Informatics and Systems,2021,100577.
[14]王儒敬.我國農(nóng)業(yè)信息化發(fā)展的瓶頸與應(yīng)對(duì)策略思考.中國科學(xué)院院刊,2013,28(3):337-343.
[15]AISHWARYAK,JABBARMA.Datamininganalysisforprecisionagriculture:A comprehensive survey. Electrochemical SocietyTransactions,2022,107(1).
[16]柴苗嶺,黃琳,任運(yùn)月.重要開放農(nóng)業(yè)科學(xué)數(shù)據(jù)資源建設(shè)現(xiàn)狀綜述.農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2020,32(10):25-34.
引用格式:李佳樂,林佳,賀子康,王健,張建華,周國民.農(nóng)業(yè)科學(xué)數(shù)據(jù)在線分析挖掘平臺(tái)設(shè)計(jì)與應(yīng)用[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2025,7(2):183-192.DOI:10.19788/j.issn.2096-6369.000045.
Abstract:Withthedevelopmentofdata-drivenscientificresearchparadigm,theroleofagriculturalsciencedatainscienceand technologyinnovationisbecomingmoreandmoreprominent,andconsequentlythemethodologicalandtechnologicalresearchon the analysis and miningandapplicationofagriculturalsciencedataisalsodeveloping,aroundtheanalysisand mining ofagricultural science data therearestilldatasemanticsilosserious,aswellasthedata mining tolsare incomplete,mismatchedand por adaptabityofthescenarios,suchastheoutstanding problems.In this paper,wedesignedthe platformarchitecture,costructedthe analysisandminingengine,loadedthetypicalandprofesionalanalysisandminingalgorithmtols,formedtheoieanalysisand mining platformforagriculturalscientificdata,includingthedatalayer,thedomaindataanalysistoollayer,theautomatedmining framework layer,theonlineanalysis engine layer,andtheuserinterfacelayer,anddevelopedfourfunctional modules,namely,the data management,thecomponent management,the scenario management,andthe mininganalysis.Theplatformisequipped with application scenario management,online analysis,automated mining andother functions,breaking through the problemof poor conectionof\"dataresources-analysis tools-applicationscenarios\",forminganonlineanalysisandminingappicationenviroment integratingdatasouce,alysisodels,ompoenttols,enarioalysisndsadrdproceespportingtheole ofonlineanalysisand miningofagriculturalscientificdata from\"data aggegation-miningandanalysischain-onlineanalysisscenarioapplication\",andrealizingtheconcuentonlineinteractivecomputationandanalysisofultra-large-scaledataandderet scenario analysisapplications.
Keywords: agricultural science data; online analysis mining ;? platform design; scenario applications