摘要:蔬菜是農(nóng)民增收致富的“錢袋子”,也是城市居民餐桌上的“菜籃子”。京津冀協(xié)同發(fā)展下,動態(tài)監(jiān)測蔬菜產(chǎn)銷信息對于穩(wěn)固區(qū)域蔬菜供應(yīng)、提升農(nóng)業(yè)資源配置效率、增加農(nóng)民收入以及推動區(qū)域一體化發(fā)展具有重要意義。本數(shù)據(jù)集匯聚了京津冀地區(qū)2021—2023年108種蔬菜的產(chǎn)銷數(shù)據(jù),包括種植面積、種植方式、銷售價格、銷售數(shù)量、銷售去向、銷售渠道等。數(shù)據(jù)涵蓋京津冀地區(qū)83個區(qū)縣,415個微觀生產(chǎn)主體監(jiān)測點,涉及蔬菜種植大戶、家庭農(nóng)場、合作社和企業(yè)。本數(shù)據(jù)集可為該區(qū)域蔬菜種植規(guī)劃、產(chǎn)量與價格預(yù)測、市場供需等研究等提供數(shù)據(jù)支撐。
1引言
蔬菜是人類飲食結(jié)構(gòu)中的重要組成部分,更是衡量一個國家或地區(qū)居民生活質(zhì)量高低、營養(yǎng)健康水平優(yōu)劣的關(guān)鍵性指標(biāo)。國家統(tǒng)計數(shù)據(jù)顯示,2023年我國蔬菜產(chǎn)量達(dá)8.3億噸[1],年人均占有量約593公斤,基本實現(xiàn)蔬菜周年均衡供應(yīng)與民眾對蔬菜多樣化需求。然而,蔬菜產(chǎn)業(yè)蓬勃發(fā)展、市場化程度不斷提升的同時也面臨一些風(fēng)險和挑戰(zhàn),特別是價格波動,不僅影響菜農(nóng)的經(jīng)濟(jì)收益、種植積極性和消費者的購買力,還威脅蔬菜市場的穩(wěn)定與可持續(xù)發(fā)展。
因此,圍繞蔬菜價格的研究一直是學(xué)界研究的熱點問題。Cao[2]基于遼寧凌源黃瓜每日采購價格數(shù)據(jù)和北京新發(fā)地批發(fā)價格數(shù)據(jù),研究分析了新鮮蔬菜供應(yīng)鏈上的價格形成機(jī)制;李優(yōu)柱[3]選取山東、北京產(chǎn)銷地5年的青椒、西紅柿價格日度數(shù)據(jù),研究了極端氣溫沖擊下蔬菜產(chǎn)銷市場價格溢出效應(yīng);沈辰[4]基于全國重要批發(fā)市場28種蔬菜5年價格數(shù)據(jù),運用季節(jié)分解和H-P濾波法,分析得出我國蔬菜批發(fā)價格波動4大類型,即趨勢波動、周期波動、季節(jié)波動和隨機(jī)波動。在價格預(yù)測方面,國內(nèi)外學(xué)者基于不同尺度、不同品種的蔬菜價格數(shù)據(jù),采用LSTM、BP、ARIMA、SARIMA等單一模型或多模型相結(jié)合來預(yù)測蔬菜價格[5-7],以期為生產(chǎn)者科學(xué)決策、相關(guān)政策制定等提供支撐。
京津冀是我國北方經(jīng)濟(jì)最發(fā)達(dá)、人口最密集地區(qū),區(qū)域農(nóng)產(chǎn)品流通市場的分布存在較為顯著的空間依賴性。監(jiān)測數(shù)據(jù)顯示,2022年北京市批發(fā)市場蔬菜上市量 60% 以上來自河北、山東省,其中7—9月份,外埠蔬菜供應(yīng)中河北占據(jù)絕對主導(dǎo)地位,平均占比約 55.9%[8] 。將本區(qū)域視為一個有機(jī)整體實施蔬菜產(chǎn)銷信息統(tǒng)籌監(jiān)測,對于確保本區(qū)域蔬菜供應(yīng)的穩(wěn)定性、推動農(nóng)業(yè)資源的高效配置、促進(jìn)農(nóng)民增收以及區(qū)域協(xié)同發(fā)展均具有深遠(yuǎn)的戰(zhàn)略意義與實踐價值。本數(shù)據(jù)集匯聚了京津冀地區(qū)微觀生產(chǎn)主體尺度蔬菜種植與產(chǎn)地銷售數(shù)據(jù),可為該區(qū)域蔬菜種植規(guī)劃、產(chǎn)量與價格預(yù)測、市場供需研究等提供數(shù)據(jù)支撐。
2 數(shù)據(jù)采集與處理方法
2.1 監(jiān)測點設(shè)置
京津冀蔬菜產(chǎn)銷監(jiān)測旨在實時把握區(qū)域內(nèi)蔬菜生產(chǎn)和銷售態(tài)勢,監(jiān)測區(qū)域選擇充分考慮了區(qū)縣發(fā)展定位和蔬菜產(chǎn)業(yè)現(xiàn)狀,監(jiān)測范圍力求廣泛覆蓋北京、天津和河北的蔬菜主要生產(chǎn)區(qū)縣。監(jiān)測點選擇須具備以下條件,一是具有一定種植規(guī)模,一般不低于50畝;二是監(jiān)測點要有代表性,所種植的蔬菜品種是當(dāng)?shù)卮竺娣e生產(chǎn)的大宗品種;三是監(jiān)測點以蔬菜種植大戶、家庭農(nóng)場、合作社、企業(yè)等經(jīng)濟(jì)實體為主;四是監(jiān)測點信息員有責(zé)任心,積極配合數(shù)據(jù)采集工作,確保數(shù)據(jù)的代表性、實用性和可持續(xù)性。北京地區(qū)每個區(qū)縣一般設(shè)置不少于10個監(jiān)測點,天津、河北地區(qū)每個區(qū)縣一般設(shè)置不低于5個監(jiān)測點,各區(qū)縣實際監(jiān)測點數(shù)量根據(jù)實際數(shù)據(jù)采集情況動態(tài)調(diào)整。京津冀監(jiān)測點區(qū)域分布詳見表1,共計涵蓋83個區(qū)縣,415個監(jiān)測點。
2.2數(shù)據(jù)采集與處理
蔬菜產(chǎn)銷數(shù)據(jù)采集分為兩個階段,即生產(chǎn)數(shù)據(jù)采集和銷售數(shù)據(jù)采集,由監(jiān)測點根據(jù)蔬菜種植品種、茬口進(jìn)行數(shù)據(jù)采集報送。某個品種蔬菜定植后啟動生產(chǎn)數(shù)據(jù)采集,若該品種幾次定植日期相隔較近(界定為5天以內(nèi)),可算為一個茬口,作為一條生產(chǎn)數(shù)據(jù)采集;蔬菜第一次上市銷售后進(jìn)行銷售數(shù)據(jù)采集,對于持續(xù)采摘上市銷售的蔬菜品種,以全部采摘銷售完成結(jié)束銷售數(shù)據(jù)采集,對于一次或者兩次即完成采摘收獲并監(jiān)測點自行儲存的品種,以賣出該品種所有儲存蔬菜,作為本品種本茬口蔬菜銷售數(shù)據(jù)采集結(jié)束的時間點。生產(chǎn)數(shù)據(jù)與銷售數(shù)據(jù)之間是一對多的關(guān)系,一條生產(chǎn)數(shù)據(jù)對應(yīng)多條銷售數(shù)據(jù)。
3 數(shù)據(jù)內(nèi)容
本數(shù)據(jù)集包含京津冀2021—2023年108種蔬菜的產(chǎn)銷數(shù)據(jù),共計18.7萬余條。生產(chǎn)數(shù)據(jù)項包括種植品種、種植面積、定植日期、品質(zhì)、種植方式,銷售數(shù)據(jù)包括上市日期、銷售日期、銷量、銷售價格、銷售去向、銷售渠道。其中,銷售去向主要是了解蔬菜在京津冀區(qū)域內(nèi)部以及區(qū)域外的分銷情況,包括銷往河北、銷往北京、銷往天津和銷往其他省市4種銷售去向,各種銷售去向比例加和為 100% ;銷售渠道主要指蔬菜賣給了誰,包括經(jīng)紀(jì)人、菜市場、批發(fā)市場、超市、合作社、網(wǎng)絡(luò)、機(jī)關(guān)學(xué)校食堂、其他等8種常規(guī)渠道,各種銷售渠道比例加和為 100% 。日期類數(shù)據(jù)格式為年-月-日(YYYY-MM-DD),種植面積、銷量、銷售價格數(shù)據(jù)單位分別為畝、斤、元/斤,銷售去向和銷售渠道數(shù)據(jù)單位為 % 。數(shù)據(jù)集部分示例數(shù)據(jù)如表2所示。
4數(shù)據(jù)質(zhì)量控制與評估
4.1規(guī)范數(shù)據(jù)采集
制定京津冀蔬菜監(jiān)測點產(chǎn)銷數(shù)據(jù)采集規(guī)范,明確數(shù)據(jù)采集要求,對數(shù)據(jù)采集方式和時效性作出統(tǒng)一、明確的規(guī)定,確保數(shù)據(jù)采集的規(guī)范性和一致性。搭建京津冀蔬菜產(chǎn)銷管理系統(tǒng),方便監(jiān)測點數(shù)據(jù)采集和數(shù)據(jù)審核、管理。保持?jǐn)?shù)據(jù)采集人員相對固定,人員變更及時進(jìn)行數(shù)據(jù)采集培訓(xùn),保證數(shù)據(jù)采集質(zhì)量。
4.2數(shù)據(jù)審核與校驗
固定專人進(jìn)行數(shù)據(jù)核驗,特別是針對銷售價格以超過近期平均銷售價格 50% 作為異常值判斷閾值,進(jìn)行數(shù)據(jù)人工確認(rèn)。一般采用歷史數(shù)據(jù)對比和電話核驗兩種方式,確保數(shù)據(jù)的準(zhǔn)確性與合理性。
5 數(shù)據(jù)價值與使用建議
本數(shù)據(jù)集通過微觀生產(chǎn)主體尺度的產(chǎn)銷數(shù)據(jù)采集,形成了產(chǎn)銷一體化數(shù)據(jù)鏈條,精準(zhǔn)反映了蔬菜生產(chǎn)種植與銷售動態(tài)。數(shù)據(jù)集數(shù)據(jù)精度與時效性均較高,彌補(bǔ)了傳統(tǒng)宏觀統(tǒng)計數(shù)據(jù)的不足。與政府發(fā)布的批發(fā)市場蔬菜價格數(shù)據(jù)相結(jié)合,可以構(gòu)建形成“生產(chǎn)端-流通端”雙維數(shù)據(jù)協(xié)同的實時市場監(jiān)測與預(yù)警體系。
本數(shù)據(jù)集不僅能夠支持農(nóng)業(yè)生產(chǎn)規(guī)劃、市場趨勢預(yù)測、種植結(jié)構(gòu)優(yōu)化等傳統(tǒng)農(nóng)業(yè)經(jīng)濟(jì)研究,還可為產(chǎn)量與價格預(yù)測、市場供需分析、供應(yīng)鏈優(yōu)化等提供關(guān)鍵數(shù)據(jù)支撐。其中的特色數(shù)據(jù),銷售去向數(shù)據(jù)能夠精準(zhǔn)追蹤蔬菜流向,對于量化分析區(qū)域間供需匹配度有重要價值;銷售渠道數(shù)據(jù)基本全覆蓋當(dāng)前蔬菜銷售全渠道,對于渠道趨勢分析、渠道效率對比以及銷售策略優(yōu)化等有重要作用。此外,數(shù)據(jù)集在政策評估、農(nóng)民生計研究、區(qū)域經(jīng)濟(jì)發(fā)展分析等領(lǐng)域也具有一定應(yīng)用潛力,結(jié)合機(jī)器學(xué)習(xí)、大數(shù)據(jù)挖掘、GIS等技術(shù),可以推動數(shù)據(jù)驅(qū)動的農(nóng)業(yè)科學(xué)研究與創(chuàng)新應(yīng)用。
本數(shù)據(jù)集在持續(xù)更新,能夠動態(tài)捕捉蔬菜產(chǎn)業(yè)的實時變化,為長期研究提供了可靠的數(shù)據(jù)基礎(chǔ)。
6 數(shù)據(jù)可用性
開放訪問,遵從CCBY-NC-ND4.0協(xié)議。
https://cstr.cn/17058.11.sciencedb.agriculture.00193;
https://doi.org/10.57760/sciencedb.agriculture.00193。
數(shù)據(jù)作者分工職責(zé)
陳麗,論文撰寫與修改。
王劍,數(shù)據(jù)采集工作部署協(xié)調(diào)。
趙安平,數(shù)據(jù)采集方案與論文架構(gòu)設(shè)計。
王曉東,論文架構(gòu)設(shè)計與修改完善。
劉娟,數(shù)據(jù)質(zhì)量控制。
王詩睿、寧曉涵,數(shù)據(jù)審核與校驗。
王增飛、楊唯佳,數(shù)據(jù)整理與分析。
倫理聲明
本文數(shù)據(jù)不涉及倫理聲明相關(guān)的內(nèi)容。
利益沖突聲明
作者聲明,全部作者均無會影響研究公正性的財務(wù)利益沖突或個人利益沖突。
參考文獻(xiàn)
[1] 國家統(tǒng)計局:農(nóng)業(yè)發(fā)展闊步前行現(xiàn)代農(nóng)業(yè)譜寫新篇- -新中國75 年經(jīng)濟(jì)社會發(fā)展成就系列報告之二.htps://www.stats.gov.cn/sj/ sjjd/202409/t20240910_1956334.html
[2] CAOYL,MOHIUDDIN M. Sustainable emerging country agro-food supplychains:fresh vegetable price formation mechanismsinrural China.Sustainability,2019,11(10):2814.https://doi.org/10.3390/ su11102814
[3] 李優(yōu)柱,付輝,楊鴻宇.蔬菜產(chǎn)銷市場價格波動溢出效應(yīng)研究:基于極 端氣溫沖擊視角.農(nóng)林經(jīng)濟(jì)管理學(xué)報,2023,22(3):311-321.
[4] 沈辰,張玉梅,李志強(qiáng).我國不同類型蔬菜價格波動分解與貢獻(xiàn)分析. 中國蔬菜,2015,1(5):52.
[5] 彭紅星,鄭楷航,黃國彬,等.基于BP、LSTM和ARIMA模型的蔬菜 價格預(yù)測.中國農(nóng)機(jī)化學(xué)報,2020,41(4):193-199.
[6] LIYZ,LICG,ZHENGMY.Ahybrid neural networkandH-Pfilter modelfor short-term vegetable price forecasting.Mathematical Problemsin Engineering,2014.DOI:10.1155/2014/135862.
[7] LIB,DINGJQ,YINZQ,etal.Optimized neural network combined model based on the induced ordered weighted averagingoperator for vegetableprice forecasting.Expert Systems with Applications,2021, 168.DOI:10.1016/j.eswa.2020.114232.
[8] 趙安平,趙友森,王曉東,等.北京市蔬菜供需平衡研究.中國農(nóng)業(yè)信 息,2023,35(2):53-62. 引用格式:陳麗,王劍,趙安平,王曉東,劉娟,王詩睿,寧曉涵,王增飛,楊唯佳.2021-2023年京津冀蔬菜產(chǎn)銷監(jiān)測數(shù)據(jù)集[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報,2025,2):
276-280. DOI: 10.19788/j.issn.2096-6369.100054. CITATION:CHENLiWANGJian,ZHAOAnPing,WANGXiaoDong,LIUJuan,WANGSiRuiNNGXiaoHanWANGZengFei,YANGWei MonitoringDatasetofVegetableProductioandSalesinBeijing-Tanjin-HebeiRegion(2-023)[J].JoualofAgriculturalBigData
2025,7(2):276-280. DOI: 10.19788/j.issn.2096-6369.100054.
Abstract: Vegetables areoneoftheimportantsupporting industriesforagricultureandruraleconomyand alsoan important componentofthe\"vegetablebasket\"forurbanandruralresidents.UnderthecoordinateddevelopmentoftheBeijing-Tianjin-Hebei region,dynamicmonitoringofvegetableproductionandsalesiformationisofgeatsignficanceforstabilzingregionalvegetable supply,improvingagriculturalresourcealocationeficiencyincreasingfarmers'income,andpromotingregionalintegration development.This dataset gathersthe productionandsalesdataof108 types ofvegetables intheBeijing-Tianjin-Hebei region from 2021to023,includingdataindicatorssuchasplantingarea,plating method,sales price,salesquantitysales destiatio,sales chanels,etc.Thedatacovers83districtsandcountiesinheBeijing-Tianjin-Hebeiregion,with415microproductionetitis selectedamotongpoitsdggetableroersfmilysoperatiesdterprss.Tisatasetanrodedata support for vegetable planting planning,yield and priceforecasting, market supplyand demandresearch, etc.intheregion.
Keywords: vegetable; production and sales monitoring;Beijing-Tianjin-Hebei region