亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于農(nóng)產(chǎn)品市場價(jià)格的數(shù)據(jù)挖掘預(yù)測分析*

        2021-04-28 08:05:34趙宇蘭
        山西電子技術(shù) 2021年2期
        關(guān)鍵詞:銷售價(jià)格單位根爬蟲

        趙宇蘭

        (山西大學(xué)商務(wù)學(xué)院信息學(xué)院,山西 太原 030031)

        0 引言

        隨著大數(shù)據(jù)時(shí)代的到來,人們對數(shù)據(jù)的獲取、統(tǒng)計(jì)的需求日益增大。爬蟲技術(shù)的不斷成熟為人們獲取互聯(lián)網(wǎng)數(shù)據(jù)提供了極大的便利。在農(nóng)業(yè)領(lǐng)域,人們開始將農(nóng)業(yè)數(shù)據(jù)與大數(shù)據(jù)技術(shù)相結(jié)合,運(yùn)用大數(shù)據(jù)的采集、存儲、分析以及可視化等技術(shù),幫助人們快速挖掘、分析出數(shù)據(jù)背后有價(jià)值的信息,降低農(nóng)產(chǎn)品生產(chǎn)、銷售過程中不必要的風(fēng)險(xiǎn)。本文以中國飼料行業(yè)信息網(wǎng)中玉米的銷售價(jià)格為數(shù)據(jù)源,采用網(wǎng)絡(luò)爬蟲軟件GeeSooker進(jìn)行數(shù)據(jù)采集和存儲,以玉米市場價(jià)格的歷史時(shí)間序列建立價(jià)格預(yù)測的ARIMA模型[1],進(jìn)一步分析玉米市場價(jià)格的波動狀況和變化趨勢。

        1 預(yù)測技術(shù)的概述

        1.1 網(wǎng)絡(luò)爬蟲技術(shù)

        農(nóng)產(chǎn)品市場價(jià)格挖掘預(yù)測是基于互聯(lián)網(wǎng)農(nóng)業(yè)數(shù)據(jù),為了滿足農(nóng)產(chǎn)品市場價(jià)格數(shù)據(jù)挖掘預(yù)測的需求,本文采用網(wǎng)絡(luò)爬蟲技術(shù)獲取互聯(lián)網(wǎng)數(shù)據(jù),數(shù)據(jù)獲取過程如圖1所示。

        圖1 數(shù)據(jù)獲取組成圖

        其中,爬蟲引擎[2]用于處理爬蟲系統(tǒng)的數(shù)據(jù)流處理并觸發(fā)事務(wù);調(diào)度器用于接受引擎發(fā)送的請求,將其放入處理隊(duì)列,并在引擎再次請求時(shí)返回;數(shù)據(jù)清洗模塊是將下載下來的信息進(jìn)行處理,剔除無效信息和冗余信息;下載器用于下載網(wǎng)站頁面內(nèi)容,并將其傳遞給下一個(gè)處理業(yè)務(wù);爬蟲規(guī)則用來指定下載網(wǎng)頁,編寫用于分析網(wǎng)站源碼并聽取信息。

        1.2 數(shù)據(jù)的采集過程

        本文采用GeeSooker爬蟲瀏覽器對中國飼料信息網(wǎng)的2018年1月到2019年2月玉米銷售價(jià)格進(jìn)行采集,采集過程[3]如下:

        1) 加載網(wǎng)頁,定義加載規(guī)則、主題;

        2) 點(diǎn)選待采信息生成標(biāo)簽,抓取內(nèi)容并提交;

        3) 測試,保存規(guī)則,開始爬取數(shù)據(jù);

        4) Data Scrape rworks文件夾中查看數(shù)據(jù)。

        1.3 數(shù)據(jù)清洗

        數(shù)據(jù)清洗是整個(gè)數(shù)據(jù)分析過程中不可或缺的一部分,結(jié)果的質(zhì)量與模型的效果和最終結(jié)論直接相關(guān)。本文重點(diǎn)對采集數(shù)據(jù)進(jìn)行缺失值清洗、邏輯錯(cuò)誤清洗和關(guān)聯(lián)性驗(yàn)證,最終得到表1中2018/1/2~2019/2/28玉米的銷售價(jià)格數(shù)據(jù)。

        表1 玉米的銷售價(jià)格數(shù)據(jù)片段

        2 模型建立的分析

        2.1 ARIMA模型

        ARIMA模型是差分整合移動平均自回歸模型,它是時(shí)間序列預(yù)測分析方法之一。該模型可以通過時(shí)間序列數(shù)據(jù)了解數(shù)據(jù)或預(yù)測系列中的未來預(yù)測點(diǎn)。在數(shù)據(jù)顯示非平穩(wěn)性證據(jù)的一些情況下,可以應(yīng)用初始差異步驟一次或多次消除非平穩(wěn)性。

        2.2 ARIMA模型運(yùn)用流程

        首先獲得時(shí)間序列數(shù)據(jù);觀察模型可視化得到的原始時(shí)間序列圖是否平穩(wěn),如果不平穩(wěn),可通過差分運(yùn)算平穩(wěn)化;通過差分運(yùn)算后得到新的自相關(guān)圖和偏自相關(guān)圖來驗(yàn)證模型的穩(wěn)定性;對模型進(jìn)行參數(shù)檢驗(yàn),使結(jié)果更具合理性;利用已通過檢驗(yàn)的模型進(jìn)行預(yù)測。

        差分平穩(wěn)時(shí)間序列建模步驟如圖2所示。

        “Bin”這個(gè)詞原指酒窖里存儲葡萄酒的隔間或者格子,常以不同的序號來標(biāo)記不同的隔間,因此,澳大利亞很多酒莊都喜歡用“Bin”+序號來為自己的酒款命名。后來,由于易記又順口,隔間的序號慢慢成為葡萄酒的代號。1959年,Bin 28成為Penfolds Bin系列葡萄酒第一個(gè)以此命名的葡萄酒。自此以后,Bin組合層出,為消費(fèi)者所記住和熟知,成了Penfolds旗下最為知名的受歡迎的一個(gè)系列。其中,價(jià)格由低到高,最受歡迎的王牌產(chǎn)品有:

        圖2 差分平穩(wěn)時(shí)間序列建模步驟

        3 模型的實(shí)現(xiàn)

        3.1 建立模型

        首先,利用Python語言將抓取數(shù)據(jù)對接[4],為后文模型的建立做鋪墊,具體代碼如下所示。

        # arima時(shí)序模型

        # 參數(shù)初始化

        discfile = 'sun_C0.csv'

        forecastnum = 31

        # 讀取數(shù)據(jù),指定日期列為指標(biāo),Pandas自動將“日期”列識別名Datetime格式

        data = pd.read_csv(discfile, index_col='date')

        date_range = pd.date_range(start=min(data.index), end=max(data.index))

        date_df = pd.DataFrame(index=date_range)

        data = pd.merge(date_df, data, left_index=True, right_index=True, how=' left')

        data = data.fillna(method=' ffill')

        print(data)

        從圖3原始序列的時(shí)序圖可以看出2018年1月~2019年2月玉米的歷史銷售價(jià)格波動情況呈現(xiàn)上升趨勢,說明模型沒有達(dá)到平穩(wěn)化要求,需要進(jìn)行處理。進(jìn)一步利用Python語言建立原始序列的自相關(guān)圖。圖4原始序列的自相關(guān)圖顯示玉米銷售價(jià)格波動具有很強(qiáng)的非平穩(wěn)性。

        圖3 原始序列的時(shí)序圖

        圖4 原始序列的自相關(guān)圖

        通過一階差分運(yùn)算對原始數(shù)據(jù)序列進(jìn)行平穩(wěn)化處理,使玉米銷售價(jià)格波動趨向平穩(wěn),如圖5所示。

        圖5 一階差分之后序列的時(shí)序圖

        利用差分運(yùn)算轉(zhuǎn)化得到新的自相關(guān)圖和偏自相關(guān)圖,如圖6和圖7。結(jié)果顯示玉米銷售價(jià)格波動趨向穩(wěn)定。

        圖6 一階差分之后序列的自相關(guān)圖

        圖7 一階差分之后序列的偏自相關(guān)圖

        3.2 模型檢驗(yàn)

        利用表2原始序列的單位根檢驗(yàn)所示,進(jìn)一步證明數(shù)據(jù)趨向穩(wěn)定性得到可靠的模型來提前預(yù)測短期玉米銷售價(jià)格的實(shí)際情況,為農(nóng)業(yè)預(yù)測合理數(shù)據(jù),避免供大于求或供不應(yīng)求的現(xiàn)象。差分序列的單位根檢驗(yàn)如表3所示。

        表2 原始序列的單位根檢驗(yàn)

        表3 差分序列的單位根檢驗(yàn)

        表2和表3數(shù)據(jù)顯示,原始序列的單位根檢驗(yàn)沒有使模型平穩(wěn)化。然后通過差分序列之后得到的單位根檢驗(yàn)數(shù)據(jù)逐漸趨向平穩(wěn),通過P值可以看到其結(jié)果小于0.05,證明新的序列已達(dá)到平穩(wěn)。

        3.3 模型預(yù)測

        建立的ARIMA模型進(jìn)行短期預(yù)測,為了得到可靠合理的數(shù)據(jù),使誤差降到最小,我們只能做未來1個(gè)月的預(yù)測[5,6]。所以應(yīng)用ARIMA模型對2019/3/1~2019/3/31玉米的銷售價(jià)格數(shù)據(jù)做為期31天的預(yù)測,結(jié)果如表2所示。

        表4 玉米的銷售價(jià)格數(shù)據(jù)

        4 結(jié)語

        本文利用Python語言進(jìn)行程序?qū)崿F(xiàn)ARIMA模型,實(shí)現(xiàn)了玉米銷售價(jià)格的預(yù)測。通過建立模型得到可視化預(yù)測圖表以驗(yàn)證模型的可靠性,并形象直觀表達(dá)價(jià)格波動情況,得到為期1個(gè)月的短期預(yù)測數(shù)據(jù)。該模型的優(yōu)點(diǎn)是,在短期預(yù)測中誤差較小、數(shù)據(jù)變化較穩(wěn)定。但在長期預(yù)測中,由于時(shí)間延遲,數(shù)據(jù)波動較大,預(yù)測結(jié)果尚不穩(wěn)定。

        猜你喜歡
        銷售價(jià)格單位根爬蟲
        利用網(wǎng)絡(luò)爬蟲技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說
        基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
        70大中城市房價(jià)同比下跌城市增多
        利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
        電子測試(2018年1期)2018-04-18 11:53:04
        STAR模型下退勢單位根檢驗(yàn)統(tǒng)計(jì)量的比較
        大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
        電子制作(2017年9期)2017-04-17 03:00:46
        基于MCMC算法的貝葉斯面板單位根檢驗(yàn)
        4月份大型零售企業(yè)服裝銷售價(jià)格同比下降12.3%零售額同比微降
        銷售價(jià)格受產(chǎn)出率影響下訂單農(nóng)業(yè)的定價(jià)模型
        ESTAR模型的單位根檢驗(yàn)統(tǒng)計(jì)量及其功效比較
        亚洲 欧美 综合 在线 精品| 色欲av自慰一区二区三区| 亚洲老妈激情一区二区三区| 岛国av无码免费无禁网站下载| 国产999视频| 青青草视频华人绿色在线| 岛国视频在线无码| 精品国产污黄网站在线观看| 亚洲专区路线一路线二网| 上海熟女av黑人在线播放| 亚洲国产精品久久精品 | 男女搞黄在线观看视频| 国产精品亚洲二区在线| 黑人大群体交免费视频| 国产97在线 | 免费| 日韩在线无| 激情五月天俺也去综合网| 久久少妇高潮免费观看| 亚洲av午夜一区二区三| 国产成人av综合色| 999久久久无码国产精品| 国产一级农村无码| 亚洲一道一本快点视频| 精品女同一区二区三区| 日本做受120秒免费视频| 国产美女在线精品免费观看网址| 国产无套视频在线观看香蕉| 99久久久精品国产性黑人| 黄色潮片三级三级三级免费| 国产成人自拍高清在线| 亚洲av日韩综合一区二区三区| 国产精品久久久久久52avav| 亚洲男人堂色偷偷一区| 日韩精品一区二区三区影音视频 | 久久视频在线视频精品| 亚洲精品成人无百码中文毛片| 精品国产一区av天美传媒 | 偷拍美女上厕所一区二区三区| 色噜噜av亚洲色一区二区| 中国极品少妇videossexhd| 欧美激情中文字幕在线一区二区|