李 勇,鄭唯加
基于樸素貝葉斯分類器的垃圾分類系統(tǒng)
李 勇1,鄭唯加2
(1.安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院安徽 蚌埠 233030; 2.安徽財(cái)經(jīng)大學(xué) 金融學(xué)院,安徽 蚌埠 233030)
選取2008—2018年上海市生活垃圾數(shù)據(jù),首先利用灰色預(yù)測(cè)模型對(duì)未來4年垃圾產(chǎn)生量進(jìn)行預(yù)測(cè)得出:未來垃圾產(chǎn)生量將會(huì)繼續(xù)增長(zhǎng),給出垃圾分類的必要性;然后設(shè)計(jì)樸素貝葉斯分類器,使用已有數(shù)據(jù)進(jìn)行訓(xùn)練,建立生活垃圾分類系統(tǒng)并給出分類判斷標(biāo)準(zhǔn);最后,結(jié)合垃圾分類系統(tǒng)給出相應(yīng)的政策建議,以便更準(zhǔn)確高效地進(jìn)行垃圾分類處理。
樸素貝葉斯分類器;灰色預(yù)測(cè)模型;垃圾分類;上海
為方便問題研究,本文做出如下假設(shè):(1)假設(shè)垃圾短時(shí)間不會(huì)完全降解;(2)假設(shè)人口不會(huì)較大幅度波動(dòng)而是穩(wěn)定在正常值。為驗(yàn)證實(shí)施高效準(zhǔn)確垃圾分類的必要性,根據(jù)2008-2018年上海生活垃圾每年的總產(chǎn)生量,利用GM(1,1)灰色預(yù)測(cè)模型對(duì)上海2019-2022年生活垃圾產(chǎn)生量進(jìn)行預(yù)測(cè)。
灰色系統(tǒng)理論自提出以來,廣泛應(yīng)用于經(jīng)濟(jì)管理和教育科學(xué)等領(lǐng)域。關(guān)于數(shù)列預(yù)測(cè)的單變量一階微分的GM(1,1)預(yù)測(cè)模型[4]是使用最廣泛的一種灰色預(yù)測(cè)模型。該模型的原理[5]可以簡(jiǎn)要概括為:首先利用累加的方法使數(shù)據(jù)具有指數(shù)規(guī)律,然后建立一階微分方程并對(duì)其進(jìn)行求解,最后將求得的結(jié)果再累減還原,即可得到灰色預(yù)測(cè)值?;疑到y(tǒng)GM(1,1)預(yù)測(cè)模型的建模分析具體步驟[6]如下:
與此同時(shí),還不斷加大了全縣77個(gè)探礦權(quán)的科學(xué)規(guī)范管理,與河南省地質(zhì)調(diào)查院等22個(gè)地勘單位建立了合作關(guān)系。全縣不僅又探明鉬金屬233萬t,而且還新探明白鎢59萬t,鉛鋅126萬t,黃金74萬t,為本縣的礦產(chǎn)資源可持續(xù)發(fā)展提供了充分的資源保障。
首先,利用MATLAB軟件對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,通過計(jì)算發(fā)現(xiàn)數(shù)據(jù)的級(jí)比均落在可容覆蓋內(nèi),因此無需對(duì)原始數(shù)據(jù)進(jìn)行平移變換,可以直接對(duì)其進(jìn)行灰色預(yù)測(cè)建模。然后,根據(jù)已有數(shù)據(jù),利用MATLAB軟件設(shè)計(jì)程序計(jì)算出2019-2022年的上海垃圾產(chǎn)生量的預(yù)測(cè)值。
如圖1所示,可以看出GM(1,1)預(yù)測(cè)模型在預(yù)測(cè)時(shí)基本無較大差距,預(yù)測(cè)值與真實(shí)值之間偏差較小。從圖中可以看到,上海作為一個(gè)高密度的人口城市,未來4年每年的垃圾總產(chǎn)量呈現(xiàn)出繼續(xù)增長(zhǎng)的態(tài)勢(shì)。因此,實(shí)施垃圾分類十分必要,垃圾分類過程中,如何實(shí)現(xiàn)精準(zhǔn)高效分類成為資源高效處理利用的關(guān)鍵點(diǎn)。
圖1 上海生活垃圾產(chǎn)生總量實(shí)際與擬合預(yù)測(cè)圖
為方便研究,假設(shè)貝葉斯分類器中的每個(gè)屬性獨(dú)立地對(duì)分類結(jié)果發(fā)生影響且所有因子都相互獨(dú)立。由于樸素貝葉斯分類器采用屬性條件獨(dú)立假設(shè),可以避免貝葉斯的公式難以從有限的訓(xùn)練樣本直接估計(jì)后驗(yàn)概率的困難[7-8]。因此,本文選擇樸素貝葉斯分類器,利用上海市的垃圾分類數(shù)據(jù),對(duì)分類器進(jìn)行訓(xùn)練,從而建立垃圾分類系統(tǒng)。
如果
如果各個(gè)特征屬性是條件獨(dú)立的,則根據(jù)貝葉斯定理有如下推導(dǎo):
因?yàn)榉帜笇?duì)于所有類別為常數(shù),因?yàn)橹灰獙⒎肿幼畲蠡钥?。又因?yàn)楦魈卣鲗傩允菞l件獨(dú)立的,所以有:
根據(jù)上述分析,本文針對(duì)垃圾分類設(shè)計(jì)如下樸素貝葉斯分類的流程,如圖2所示。
埋填、堆肥;
(3)獲取訓(xùn)練樣本。本文利用上海市2017年的垃圾處理數(shù)據(jù)作為訓(xùn)練樣本。
(4)計(jì)算訓(xùn)練樣本中每個(gè)類別的頻率。使用訓(xùn)練樣本中數(shù)據(jù)計(jì)算得到表1。
表1 各類別頻率表
(5)計(jì)算每個(gè)類別條件下各個(gè)特征屬性劃分的頻率,見表2。
表2 各特征屬性劃分頻率表
(6)使用分類器進(jìn)行測(cè)試。使用訓(xùn)練好的分類器選取單位垃圾測(cè)試分類精度,得到如下分類概率,見表3。
表3 各類別相應(yīng)概率表
從結(jié)果中可以看到,該單位垃圾應(yīng)焚燒處理,通過分類器的鑒別,將其歸入可回收垃圾類別。經(jīng)檢驗(yàn)核對(duì),該單位垃圾屬于可回收垃圾。這表明當(dāng)特征屬性較多時(shí),樸素貝葉斯分類器對(duì)個(gè)別屬性具有抗干擾性。
(7)使用分類器進(jìn)行整體鑒別。使用經(jīng)過預(yù)鑒別的分類器對(duì)全體樣本進(jìn)行分類,并與真實(shí)數(shù)據(jù)進(jìn)行比對(duì),利用表示分類效果,越接近1代表與真實(shí)數(shù)據(jù)越接近,分類效果越好。得到分類器效果如表4所示。
表4 分類器效果表
本文使用灰色預(yù)測(cè)模型對(duì)上海市未來垃圾產(chǎn)生量進(jìn)行預(yù)測(cè),該模型預(yù)測(cè)不需要大量的樣本且不要求數(shù)據(jù)具有規(guī)律性分布,計(jì)算量小且具有相對(duì)較高的精度。后續(xù)考慮利用函數(shù)變換、灰色系統(tǒng)建模理論和演化算法理論對(duì)灰色預(yù)測(cè)模型進(jìn)行改進(jìn)研究。本文采用的樸素貝葉斯分類器具有相對(duì)穩(wěn)定的分類效率,對(duì)小規(guī)模的數(shù)據(jù)表現(xiàn)很好,能處理多分類任務(wù),適合增量式訓(xùn)練,尤其是數(shù)據(jù)量超出內(nèi)存時(shí),可以一批批的去增量訓(xùn)練。
結(jié)合基于樸素貝葉斯分類器建立的上海市垃圾分類系統(tǒng),本文給出以下建議:(1)加強(qiáng)生活垃圾分類投放的宣傳和指導(dǎo)工作,建立不同種類垃圾的壓縮收集網(wǎng)點(diǎn),將分類回收的垃圾分別運(yùn)送至定點(diǎn)進(jìn)行集中處理;(2)對(duì)于企業(yè)和單位產(chǎn)生的大件垃圾,安排專人進(jìn)行回收處理;(3)完善相關(guān)的制度與法規(guī),爭(zhēng)取實(shí)現(xiàn)政府引導(dǎo)、相關(guān)部門監(jiān)督、全民參與。全面提升垃圾回收效率與利用率,實(shí)現(xiàn)垃圾的資源化與無害化處理。
[1] 顧旺. 我國(guó)城市垃圾分類處理問題研究[D]. 南京: 南京理工大學(xué), 2015.
[2] 吳雙金. 上海市社區(qū)生活垃圾分類激勵(lì)機(jī)制實(shí)效探索[D]. 上海: 華東理工大學(xué), 2016.
[3] 任翔宇. 基于系統(tǒng)調(diào)控視角的城市大型生活垃圾處置設(shè)施鄰避問題的影響因素評(píng)估[D]. 上海: 華東師范大學(xué), 2016.
[4] 曹雪靜, 王海霞, 李同興. 多變量灰色預(yù)測(cè)模型在國(guó)民生產(chǎn)總值指數(shù)預(yù)測(cè)中的應(yīng)用[J]. 曲阜師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2020, 46(1): 47-51.
[5] Julong D. Introduction to grey system theory[J]. Journal of Grey System, 1989, 1(1): 1-24.
[6] 楊名桂, 楊曉霞. 基于灰色預(yù)測(cè)模型的重慶市入境旅游客流量預(yù)測(cè)[J]. 西南師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2010, 35(3): 259-263.
[7] 杜婷. 基于屬性選擇的樸素貝葉斯分類研究與應(yīng)用[D]. 合肥: 中國(guó)科學(xué)技術(shù)大學(xué), 2016.
[8] 阿曼. 樸素貝葉斯分類算法的研究與應(yīng)用[D]. 大連: 大連理工大學(xué), 2014.
[9] 范彥勤. 基于貝葉斯分類器的個(gè)人信用評(píng)估研究[D]. 西安: 西安電子科技大學(xué), 2014.
[10] 李丹. 基于樸素貝葉斯方法的中文文本分類研究[D]. 保定: 河北大學(xué), 2011.
Garbage Classification System Based on Naive Bayesian Classifier
LI Yong1, ZHENG Wei-jia2
(1.School of Statistics and Applied Mathematics, Anhui University of Finance and Economics, Bengbu 233030, China; 2.School of Finance, Anhui University of Finance and Economics, Bengbu 233030, China)
This paper selects 2008—2018 Shanghai municipal solid waste data, first uses the gray prediction model to predict the garbage production in the next four years, the future garbage production will continue to grow, which obtains the necessity of garbage classification; then designs the naive Bayes classifier, uses the existing data for training, establishes the garbage classification system and gives the classification criteria; finally, combined with the garbage classification system, the corresponding policy recommendations are given in order to more accurately and efficiently carry out garbage classification.
Naive bayes classifier; grey prediction model; garbage classification; Shanghai
TP397.2
A
1674-3261(2021)01-0049-04
10.15916/j.issn1674-3261.2021.01.011
2020-03-29
國(guó)家自然科學(xué)基金資助項(xiàng)目 (11601001); 全國(guó)大學(xué)生數(shù)學(xué)建模組委會(huì)后繼研究(夏令營(yíng)A1401)
李勇(1963-),男,安徽蚌埠人,副教授,碩士。
責(zé)任編校:劉亞兵