陳祖銷,張富生,過偉民,藏照陽,姜舒文,劉劍君,鄭勁民,趙 虎,李俊營*,張艷玲*
1. 中國煙草總公司鄭州煙草研究院,鄭州高新技術產業(yè)開發(fā)區(qū)楓楊街2 號 450001
2. 河南省煙草公司平頂山市公司,河南省平頂山市新華區(qū)建設路263 號 467000
3. 北京市農林科學院信息技術研究中心,北京市海淀區(qū)曙光花園中路11 號 100097
4. 河南省煙草公司,鄭州市鄭東新區(qū)商務外環(huán)路15 號 450001
5. 西南大學工程技術學院,重慶市北碚區(qū)天生路2 號 400700
烤煙煙葉在大田成熟采摘后需裝入烤房在一定的溫濕度條件下進行烘烤,以達到烤干、烤黃、烤香等目的[1]。烘烤過程是煙葉原料品質形成中至關重要的環(huán)節(jié),以烘烤階段劃分、時間管理、溫濕度管理等為核心的烘烤工藝則是決定煙葉烘烤品質的重要因素[2]。近年來,隨著我國燃煤烤房改造和清潔能源烤房升級[3-4],烘烤物聯網數據采集裝備逐漸得到應用,謝守勇等[5]通過GPRS 網絡,利用點對點等方式對烤房溫濕度數據實現遠程傳送。劉志壯等[6]利用RS485 總線網絡設計,以上位機和下位機對烘烤過程中的溫濕度進行遠程監(jiān)測及調控。張保全等[7]提出一種基于物聯網的溫濕度實時監(jiān)測系統(tǒng),利用連接在烤房控制儀與溫濕度傳感器間的數據采集器,采集烤房溫濕度數據并將數據傳送至后臺。趙虎等[8]提出一種基于多通道的煙葉烘烤物聯網通信模塊,可實現烘烤溫濕度的遠程監(jiān)測及風機、電機的遠程控制等功能。目前,烘烤物聯網數據采集裝備在我國部分煙葉產區(qū)已普及,海量烘烤溫濕度數據的分析及應用在改善煙葉烘烤質量中發(fā)揮了巨大作用。然而,由于缺乏數據的有效使用方法,溫濕度數據在烘烤工藝執(zhí)行分析、問題發(fā)掘與改進等方面的作用無法充分發(fā)揮,而且大量數據采集之后面臨數據清洗復雜、挖掘困難等問題。過偉民等[9]基于物聯網大數據對烘烤過程數據進行分析,但中間分析過程主要依賴經驗判斷,無法實現自動化。周文亮等[10]提出一種基于物聯網數據的智能烘烤系統(tǒng),但無法自動識別烘烤階段。韋克蘇等[11]提出基于煙葉圖像識別烘烤過程中的階段控溫點,但存在圖像色彩校正困難和模型精度不高等問題,導致無法對烘烤指標進行精準計算。為此,基于物聯網技術采集烘烤過程烤房干濕球溫度數據,研究開發(fā)數據清洗、溫濕度曲線提取、烘烤階段識別和烘烤工藝指標等分析算法,并對我國13個地區(qū)(市、州)煙葉產區(qū)的烘烤數據進行分析應用,旨在為烘烤過程溫濕度數據的規(guī)范采集和烘烤工藝分析提供依據。
烤房烘烤溫濕度數據的采集采用邊緣采集和遠程傳輸組合方式,具體采集方式見圖1。其中,邊緣采集通過RS485接口串聯溫濕度傳感器和烤房控制儀,進行本地邊緣的烘烤數據采集;遠程傳輸則在烤房控制儀中安裝物聯網4G 通信模塊,并從控制儀的本地存儲中讀取烤房烘烤數據,通過其MODBUS-RTU通信協(xié)議發(fā)送到監(jiān)控平臺。
圖1 數據采集方式Fig.1 Data collection method
本試驗中采集的烘烤溫濕度數據來自2019—2021 年河南省三門峽、信陽、南陽、平頂山、洛陽、濟源、漯河、許昌、駐馬店和湖北省十堰、宜昌、恩施、襄陽等13個地區(qū)(市、州)煙葉產區(qū)的7 369座烤房。具體的烘烤數據格式見表1。
表1 烘烤數據格式Tab.1 Format of flue-curing data
1.2.1 烘烤溫濕度曲線提取
利用物聯網設備采集烘烤過程溫濕度時序數據,運用Python 程序建立算法對每座烤房進行數據清洗、單或多烤次溫濕度曲線識別與提取、烘烤階段識別和烘烤工藝指標分析。
1.2.2 烘烤工藝指標分析
以烤煙烘烤技術規(guī)程(GB/T 23219—2008)[12]為基礎,參考五段五對應[13]、八點式[14]、三段六步式[15]、美式三段式[16]等國內外主要烘烤工藝的關鍵穩(wěn)溫溫度點,提取分析每爐次烘烤數據的烘烤時長、烘烤時間分配、濕球溫度控制、異常掉溫4 類工藝指標,見表2。
表2 烘烤工藝指標分析Tab.2 Indexes of flue-curing process
利用Python3.8 軟件建立數據分析算法;采用SPSS 23.0軟件進行數據的方差分析和聚類分析。
基于溫濕度時序數據的烘烤工藝指標分析算法構建過程見圖2。由圖2中看出,算法構建過程包括數據初步清洗、單爐或多爐次溫濕度曲線分割與終點識別、數據二次清洗、單爐或多爐次溫濕度曲線前端去噪與起點識別、烘烤階段識別與工藝指標提取分析等步驟。
圖2 基于溫濕度時序數據的烘烤工藝指標分析算法構建過程Fig.2 Establishment process and algorithm for flue-curing process indexes based on temperature and humidity data in chronological order
2.1.1 數據初步清洗與無效烤房數據剔除
通過物聯網模塊采集到的干濕球溫度原始數據為基于時間序列的每個烤房若干烤次數據,采集頻率約為5~8 min/次。根據地區(qū)分類,每個地區(qū)多個烤房的數據存放在不同的文件夾下。數據總體存在量大、類型復雜、各種噪聲干擾等問題。原始數據中存在有效單爐次烤房數據、有效多爐次烤房數據和無效烤房數據3種類型。因此,首先對原始數據進行有效數據識別,運用Python 第三方庫Pandas 中的Resample函數對烘烤數據時間序列向下采樣;然后,建立算法識別存在干球溫度大于54.4 ℃(即存在干筋期)且次數大于100次的數據;最后,依據存在至少8 h 左右的干筋期的特征對烘烤曲線進行初步的清洗篩選,避免短時間傳感器失效(顯示100 ℃)帶來的識別錯誤,否則視為無效數據剔除。
2.1.2 溫濕度曲線分割與終點識別
針對有效烤房數據,篩選出干球溫度>54.4 ℃的數據,判定每次數據之間的記錄間隔。若存在記錄間隔大于4 d的數據,則判定為存在多爐次烘烤數據,并以每爐次干球溫度最后一次大于54.4 ℃的時間點作為烘烤結束時間;若不存在,則判定為存在單爐次烘烤數據,并以干球溫度最后一次大于54.4 ℃的時間點作為烘烤結束時間。
2.1.3 數據二次清洗與溫濕度曲線起點識別
繼續(xù)判斷有效溫濕度曲線數據中是否存在干球溫度<42.4 ℃(即存在變黃期)的數據。如果存在,則確定前一步提取的溫濕度曲線為正常曲線;如果不存在,則視為異常曲線剔除。針對正常溫濕度曲線進行前端去噪與起點識別。由于干球溫度數據總體呈鋸齒狀波動,因此需計算<42.4 ℃的數據中平均每2 h 的變化幅度,并統(tǒng)計8 h 內溫度的累計變化值,篩選出大于累計變化最大值×0.8 的所有數據。以第1個數據時間段內的最小值作為烘烤起點,至此獲得每爐次完整的溫濕度曲線。
2.1.4 烘烤總時長及主要烘烤階段時長指標提取
以烘烤起點和終點之間的時間間隔作為烘烤總時長。運用Resample函數對已確定烘烤起止點的有效烘烤數據向下重新采樣,計算干球溫度每2 h的平均值。統(tǒng)計>42.4 ℃的數據,并將第1個干球溫度>42.4 ℃的時間點作為變黃期終點;繼續(xù)向下統(tǒng)計干球溫度每2 h 的平均值>54.4 ℃的數據,并將第1 個>54.4 ℃的時間點作為定色期終點。烘烤起點與變黃期終點之間的時間間隔為變黃期時長,變黃期終點與定色期終點之間的時間間隔為定色期時長,定色期終點與烘烤終點之間的時間間隔為干筋期時長。
2.1.5 烘烤細分階段時長與濕球溫度指標提取
運用Resample函數對已確定烘烤起止點和主要烘烤階段的有效烘烤數據向下重新采樣,計算干球溫度每2 h的平均值。按照各細分階段的溫度范圍,分別統(tǒng)計預變黃期、變黃初期、變黃前期、變黃中期、變黃后期、定色前期、定色中期、定色后期、干筋前期和干筋后期的時長和濕球溫度中位值。由于烘烤過程中因水壺缺水、信號缺失等會造成濕球溫度異常,因此剔除各階段濕球溫度為負數、0和異常偏高(變黃初期>37.4 ℃,變黃前期>38.4 ℃,變黃中期和后期>40.4 ℃,定色前期>42.5 ℃,定色中期~烘烤結束>46.5℃)的數據。
2.1.6 異常掉溫次數統(tǒng)計
運用Resample函數對有效烘烤數據向下重新采樣,計算干球溫度每1 h的平均值。計算相鄰時間點干球溫度每1 h的平均值的差值,并統(tǒng)計干球溫度差值<-3 ℃的數據個數,即為對應烘烤時期的掉溫次數。如果烘烤終點前3 h 存在干球溫度差值<-3 ℃,則這些數據個數不計為掉溫次數。
2.2.1 提取數據概況
通過算法對2019—2021年13個地區(qū)(市、州)煙葉產區(qū)的烘烤溫濕度數據進行處理(表3)。從7 367座烤房中共提取出14 214 爐次溫濕度數據,其中存在5%左右烘烤總時長異常偏低的有效數據。經逐條對比原始數據后發(fā)現,此類數據是由于烘烤開始階段出現大幅度掉溫進而造成識別的烘烤起點晚于實際烘烤起點。在后續(xù)分析中,此類數據予以剔除,因此共提取到13 493爐次有效烘烤溫濕度數據。
表3 提取的烘烤數據的分布Tab.3 Distribution of extracted flue-curing data
2.2.2 烘烤過程時間管理分析
由表4可知,13個地區(qū)(市、州)煙葉產區(qū)烘烤總時長為171.7 h,變黃期、定色期、干筋期時長以及各自占比分別為69.5 h(39.8%)、60.6 h(35.7%)和41.6 h(24.5%)。不同產區(qū)之間存在顯著差異,其中變黃期和干筋期時長的差異相對較大。各產區(qū)烘烤總時長為139.1 ~188.5 h,其中平頂山、恩施和宜昌顯著高于其他產區(qū),烘烤總時長在185 h 以上,而信陽顯著低于其他產區(qū),烘烤總時長為139 h左右。變黃期時長為54.5 ~98.1 h,其中平頂山和許昌顯著高于其他產區(qū),時長在97 h左右,而信陽顯著較低。定色期時長為48.9 ~69.7 h,其中襄陽、十堰、洛陽和濟源顯著較長,時長在65 h以上,而許昌和信陽顯著較低,在50 h以內。干筋期時長在34.1 ~58.7 h,其中恩施、宜昌和三門峽顯著較高,接近或超過50 h,而平頂山、許昌、漯河、南陽、信陽和濟源顯著較低,在35 h 左右。從烘烤三階段時間分配來看,各產區(qū)變黃期時長占比為33.7%~53.2%,定色期時長占比為27.5%~41.2%,干筋期時長占比為19.3%~31.7%。
表4 不同煙葉產區(qū)烘烤過程時間管理①Tab.4 Time management during flue-curing process in different tobacco producing areas
以上述7 項烘烤時長和烘烤時間分配指標為變量,對不同產區(qū)煙葉烘烤過程時間管理進行系統(tǒng)聚類分析,結果見圖3 和表5。13 個地區(qū)(市、州)煙葉產區(qū)可較好地聚為3類:第Ⅰ類產區(qū)烘烤總時長和干筋期時長較長,變黃期和定色期時長接近,包括恩施、十堰、襄陽、宜昌、洛陽和三門峽;第Ⅱ類產區(qū)烘烤總時長和變黃期時長較長,定色期和干筋期時長較短,包括平頂山和許昌;第Ⅲ類產區(qū)烘烤總時長較短,變黃期和定色期時長接近,包括濟源、信陽、駐馬店、南陽和漯河。
表5 烘烤過程不同時間管理分類的烘烤時長與時間分配Tab.5 Flue-curing duration and time allocation of different time management categories during flue-curing
圖3 不同產區(qū)烘烤過程時間管理的聚類分析樹狀圖Fig.3 Tree diagram for cluster analysis on time management during flue-curing in different producing areas
2.2.3 烘烤過程濕度管理分析
由表6可知,13個地區(qū)(市、州)煙葉產區(qū)烘烤過程變黃前期、變黃中期、變黃后期、定色前期、定色中期、定色后期和干筋后期濕球溫度的平均值分別為36.3 ℃、36.7 ℃、36.1 ℃、35.6 ℃、36.1 ℃、36.9 ℃和39.5℃。不同產區(qū)之間存在顯著差異,定色前期~干筋后期的差異相對較大。各產區(qū)烘烤變黃前期濕球溫度為35.7 ~36.9 ℃,許昌和十堰顯著較高,三門峽顯著較低。變黃中期濕球溫度為35.6 ~37.4 ℃,十堰顯著較高,平頂山顯著較低。變黃后期濕球溫度為34.5 ~36.9 ℃,南陽、十堰和襄陽顯著較高,平頂山顯著較低。定色前期、定色中期和定色后期濕球溫度分別為34.1 ~36.5 ℃、34.3 ~37.1 ℃和35.2 ~37.8 ℃,南陽、三門峽、十堰、襄陽和信陽等產區(qū)顯著較高,平頂山、漯河和許昌產區(qū)顯著較低。干筋后期濕球溫度為38.3 ~41.1 ℃,信陽和南陽顯著較高,接近41 ℃,平頂山和漯河顯著較低。
表6 不同產區(qū)在各烘烤階段濕球溫度中位值Tab.6 Median values of wet bulb temperature in different producing areas at each flue-curing stage(℃)
以上述7項烘烤過程濕球溫度指標為變量,對不同產區(qū)煙葉烘烤濕度管理進行系統(tǒng)聚類分析,結果見圖4和表7。13個地(市、州)煙葉產區(qū)可較好地聚為3類,Ⅰ類產區(qū)變黃后期~干筋后期濕球溫度較高,相對較高濕度調控烘烤,包括南陽、三門峽、信陽、十堰和襄陽;Ⅱ類產區(qū)變黃后期~干筋后期濕球溫度中等,相對中等濕度調控烘烤,包括恩施、宜昌、濟源、洛陽和駐馬店;Ⅲ類產區(qū)變黃后期~干筋后期濕球溫度較低,相對較低濕度調控烘烤,包括許昌、平頂山和漯河。
表7 烘烤過程不同濕度管理分類的烘烤過程濕球溫度Tab.7 Wet bulb temperatures of flue-curing process for different humidity management categories during flue-curing(℃)
圖4 不同產區(qū)烘烤過程濕度管理的聚類分析樹狀圖Fig.4 Tree diagram for cluster analysis of humidity management during flue-curing in different producing areas
2.2.4 烘烤過程異常掉溫分析
烘烤過程各階段掉溫次數統(tǒng)計結果見表8。由表8中看出,掉溫次數由變黃期至干筋期依次增加。各產區(qū)每爐次烘烤變黃期的平均掉溫次數為0.04~0.26 次,平頂山顯著較高。定色期的平均掉溫次數為0.04~0.57 次,恩施顯著較高,宜昌顯著較低。干筋期的平均掉溫次數為0.28~1.71 次,恩施顯著較高,漯河顯著較低。
表8 烘烤過程各階段平均掉溫次數統(tǒng)計Tab.8 Statistics on the average number of temperature drop in each stage of flue-curing process(次)
基于物聯網技術采集了烘烤過程溫濕度數據,建立了烘烤工藝指標自動分析算法,包括數據初步清洗與無效烤房數據剔除、溫濕度曲線分割與終點識別、數據二次清洗與溫濕度曲線起點識別、烘烤總時長與主要烘烤階段時長指標提取、烘烤細分階段時長與濕球溫度指標提取、異常掉溫次數統(tǒng)計等一系列步驟,可準確分割海量溫濕度數據中的每一爐次烘烤工藝溫濕度曲線,并自動分析烘烤過程時間和溫濕度管理、異常掉溫等指標,為科學解析與挖掘溫濕度數據、拓寬數據用途提供了新方法。在楊禎等[17]、李時杰等[18]、吳玉康等[19]和魏訪等[20]的環(huán)境溫濕度在線監(jiān)測技術研究基礎上,進一步探討了溫濕度數據的深度利用方法。與廖建尚[21]、楊柳等[22]、周海鴻等[23]和楊信廷等[24]對環(huán)境溫濕度數據處理的效果不同,本研究中對數據快速分離、去噪的同時,還能夠進一步提取煙葉烘烤工藝指標,可為烘烤工藝大數據分析和優(yōu)化提供支撐。
在掉溫次數統(tǒng)計中,存在部分掉溫次數未統(tǒng)計完全,這是由于部分烤房的溫度曲線波動過大,當連續(xù)兩次掉溫時間接近,或者第一次掉溫后升溫不久(但未升到原始溫度)再次掉溫時,均識別認定為1次掉溫,這對掉溫次數統(tǒng)計結果存在一定影響。掉溫次數主要集中在干筋期,可能是干筋期烘烤溫度較高,對烤房加熱系統(tǒng)要求較高,易出現掉溫,導致干筋期掉溫次數較前兩個階段增多。
利用算法分析13 個地區(qū)(市、州)煙葉產區(qū)的烘烤工藝指標,發(fā)現煙葉烘烤總時長的平均值為171.7 h,變黃期、定色期、干筋期的時長占比為39.8%、35.7%和24.5%,與津巴布韋煙葉6.5 ~7.5 d的烘烤總時間接近[25-26],與孫福山等[13]、汪伯軍等[15]提出的推薦烘烤工藝的時間管理特征相似,這說明算法分析結果與現有報道相符。本研究中發(fā)現,不同產區(qū)煙葉烘烤工藝的時間管理特征存在區(qū)域性差異,湖北4個產區(qū)和豫西2個產區(qū)呈現烘烤總時間和干筋期時間較長,變黃期和定色期時間接近的特點;豫中許昌和平頂山產區(qū)呈現烘烤總時間和變黃期時間長,定色期和干筋期時間短的特點;南陽、駐馬店等豫南產區(qū)則呈現烘烤總時間較短,變黃期和定色期時間接近的特點。這種差異與各產區(qū)鮮煙葉素質、成熟期氣象條件不同有關,如豫中平原煙區(qū)水肥條件較好,煙葉單葉重較大,葉片相對寬厚,需要較長時間完成煙葉變黃。從烘烤工藝的濕度管理特征來看,與其他大多數烘烤工藝研究報道相比[12-15],本研究中的煙葉烘烤變黃后期~干筋期濕球溫度整體偏低1~2 ℃,烘烤中后期環(huán)境濕度偏低,可能造成烘烤過程中煙葉干燥過早,影響顏色和香味物質形成[27-28]。總體而言,不同產區(qū)實際執(zhí)行的烘烤工藝存在較明顯差異。一方面說明烘烤過程工藝管理具有復雜性,受烘烤人員主觀認識、生態(tài)環(huán)境和鮮煙葉素質等主客觀條件的綜合影響,另一方面也提示進一步加強烘烤工藝基礎研究、提高烘烤工藝與特定生態(tài)環(huán)境匹配度的必要性[29]。
在大數據應用中,本研究中提出的算法有較好的可用性,能夠準確、快速、便捷地對溫濕度數據進行清洗和處理分析,為烘烤工藝數字化分析提供可靠方法。下一步將依據本研究中建立的數據分析方法,結合鮮煙葉素質、烤后煙葉質量開展更為系統(tǒng)的工藝評價和個性化調優(yōu)。此外,對于極端異常的烘烤溫濕度數據,如何高效前端去噪、準確判斷烘烤起點、精確統(tǒng)計掉溫次數等仍有待優(yōu)化研究。
建立了基于烤房溫濕度時序數據的烘烤工藝指標分析算法,該方法能夠對基于物聯網技術采集的溫濕度數據進行數據清洗、溫濕度曲線提取和烘烤工藝指標自動分析。通過對2019—2021 年我國13個地區(qū)(市、州)煙葉產區(qū)的13 493 爐次烘烤溫濕度數據分析,明確了烘烤過程的時間管理現狀為總時長139.1~188.5 h,變黃期、定色期、干筋期占烘烤總時長的比例分別為33.7%~53.2%、27.5%~41.2%和19.3%~31.7%;濕度管理現狀為變黃前期~干筋后期7 個細分階段的濕球溫度分別為35.7~36.9 ℃、35.6~37.4 ℃、34.5~36.9 ℃、34.1~36.5 ℃、34.3~37.1 ℃、35.2~37.8 ℃和38.3~41.1 ℃。提出了烘烤過程時間管理具有區(qū)域性差異、烘烤中后期濕球溫度整體偏低等烘烤工藝特征。