虢詩影
(華中科技大學同濟醫(yī)學院附屬同濟醫(yī)院,湖北 武漢 430100)
天然氣是醫(yī)院冬季供暖的主要能源,在日常工作中,我們對于天然氣消耗量與氣象環(huán)境的關系,未作出深刻的認識。在值班日志中,僅記錄當日天氣一個維度,而關于天然氣的消耗量,僅停留在數(shù)值記錄和傳統(tǒng)的歸納統(tǒng)計法上。
為響應國家于2060年前實現(xiàn)碳中和的目標,作為醫(yī)院的后勤部門,完善醫(yī)院的能源管理方案,提升能源利用效率,用現(xiàn)代方法來彌補傳統(tǒng)粗獷管理方案上的不足,是后勤部門一直以來的研究型課題。
在通過現(xiàn)有的統(tǒng)計學方法來預測天然氣消耗量中,對于連續(xù)變化的天氣情況暫不能進行有效的精細化預測。在一些特殊氣象環(huán)境,例如極端的雨雪大風天氣中往往現(xiàn)實結果與預測結果有較大出入。后勤人員雖然已經(jīng)記錄了大量的天然氣消耗的數(shù)值記錄和天氣記錄,卻沒有高效和科學的利用方法,只能依靠自身過往經(jīng)驗來預測,而這些經(jīng)驗推測,帶有很強的主觀性,既無法面對復雜的氣象環(huán)境,也無法作為有效經(jīng)驗來推廣。
充分利用現(xiàn)有的記錄數(shù)據(jù),結合歷史氣象資料,利用機器學習框架TensorFlow對氣象環(huán)境與能源消耗量進行建模,構建具有地方特性氣象環(huán)境與能源消耗量的模型,為后勤工作所保障的區(qū)域提供科學化的預測手段。減少基于個人經(jīng)驗所產(chǎn)生的誤差。
TensorFlow是機器學習領域,被選擇最多的機器學習框架,其可以在CPU和GPU上以數(shù)據(jù)流的形式進行高效的分布式數(shù)值計算。同時,TensorFlow具有跨平臺的特性,不僅可以跑在傳統(tǒng)的Windows上,也可以跑在Linux和Mac OS X上,讓每一個科研人員都可以便捷的使用。
Sequential模型又名順序模型,是函數(shù)式模型的簡單版本,是最簡單的線性,無分叉的順序結構,是多個神經(jīng)網(wǎng)絡“層”的線性疊加,它的每一層都具有一個輸入張量和一個輸出張量。
本文數(shù)據(jù),天氣數(shù)據(jù)部分主要從“中國天氣網(wǎng)”(http://www.weather.com)下載,天然氣消耗量數(shù)據(jù)來自于值班日志。數(shù)據(jù)采樣時間為2019年1月7日~2020年3月2日,數(shù)據(jù)共163組。由于文章篇幅有限,此處僅列出前6天數(shù)據(jù)。表1為天氣與天然氣數(shù)據(jù)表,Gas為當天天然氣的消耗量(m3),Max為最高溫度(℃),Min為最低溫度(℃),Weather為天氣,Wind為風向,Levels為風級。
表1 氣象環(huán)境與天然氣消耗量
(1)訓練數(shù)據(jù)與測試數(shù)據(jù)。通過隨機取值將數(shù)據(jù)分拆為訓練數(shù)據(jù)和測試數(shù)據(jù),其中訓練數(shù)據(jù)占所有數(shù)據(jù)的80%,測試數(shù)據(jù)占20%。
(2)模型的初始化。本文使用一個“Sequential”模型,具備兩個神經(jīng)網(wǎng)絡“層”,包含4801個參數(shù),以及返回單個、連續(xù)的輸出層。將初始化的模型進行500個周期的訓練后,得到一個預測誤差為±540m3的模型結果。
(3)訓練周期和模型“層”數(shù)對結果的影響。神經(jīng)網(wǎng)絡的學習周期和“層”數(shù)對模型預測的準確度有很大的影響,當訓練次數(shù)不夠,或者模型“層”不夠時,訓練結果會不盡人意,這時候叫“欠擬合”狀態(tài),“欠擬合”狀態(tài)代表著神經(jīng)網(wǎng)絡模型尚未學習到訓練數(shù)據(jù)集中的相關特征模式。而太多的訓練周期和“層”不僅會增加訓練和預測的時間,而且會起到相反的效果。當模型過度擬合訓練數(shù)據(jù)時,則模型無法泛化于測試數(shù)據(jù),導致預測結果精度的下降,這時候稱為“過擬合”狀態(tài)。
(4)不同組合的實驗結果。這里僅追求模型預測數(shù)據(jù)的準確性,暫不考慮訓練時間及預測時間的經(jīng)濟性,進行反復迭代的試驗及預測。
如表2所示,最終在“層”數(shù)為7時,訓練周期為2000時,得到了一個較為準確的模型,預測誤差為±489m3,該模型含有6個緊密相連的隱藏層和1個連續(xù)值的輸出層,以及17281個訓練參數(shù)。
表2 模型與誤差
本文通過對真實數(shù)據(jù)的歸納,選定了影響天然氣消耗量的氣象與時空特征8個(每種特征對其影響因數(shù)不同,但對其均產(chǎn)生一定波動。),通過TensorFlow機器學習框架進行機器學習,在Sequential模型下,模型“層”數(shù)量為7,訓練周期為2000時,該模型有相對較好的預測效果,平均誤差±489m3。
本文在常規(guī)天氣的基數(shù)上,加入了年、月、日、天氣、溫度、風向及風級等因素,這有助于提升模型的預測精度,但是,劃分粒度較大,而且由于收集的樣本數(shù)據(jù)有限,供暖時能源消耗量對人群密度、室內(nèi)溫度設定等其他因素有關,因此,想要提高模型的預測精度,后期還需要對這些因素加強更深的研究,也是未來工作努力的方向。
醫(yī)院冬季供暖天然氣取決于多種因素,本文從時間,天氣等角度出發(fā),對能源消耗量做預報研究,采取先進的機器學習框架TensorFlow來代替?zhèn)鹘y(tǒng)的統(tǒng)計學歸納法。該模型的建立為我院后勤在大數(shù)據(jù)人工智能時代背景下的發(fā)展,提供了新的思路和方案。