黃澤遠 李林峰 向政瑞 北京理工大學計算機學院
阿片類藥物是用于復制鴉片的具有疼痛誘發(fā)特性的藥物。它們包括用于治療急性或慢性疼痛的嗎啡,羥考酮或氫可酮等合法止痛藥,以及海洛因或非法制造的芬太尼等非法藥物?!鞍⑵愃幬铩币辉~源于“鴉片”一詞。目前,美國正在經歷一場關于使用合成和非合成阿片類藥物的國家危機。專家說,美國正處于阿片類藥物流行的陣痛中,因為超過兩百萬美國人已經開始依賴或濫用處方止痛藥和街頭毒品。2015 年,過量使用該類藥物使美國人死于汽車碰撞和槍支事故的人數增加[2]。每日有142 人因使用過量藥物死亡,其中91 人來自阿片類藥物,據統(tǒng)計,2015 年累計死亡人數近52,000 人。2017 年,美國超過72,000 人死于過量使用藥物,其中49,068 人涉及阿片類藥物。
K 均值聚類是一種無監(jiān)督的機器學習方法,用于確定一組數據中是否存在任何結構。本文中,我們假設與一個州的傳播相比,藥物州際的傳播是微不足道的。這種假設是合理的,因為美國不同州的法律不同,因此我們認為藥物在各州之間的傳播將更加困難。本文使用的距離是由歐幾里德空間的兩個范數引起的。在每次迭代中更新集群中心的方法是將其替換為每個集群中樣本的算術平均值??梢栽跉W幾里得空間中證明這種更新可以降低成本函數的值,這意味著將中心在幾何上移動到重心。我們希望找到隨著年份變化具有相似DR變化趨勢的縣群,因為如果一組急劇減少而另一組明顯上升,我們可以相信一些藥物從減少組轉移到上升組。藥物可能在一組中傳播,但與一般趨勢相比可忽略不計。
因為有幾個縣的價值非常高,我們提供放大的數字,標記為“已調整”。我們可以看到具有相同顏色的線條(意味著同一簇中的縣)往往具有相同的波動趨勢。這些線看起來太模糊了,我們提供的數字較少。
可以很容易地看出,同一群集中的縣DR 的變化表現相對相似,因此在群集中傳播的頻率可能較低。
為簡化起見,原始狀態(tài)圖將標注為原點,原始狀態(tài)圖(已調整)將標注為已調整,較少集群的數字將標注為部分。從上面我們可以看到,K-means 成功地抓住了具有類似趨勢的縣并將它們分成一個群集,我們有理由相信群集之間的傳播將更加頻繁。如果我們的假設是正確的,那么每年DR 的前五名應該集中在2 或3 個集群中。
每個州的聚類結果如下圖所示:
圖1 弗吉尼亞州的起源圖
圖2 VA 州的起源圖(已調整)
圖3 VA 州某兩個國家集群
本文預測了2017 年各研究范圍內各州的DR 值,每個DR 最高的州的前五個縣被確定為國家關注的縣。結果如表1 所示。
表1 ARIMA 的結果
預測結果如下圖所示,顯示了2010 - 2017 年的動態(tài)變化。本文分析了各州五個縣的未來變化,確定了州政府應該具體關注的地點。
圖4 州KY 和州OH
圖5 州PA 和州VA
圖6 華盛頓州
(1)州KY:
1)盡管預測結果顯示2017 年杰斐遜將急劇下降,但由于藥物報告預測最高,因此仍然需要特別關注。
2)預計費耶特維爾將在2017 年有所增加,所以應該為該縣做出更多努力。
3)預計肯頓、坎貝爾、佩里將在2017 年保持穩(wěn)定,但考慮到藥物報告的預測值很高,所以這3 個縣狀況仍然需要擔憂。
(2)州OH:
擁有最高預測藥物報告的OH 州前五縣仍然需要特別關注,因為它們是該州最高的縣。
(3)州PA:
1)費城需要特別關注,因為它的藥物報告很高,并且從2014 年開始急劇增加。
2)阿勒格尼仍然需要關注,因為它的藥物檢測報告很高。
(4)州VA:
亨利科和斯波茨瓦尼亞由于急劇增加而需要特別關注。
(5)華盛頓州:
哈里森和伯克利都需要特別關注,因為他們近3 年來急劇增加。但是,由于五個縣之間的差異不大,所以政府應該對每個縣都盡最大努力。