曹金鳳,郭繼鴻,李建偉,蘇天赟
(1.青島理工大學(xué) a.機(jī)械與汽車工程學(xué)院;b.土木工程學(xué)院,山東 青島 266520;2.中海油能源發(fā)展股份有限公司安全環(huán)保分公司,天津 300450;3.自然資源部第一海洋研究所,山東 青島 266061)
海洋溢油事故是導(dǎo)致海洋環(huán)境污染的重要因素之一,也會對海洋生態(tài)系統(tǒng)造成嚴(yán)重且不可逆的影響。溢油從井口噴射進(jìn)入海水后將以射流的形式運(yùn)動,油滴粒徑的分布特征決定了油滴的總體運(yùn)動狀態(tài),從而影響溢油是否會上浮到海水表面或是在水體中分散[1]。海底條件復(fù)雜多樣,亟須考察多種工況下(諸如不同溫度、噴射口直徑等)油滴粒徑分布。
許多學(xué)者通過室內(nèi)水槽實(shí)驗(yàn),實(shí)現(xiàn)對油滴流速、溫度、噴射口直徑等多種狀態(tài)的準(zhǔn)確控制,從而模擬多工況下的油滴運(yùn)動[2-6]。在水槽實(shí)驗(yàn)中,需要人工標(biāo)定和篩選實(shí)驗(yàn)圖片中的油滴區(qū)域,較為繁瑣和不便,適用于試驗(yàn)規(guī)模較小且試驗(yàn)條件有限的情況,對大量試驗(yàn)圖片進(jìn)行快速準(zhǔn)確的識別和篩選,難度較大且效率較低。
機(jī)器學(xué)習(xí)由于能夠從大量數(shù)據(jù)中學(xué)習(xí),從而獲得數(shù)據(jù)的關(guān)鍵特征,因此,被廣泛應(yīng)用于圖像識別領(lǐng)域。有學(xué)者開展了相關(guān)研究[7-11]。
為了實(shí)現(xiàn)對大量油滴圖片快速準(zhǔn)確識別,本文提出了一種基于支持向量機(jī)(SVM)的油滴識別和粒徑分布特征提取算法。為了驗(yàn)證該算法處理實(shí)際圖片的可行性,選用圖片均來自通過工業(yè)相機(jī)拍攝的室內(nèi)水槽溢油噴射實(shí)驗(yàn)圖片,并將識別結(jié)果與經(jīng)典粒徑分布模型Rosin-Rammler模型對比。實(shí)驗(yàn)結(jié)果表明,該算法能夠快速識別油滴圖片,并統(tǒng)計油滴的粒徑分布,為海底溢油應(yīng)急搶險提供了理論基礎(chǔ)。
研究選取的水下溢油模擬實(shí)驗(yàn)水槽裝置見圖1、2,由水槽槽體、注油系統(tǒng)和控制柜構(gòu)成;注油系統(tǒng)管路見圖3。水槽高2 m、底面尺度1 m×1 m,工作水深1.8 m。整個實(shí)驗(yàn)過程采用工業(yè)計算機(jī)控制,輸油齒輪泵由變頻器控制,可人工調(diào)節(jié)管路中油樣的流量。
圖1 實(shí)驗(yàn)室水下溢油模擬實(shí)驗(yàn)水槽
圖2 實(shí)驗(yàn)水槽
研究過程中使用的原油油樣和天然海水的物理性質(zhì)分別見表1、2。
表1 原油油樣物理性質(zhì)
注:ρ-密度,kg/m3;μ-運(yùn)動黏度,mm2/s;t-溫度,℃。
表2 天然海水的性質(zhì)
用2臺工業(yè)相機(jī)分別拍攝含較大油滴和較小油滴的溢油圖片。測定較大油滴粒徑的相機(jī)幀速率50幀/s,分辨率為200萬像素(2 048像素×1 088像素),感光芯片名稱CMV2000,鏡頭分辨率200 μm。該相機(jī)掛于水槽外,相機(jī)鏡頭中心離噴嘴豎直距離為1.5 m。實(shí)驗(yàn)前,應(yīng)用有機(jī)玻璃直尺(最小刻度1 mm)對測試區(qū)進(jìn)行了尺度標(biāo)定。測定較小油滴粒徑的相機(jī)幀速率17幀/s,分辨率500萬像素(2 456像素×2 058像素),感光芯片名稱ICX625,鏡頭分辨率5.8 μm。該相機(jī)掛于水槽內(nèi),相機(jī)鏡頭中心離噴嘴豎直距離為1.5 m。實(shí)驗(yàn)前,應(yīng)用顯微鏡C4測微尺(最小刻度50 μm)對測試區(qū)進(jìn)行了尺度標(biāo)定。
對實(shí)驗(yàn)圖片處理包括濾波和分割2個部分,處理流程見圖4。
圖4 對油滴圖片進(jìn)行處理和分割的工作流程
獲取的原始圖片背景中含有大量噪聲,背景噪聲的存在將直接影響最終的分割效果,因此,需要對圖片進(jìn)行濾波處理,減少噪聲對于分割圖片的干擾。
濾波圖像的灰度均值和標(biāo)準(zhǔn)差越接近原始圖像,圖像平滑指數(shù)越大,則濾波圖片對于原始圖片保留的信息越多,去噪聲效果越好[12]。表3給出了對于同一幅灰度圖片,選取35×35窗口,分別采用均值濾波、高斯濾波和中值濾波時,濾波圖片各指標(biāo)對比原始圖片的結(jié)果。
表3 濾波圖片各指標(biāo)對比原始圖片結(jié)果
除此之外,濾波器窗口的大小也會影響到濾波圖片效果。濾波窗口越大,圖片原始信息丟失越多,噪聲抑制效果越好。圖5分別給出了同一幅圖片分別選取5×5,7×7,35×35濾波窗口時的高斯濾波效果。
圖5 不同濾波窗口效果比較
比較表3和圖5可見,高斯濾波在充分抑制背景噪聲的同時,對于原始圖片的信息保留最多。因此,選用窗口尺寸為35×35的高斯濾波器對原始圖片進(jìn)行濾波處理。
圖像閾值分割方法主要包括:固定閾值分割、自適應(yīng)均值閾值分割和最大類間方差法(Otsu)。圖6b),c),d)分別給出了固定閾值、Otsu算法以及自適應(yīng)均值閾值分割的分割效果。
圖6 不同閾值算法的分割效果比較
比較圖6b)、c)、d)3種閾值算法,可以看出,自適應(yīng)均值閾值算法和Ostu算法都可以很好地將油滴區(qū)域和背景區(qū)分開來,但前者還可以將油滴區(qū)域的邊界顯示出來,并排除掉重疊的油滴區(qū)域,因此,本文選取均值自適應(yīng)均值閾值分割法對油滴區(qū)域進(jìn)行圖像分割。
在諸多機(jī)器學(xué)習(xí)算法中,SVM算法由于對數(shù)據(jù)樣本的需求量少,且可以處理復(fù)雜的非線性方程,被廣泛應(yīng)用于圖像識別和故障診斷。
支持向量機(jī)理論來自于數(shù)據(jù)分類問題的處理,試圖尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,能夠使超平面兩側(cè)的空白區(qū)域最大化。理論上,支持向量機(jī)能夠?qū)崿F(xiàn)對線性可分?jǐn)?shù)據(jù)的最優(yōu)分類。隨后,文獻(xiàn)[13]通過引入核映射方法將非線性問題轉(zhuǎn)化為高維空間的線性可分問題來解決。
圖7給出了支持向量機(jī)的分類原理:空心點(diǎn)和實(shí)心點(diǎn)分別表示特征空間中2種不同類別的數(shù)據(jù);H為能夠?qū)深悢?shù)據(jù)正確區(qū)分的線;H1和H2為能夠?qū)?種數(shù)據(jù)分開且平行于分類線的最外側(cè)直線,二者之間的距離即為2類數(shù)據(jù)的分類間隔(margin)。支持向量機(jī)的訓(xùn)練目標(biāo)就是使分類間隔達(dá)到最大,此時H1和H2上的點(diǎn)即為支持向量,H1和H2之間的距離即為兩類數(shù)據(jù)的最大分類間隔,H則為最優(yōu)分類線。將其推廣到高維特征空間中,最優(yōu)分類線則成為最優(yōu)分類超平面。
圖7 最優(yōu)分類面
上述討論僅適用于數(shù)據(jù)線性可分的情況,在許多問題中,樣本集通常是線性不可分的,此時可以通過適當(dāng)引入核函數(shù)K(x(i),x(j))來實(shí)現(xiàn)非線性變換后的線性分類,并不再增加計算的復(fù)雜度,核函數(shù)的可選種類較多,本文在研究過程中選用學(xué)習(xí)能力較強(qiáng),適用范圍廣的Gauss函數(shù)。
為了避免數(shù)據(jù)中某一特征值的權(quán)重過大,在進(jìn)行訓(xùn)練之前還應(yīng)該對數(shù)據(jù)的特征值進(jìn)行歸一化處理:對于數(shù)據(jù)點(diǎn)的每一個特征值,依次經(jīng)過式(1)所示的變換,使其特征值落在[0,1]之間。
在油滴識別問題中,每張樣本圖片都可以被標(biāo)記為背景或油滴,因此,該問題是一個二元分類問題,僅需訓(xùn)練一個分類模型就可滿足要求。使用支持向量機(jī)進(jìn)行油滴識別,學(xué)習(xí)算法的實(shí)施過程如下。
1)對于每一張樣本圖片,提取圖片中每個像元的灰度值作為其特征值,建立樣本的特征向量xi。
2)對每個樣本的特征值進(jìn)行歸一化處理。
3)標(biāo)記每個樣本圖片的所屬類別,建立標(biāo)簽向量yi。
4)輸人特征向量和對應(yīng)的標(biāo)簽向量對SVM進(jìn)行訓(xùn)練建模。
從拍攝得到的原始圖片中選取70張畫面純凈的圖片,經(jīng)圖像分割后得到343張油滴圖片和514張背景圖片,從857張圖片中隨機(jī)抽取770張建立樣本數(shù)據(jù)集,實(shí)驗(yàn)樣本的組成見表4。
表4 實(shí)驗(yàn)樣本組成
本文SVM算法各項(xiàng)訓(xùn)練參數(shù)設(shè)置如下:選取核函數(shù)為徑向基函數(shù);設(shè)置訓(xùn)練最優(yōu)參數(shù)值為0.041 4;正則化參數(shù)值為8。訓(xùn)練過程中,共獲取支持向量24個。訓(xùn)練模型識別測試樣本情況見表5,測試樣本識別正確率為100%,因?yàn)椋孩龠x用圖像灰度值作為特征值時,油滴與背景的明暗對比度大,油滴與背景灰度值的差值較大,且油滴形狀簡單,易于區(qū)分;②SVM算法引入了正則化參數(shù),保證預(yù)測誤差盡可能小、回歸函數(shù)盡可能平滑,從而提高識別模型的泛化能力。
表5 識別結(jié)果
使用該模型對其余204張完整實(shí)驗(yàn)圖片進(jìn)行識別檢測,累計識別192處油滴,識別正確率超過95%,預(yù)測結(jié)果可靠。
使用Ostu算法對相同的204張圖片進(jìn)行識別,表6給出了Ostu算法與SVM算法的用時比較。圖8給出了2種算法在識別過程中的累計用時。
表6 傳統(tǒng)分割算法與SVM時間復(fù)雜度比較
圖8 累計用時對比
由表6和圖8可見,SVM算法識別204張圖片的平均用時為0.03 s,比Ostu算法的0.13 s快了76.9%;SVM算法識別204張圖片的總共用時為6.67 s,比Ostu算法的26.14 s快了74.5%;SVM算法的識別效率明顯優(yōu)于Ostu算法,在識別海量圖片時,本文提出的基于SVM算法建立的識別模型,效率更高。
實(shí)驗(yàn)的圓形噴嘴孔徑為2 mm,實(shí)驗(yàn)過程中通過調(diào)節(jié)齒輪油泵變頻器的頻率以控制油樣流量。油樣流量由注油系統(tǒng)中的精密流量計實(shí)時記錄,根據(jù)噴嘴口徑換算出油樣初始流速為4.2 m/s。
對識別的油滴粒徑進(jìn)行統(tǒng)計,得到其粒徑分布在[113.62 μm,7 692.08 μm]范圍內(nèi),繪制油滴粒徑出現(xiàn)概率的分布圖(見圖9)。粒徑概率分布屬于左偏態(tài)分布,粒徑低于300 μm的油滴占總油滴的73.08%;粒徑低于500 μm的油滴占總油滴的86.81%;粒徑大于2 000 μm的油滴占總油滴的2.20%,該范圍的油滴占比較少,可以忽略。
圖9 油滴粒徑出現(xiàn)概率的分布
為了進(jìn)一步描述識別油滴的粒徑分布情況,引入Rosin-Rammler粒徑分布式(2)。
式中:R(d)為篩下累積率,%;d為識別油滴粒徑,μm;de為臨界粒徑,μm,當(dāng)R(d)=63.2%時所對應(yīng)的粒徑;m為均勻性指數(shù),表示油滴粒徑分布范圍的寬窄程度,m值越大,油滴粒徑的分布范圍越窄。
對式(2)取對數(shù)得到式(3)。
ln{-ln[1-R(d)]}=mlnd-mlnde
(3)
由式(3)可以看出:當(dāng)lnd與ln{-ln[1-R(d)]}的回歸線為直線時,油滴的粒徑分布符合Rosin-Rammler,回歸線的斜率為該分布的均勻性指數(shù)m,回歸線在橫軸上的截距為臨界粒徑的自然對數(shù)lnde。
由式(2)和式(3),可以計算油滴的中值粒徑d50。
式中:d50為中值粒徑,μm;de為臨界粒徑,μm;m為均勻性指數(shù)。
將油滴粒徑d與篩下累積率R(d)代入式(2)和(3),得到均勻性指數(shù)m與臨界粒徑de值分別為1.252 0、251.36μm。
由式(4)得到中值粒徑d50=158.85μm。油滴粒徑d在自然對數(shù)坐標(biāo)系下的分布見圖10,其中的圓點(diǎn)表示識別油滴粒徑的自然對數(shù)分布,當(dāng)lnd>7.7時,在此粒徑范圍中的油滴在整體中占2%,可以忽略。由圖10可見:lnd與ln{-ln[1-R(d)]}大致呈線性回歸關(guān)系,協(xié)方差R2=0.842 7,表明識別油滴粒徑分布模型符合Rosin-Rammler分布。
圖10 識別的油滴粒徑分布與Rosin-Rammler模型的比較
1)將SVM算法應(yīng)用于油滴識別,用圖片灰度值作為特征值來識別油滴和背景,所訓(xùn)練模型在測試集樣本識別中正確率達(dá)到100%,在油滴圖片識別中正確率在95%以上,識別快速、結(jié)果可靠,可應(yīng)用于海底溢油快速識別、及時采取應(yīng)急措施。
2)處理204張油滴圖片,SVM算法的平均識別用時比Ostu算法快76.9%,累計識別用時比Ostu算法快74.5%。
3)識別出來的油滴粒徑在自然對數(shù)坐標(biāo)系下呈線性分布,線性回歸的協(xié)方差R2=0.842 7,與經(jīng)典的Rosin-Rammler粒徑分布吻合。
4)SVM算法對油滴進(jìn)行識別及粒徑分布預(yù)測可行,為海底溢油快速識別及應(yīng)急搶險提供了一種新的思路,具有較好的工程應(yīng)用價值。