徐苑景
摘要:利用傅立葉級數(shù)對散點小行星光變數(shù)據(jù)進行曲線擬合,以獲得小行星表示參數(shù),選取傅立葉級數(shù)為6的擬合方式對單體或雙體小行星光變曲線進行分類,并用機器學習算法中的SVM和決策樹建立預測模型。檢驗結果表明,SVM模型對單體和雙體小行星的預測正確率達到95%,相較于決策樹正確率提高了10%,為從小行星實際觀測數(shù)據(jù)直接推測雙體小行星潛在相關應用提供了參考。
關鍵詞:傅立葉級數(shù);機器學習;預測;小行星
DOI:10. 11907/rjdk. 201152????????????????????????????????????????????????????????????????? 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP301 ? 文獻標識碼:A ??????????????? 文章編號:1672-7800(2020)011-0042-04
Asteroid Classification Based on Joint Fourier Series and Machine Learning
XU Yuan-jing
(State Key Laboratory of Lunar and Planetary Science,Macau University of Science and Technology,Macau 999078,China)
Abstract:In this article, the Fourier series is used to fit the light change data of scattered asteroids, so as to obtain the representation parameters of the asteroids. A fitting method is choser with a Fourier series of 6 to classify the light curve of single or binary asteroids, and SVM and decision tree in machine learning algorithm are used to build prediction model. The result shows that the accuracy rate of SVM model predicting single and binary asteroids is 95%, which is 10% higher than that of decision tree. This method can be applied to provide reference for directly estimating the potential twin asteroids from the actual observation data of the asteroids.
Key Words:Fourier series; machine learning algorithm; prediction; asteroids
0 引言
小行星是太陽系中圍繞太陽系質心運動的小天體,其保留了大量太陽系形成初期的珍貴信息[1]。但其本身不發(fā)射可見光,只有通過反射太陽光才能被觀測到,目前通過測光觀測獲得行星自轉軸在空間指向的小行星僅有幾百顆[2]。小行星光變是指由于小行星自轉引起的光度變化,對小行星進行激光觀測,可得到小行星光變曲線[3]。小行星和地球在繞日公轉過程中,它們與太陽的幾何位置會變化,當運行到恰當位置時,才能在地球上被觀測到,形成可觀測窗口。不同觀測窗口獲得的小行星光變曲線存在差異,故通過積累多個觀測窗口的多條光變曲線數(shù)據(jù)可反演計算出小行星形狀、自轉軸指向及表面基本光學特征[4]。因小行星數(shù)量眾多,實際觀測數(shù)據(jù)量將非常龐大,且觀測過程中可能出現(xiàn)兩個或多個小行星共同旋轉的情況。
近年來,太陽系中所有小行星種群中都發(fā)現(xiàn)了雙星系統(tǒng),其構成了近地小行星(NEA)和小型主帶小行星的主要部分[5]。在近地小行星中,雙體小行星數(shù)量約占其總數(shù)的15±4%[6-7]。雙體小行星模型的不確定性及其附近復雜多變的動力學環(huán)境,對雙體小行星探測任務設計提出了挑戰(zhàn)[8]。
1965年,張鈺哲等[9]使用60cm望遠鏡結合光電倍增管對小行星(26)Proserpina進行時序測光,獲得該小行星的光變曲線。但在小行星實際測光過程中,只能測得一些分散的數(shù)據(jù)點。為了從這些分散的數(shù)據(jù)點中找到其內在規(guī)律,需運用多項式或函數(shù)逼近這些已知點,許多學者對其進行了研究。如張勤[10]認為最小二乘法是一種簡便、有效的擬合方法;肖軼軍等[11]提出基于迭代最近點的優(yōu)化方法;包健等[12]研究由輸入層神經元數(shù)、輸出層神經元數(shù)及樣本點數(shù)確定隱含層神經元數(shù)的BP神經網(wǎng)絡結構。但目前通過計算機模擬預測小行星特性的研究很少。
本文嘗試了傅立葉級數(shù)、多項式、高斯、神經網(wǎng)絡4種擬合方式,最后確定采用精度最高的傅里葉級數(shù)對小行星測光數(shù)據(jù)進行擬合,以期獲得小行星表示參數(shù),找出其特征;通過機器學習法對單體和雙體小行星光變曲線進行檢驗,以推算哪些是潛在可能的雙體小行星。
1 傅里葉級數(shù)
傅里葉級數(shù)(Fourier Series)是一種將波狀函數(shù)表示為簡單正弦波的方法,對周期現(xiàn)象進行數(shù)學分析可將任何周期函數(shù)或周期信號分解為一組簡單的振蕩函數(shù)(可能由無限元素組成),即正弦函數(shù)和余弦函數(shù)(或等效地使用復指數(shù))。
設定傅立葉級數(shù)為N、矩陣大小為N×2N+1,矩陣第一列為常數(shù)項,第二列至N+1列為cos(x)-cos(Nx),第N+2至2N+1列為sin(x)-sin(Nx),得到矩陣M為:
M=1cosx1cos2x1?cosNx1sinx1sin2x1?sinNx11cosx2cos2x2?cosNx2sinx2sin2x2?sinNx21cosx3cos2x3?cosNx3sinx3sin2x3?sinNx31cosx4cos2x4?cosNx4sinx4sin2x4?sinNx4?????????1cosxNcos2xN?cosNxNsinxNsin2xN?sinNxN????? (1)
y的線性方程為:
b=y1y2?yn?????????? (2)
AX=b可表示為:
y1y2?yn=1cosx1cos2x1?cosNx1sinx1sin2x1?sinNx11cosx2cos2x2?cosNx2sinx2sin2x2?sinNx21cosx3cos2x3?cosNx3sinx3sin2x3?sinNx31cosx4cos2x4?cosNx4sinx4sin2x4?sinNx4?????????1cosxNcos2xN?cosNxNsinxNsin2xN?sinNxN
a0a1?aNb1b2?bN?? (3)
求解得到傅立葉級數(shù)對應的每一個系數(shù),包括a0~an,以及b1~bn,得到公式:
ft=a0+a1cosω0t+a2cos2ω0t+?+b1sinω0t+b2sin2ω0t+?=a0+n=1∞ancosnω0t+bnsinnω0t? (4)
2 機器學習算法
機器學習是一類算法的總稱,是指通過賦予機器學習的能力,使計算機能夠從特定數(shù)據(jù)集中學習規(guī)律并作出預測。主要分為線性模型和非線性模型,非線性模型又分為傳統(tǒng)機器學習模型(如SVM、KNN、決策樹等)和深度學習模型。本文選取SVM和決策樹兩種方法進行研究。
2.1 支持向量機
支持向量機(Support Vector Machine,SVM)是基于統(tǒng)計學理論發(fā)展起來的一種機器學習方法,其以結構風險最小化原則為理論基礎,引入核函數(shù)方法,將原始問題映射到高維空間,把待求解問題轉換為二次優(yōu)化問題,使SVM收斂于問題全局最優(yōu)解。它能較好地解決小樣本、非線性、高維數(shù)和局部極小點等實際問題,具有良好的泛化能力[13]。
通過高斯徑向核函數(shù)?(x)將訓練集xi映射到高維線性空間,構造回歸估計函數(shù):
f(x)=ω?(x)+b? (5)
式中,ω為高維空間權向量,b為偏置常數(shù)。則最優(yōu)問題為:
minR=12ω2+12γi=1mξ2i
yi=ωT?(x)+b+ξi????? (i=1,2,…m)???????????????? (6)
式中,ξi為松弛因子。
利用Lagrange函數(shù)求解上述優(yōu)化問題,即:
L(ω,,b,ξ,α,γ)=12ω2+12γi=1mξ2i-i=1mαiωT?(xi)+b+ξi-yi???????? (7)
式中,αi∈R(i=1,2,…,m)為拉格朗日乘子。
根據(jù)Karush-Kuhn-Tucher(KKT)優(yōu)化條件,得到如下等式:
?L?ω=0→ω=i=1mαi?(xi)?L?b=0→i=1mαi=0?L?ξ=0→αi=γξi?L?αi=0→ωT?(xi)+b+ξi-yi=0????? (8)
代入式(4)消去ω和ξ,得到以下線性方程:
01…m1K(x1+x1)+1γ…K(x1+xm)…………mK(xm+x1)…K(x1+xm)+1γ?bα1…αm=0y1…ym?????????? (9)
式中,K(xi,xj)為核函數(shù)。
然后用最小二乘法求出α和b,即得到非線性預測輸出模型。
y=i=1mαiK(x,xi)+b ?????????(10)
2.2 決策樹
決策樹(Decision Tree)是指在已知各種情況發(fā)生概率的基礎上,通過構成決策樹求取凈現(xiàn)值期望值大于等于零的概率,從而評價項目風險、判斷其可行性的決策分析方法,是直觀運用概率分析的一種圖解法[14]。假設T為訓練集, 為T構造決策樹時, 選擇信息增益值作為分裂節(jié)點的屬性及標準, 按照該標準將T分成n個子集。若第i個子集Ti含有的元組類別一致, 該節(jié)點即成為決策樹的葉子節(jié)點而停止分裂。對于不滿足該條件T的其它子集, 按照上述方法繼續(xù)分裂,直至所有子集所含元組都屬于一個類別為止[15]。
[7] 杜燕茹,李翔宇,韓宏偉,等. 雙體小行星系統(tǒng)平衡態(tài)與穩(wěn)定性研究[J]. 深空探測學報,2019,6(5):456-462.
[8] SCHEIRICH P, PRAVEC P. Modeling of lightcurves of binary asteroids[J].? Icarus, 2009, 200(2):531-547.
[9] 張鈺哲, 周興海, 楊修義,等.? 小行星光變曲線(Ⅳ)[J].? 天文學報, 1981(2):65-69.
[10] 張勤.? 最小二乘估計在曲線擬合中應用的研究[J].? 成功(教育),2011(18): 296-297.
[11] 肖軼軍,丁明躍,彭嘉雄. 基于迭代最近點的B樣條曲線擬合方法研究[J]. 中國圖像圖形學報,2000(7): 585-588.
[12] 包健, 趙建勇,周華英. 基于BP網(wǎng)絡曲線擬合方法的研究[J]. 計算機工程與設計,2005, 26(7):1840-1841,1848.
[13] 畢天騰,劉越,翁冬冬,等. 基于監(jiān)督學習的單幅圖像深度估計綜述[J]. 計算機輔助設計與圖形學學報,2018,30(8):1383-1393.
[14] ABHISEK U. Support vector machine[J].? Computer Science, 2002 (4):1-28.?
[15] 聯(lián)合開發(fā)網(wǎng). matlab例程[EB/OL]. http://www.pudn.com/Download/item/id/3707674.html.
[16] 劉紅巖,陳劍,陳國青. 數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J]. 清華大學學報(自然科學版),2002(6):727-730.
[17] EDBERG S J. International Halley watch amateur observersmanual for science comet studies [M]. Jwt Propulsion Lab,California Inst.of Technology,1993.
[18] 白春紅. 基于SVM模型的充填體強度與采場穩(wěn)定性需求智能匹配研究[J]. 中國礦業(yè),2019,28(11):104-108.
(責任編輯:黃 ?。?/p>