張彥霞,崔辰州,趙永恒
中國(guó)科學(xué)院國(guó)家天文臺(tái)光學(xué)天文重點(diǎn)實(shí)驗(yàn)室,北京 100012
21世紀(jì)天文學(xué)面臨的大數(shù)據(jù)和研究范式轉(zhuǎn)型
張彥霞,崔辰州,趙永恒
中國(guó)科學(xué)院國(guó)家天文臺(tái)光學(xué)天文重點(diǎn)實(shí)驗(yàn)室,北京 100012
隨著大型空間和地面觀測(cè)技術(shù)的發(fā)展,天文數(shù)據(jù)的數(shù)據(jù)量、數(shù)據(jù)產(chǎn)出率和數(shù)據(jù)復(fù)雜性急劇增加,天文學(xué)步入了全新的數(shù)據(jù)密集型時(shí)代。闡述了天文數(shù)據(jù)的特征,分析了傳統(tǒng)天文研究方法的局限性,提出了發(fā)展天文統(tǒng)計(jì)學(xué)和天文信息學(xué)的必要性和研究方向,介紹了天文大數(shù)據(jù)的典型應(yīng)用—— 大型綜合巡天望遠(yuǎn)鏡的工作原理及應(yīng)用,歸納了與天文統(tǒng)計(jì)學(xué)和天文信息學(xué)相關(guān)的國(guó)際組織,分析了與其相關(guān)的公共教育的現(xiàn)狀及存在的問(wèn)題,為天文大數(shù)據(jù)的健康發(fā)展提供參考方向。
天文大數(shù)據(jù);天文信息學(xué);天文統(tǒng)計(jì)學(xué);巡天
從古至今,天文學(xué)一直都是以觀測(cè)為基礎(chǔ)的科學(xué)。伽利略望遠(yuǎn)鏡指向了天空,開(kāi)啟了望遠(yuǎn)鏡觀天的時(shí)代。哈勃空間望遠(yuǎn)鏡的出現(xiàn),又讓人們的視野一下子從地面擴(kuò)展到了太空,觀測(cè)窗口也由單純的可見(jiàn)光波段轉(zhuǎn)向多波段。多波段望遠(yuǎn)鏡的出現(xiàn),使得天文學(xué)開(kāi)始發(fā)展成為全波段天文學(xué)。多目標(biāo)多光纖望遠(yuǎn)鏡的出現(xiàn),使得天文學(xué)由定點(diǎn)觀測(cè)變?yōu)檠蔡煊^測(cè),標(biāo)志著天文學(xué)巡天時(shí)代的開(kāi)始。這一切的發(fā)展變化都離不開(kāi)天文探測(cè)技術(shù)、望遠(yuǎn)鏡技術(shù)、計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)通信等技術(shù)的飛速發(fā)展。天文巡天項(xiàng)目已經(jīng)成為天文數(shù)據(jù)獲取的主要來(lái)源。20世紀(jì)40年代,美國(guó)帕拉瑪巡天開(kāi)始了最早的天空普查;20世紀(jì)90年代,英國(guó)和澳大利亞合作的2度視場(chǎng)星系紅移巡天和美國(guó)Sloan數(shù)字巡天計(jì)劃陸續(xù)開(kāi)始;21世紀(jì)初,英國(guó)和澳大利亞合作的6度視場(chǎng)星系紅移巡天和RAVE、中國(guó)郭守敬望遠(yuǎn)鏡、歐洲空間局的蓋亞項(xiàng)目已經(jīng)開(kāi)展或正在運(yùn)行,這些項(xiàng)目都屬于可見(jiàn)光波段。其他波段(如紅外波段、射電波段、X射線波段、γ射線波段等)的巡天項(xiàng)目也在有序開(kāi)展。21世紀(jì),即將運(yùn)行的大型綜合巡天望遠(yuǎn)鏡(large synoptic survey telescope,LSST)和平方公里陣列(square kilometer array,SKA)望遠(yuǎn)鏡等大型巡天項(xiàng)目,將把天文學(xué)指引到全新的數(shù)據(jù)密集型時(shí)代,使得天文數(shù)據(jù)急劇增加,數(shù)據(jù)采用PB,甚至EB來(lái)計(jì)量,天文學(xué)已經(jīng)步入大數(shù)據(jù)時(shí)代[1,2],即將迎來(lái)大發(fā)現(xiàn)時(shí)代[3]。正是在這種背景下,天文統(tǒng)計(jì)學(xué)和天文信息學(xué)應(yīng)運(yùn)而生。
天文統(tǒng)計(jì)學(xué)是一門探討如何從不完整的信息中獲取科學(xué)可靠的結(jié)論,從而進(jìn)一步進(jìn)行天文學(xué)研究的設(shè)計(jì)、取樣、分析、資料整理與推論的學(xué)科。它是天文學(xué)、天體物理學(xué)與統(tǒng)計(jì)學(xué)相結(jié)合形成的一門新型學(xué)科,應(yīng)用統(tǒng)計(jì)學(xué)的理論和方法來(lái)解決天文學(xué)中面臨的一切統(tǒng)計(jì)學(xué)問(wèn)題。
天文信息學(xué)[4,5]是研究天文信息的獲取、處理、存儲(chǔ)、傳輸、分析、挖掘和解釋等方面的學(xué)科。它是天文學(xué)、天體物理學(xué)、計(jì)算機(jī)科學(xué)、工程學(xué)和信息學(xué)相結(jié)合的一門新型學(xué)科,應(yīng)用天文學(xué)、天體物理學(xué)、計(jì)算機(jī)科學(xué)、工程學(xué)和信息技術(shù)揭示大量復(fù)雜的天文數(shù)據(jù)所賦有的宇宙和天體的奧秘,主要是為了應(yīng)對(duì)下一代望遠(yuǎn)鏡產(chǎn)生的按指數(shù)增長(zhǎng)的數(shù)據(jù)量、數(shù)據(jù)產(chǎn)出率和數(shù)據(jù)復(fù)雜性而面臨的挑戰(zhàn)和機(jī)遇。天文信息學(xué)即天文信息化,正在推動(dòng)21世紀(jì)天文學(xué)由發(fā)現(xiàn)驅(qū)動(dòng)和假設(shè)驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)和計(jì)算驅(qū)動(dòng)的科學(xué)轉(zhuǎn)型,數(shù)據(jù)密集型天文學(xué)研究方式已開(kāi)啟。
在大型巡天時(shí)代到來(lái)之際,收集到的天體信息的數(shù)據(jù)量、質(zhì)量和豐富性達(dá)到了前所未有的高度,三者緊密相關(guān)。巡天數(shù)據(jù)量急劇增長(zhǎng),可以獲得全天的圖像和星表;巡天數(shù)據(jù)的質(zhì)量達(dá)到了定點(diǎn)觀測(cè)的質(zhì)量;星表不僅包含了天體的位置和星等信息,也包含它們的形狀、輪廓、時(shí)間演化等豐富的信息?,F(xiàn)代的大型巡天不僅僅使得數(shù)據(jù)體量增大,而且使得數(shù)據(jù)質(zhì)量更好,富含的信息更豐富,遠(yuǎn)遠(yuǎn)超出天體認(rèn)證的范疇。例如:阿塔卡瑪大型毫米波/亞毫米波天線陣(Atacama large millimeter/ submillimeter array,ALMA)、甚大天線陣(very large array,VLA)、SKA的日產(chǎn)數(shù)據(jù)量分別為250 TB、1.5 PB、0.5~10 PB;斯隆數(shù)字巡天(Sloan digital sky survey,SDSS)、全景式巡天望遠(yuǎn)鏡和快速反應(yīng)系統(tǒng)(panoramic survey telescope and rapid response system,PanSTARRS)、LSST每晚產(chǎn)生的數(shù)據(jù)量分別為200 GB、700 GB、15 TB??梢钥闯?,天文大數(shù)據(jù)已經(jīng)擺在面前。數(shù)據(jù)科學(xué)家Kirk Borne針對(duì)高速變化和高度復(fù)雜的大數(shù)據(jù)的獲取、清潔、管理、集成、存儲(chǔ)、處理、索引、搜索、共享、傳輸、挖掘、分析和可視化等任務(wù),提出了大數(shù)據(jù)具備“10V”特征①https://www. mapr.com/blog/ top-10-bigdata-challengesserious-look-10-big-data-vs,即體量大(volume)、復(fù)雜性高(velocity)、高速獲取率(velocity)、真實(shí)性(veracity)、有效性(validity)、價(jià)值(value)、可變性(variability)、存儲(chǔ)場(chǎng)所(venue)、相關(guān)詞匯(vocabulary)、模糊性(vagueness)。這“10V”特征為解決大數(shù)據(jù)面臨的挑戰(zhàn)提供了參考。
天文數(shù)據(jù)以其獲得方式的不同,主要分為觀測(cè)數(shù)據(jù)、數(shù)值模擬數(shù)據(jù);以其存在方式的不同,可以分為圖像、星表、光譜、時(shí)序數(shù)據(jù)、網(wǎng)頁(yè)數(shù)據(jù);以其結(jié)構(gòu)的不同,可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)。天文數(shù)據(jù)的特點(diǎn)包括:空間性、高維性、海量性、多模式、多尺度、多分辨率、時(shí)序性、缺值性、帶誤差、異構(gòu)性、分布性、開(kāi)放性等。天文數(shù)據(jù)的復(fù)雜性體現(xiàn)在:高光譜、非線性、非高斯噪聲、非線性系統(tǒng)影響、形狀和大小的變化、密度的變化、近似性、局部維數(shù)不同等。這些特點(diǎn)和復(fù)雜性都對(duì)天文數(shù)據(jù)的存儲(chǔ)、傳輸、處理、分析和挖掘提出了嚴(yán)峻的挑戰(zhàn)。
過(guò)去,分布的、異構(gòu)的天文數(shù)據(jù)資源只有幾百或上千個(gè);而今,各個(gè)天文數(shù)據(jù)資源可以通過(guò)虛擬天文臺(tái)接口統(tǒng)一獲得;未來(lái),隨著大型巡天項(xiàng)目的發(fā)展,天文學(xué)將成為更加數(shù)據(jù)密集型的學(xué)科。天文數(shù)據(jù)的狀態(tài)發(fā)生了翻天覆地的變化:由數(shù)據(jù)匱乏變?yōu)閿?shù)據(jù)過(guò)剩,數(shù)據(jù)集擴(kuò)展為數(shù)據(jù)流,靜態(tài)數(shù)據(jù)演變?yōu)閯?dòng)態(tài)演化數(shù)據(jù),任意時(shí)刻的數(shù)據(jù)轉(zhuǎn)化為實(shí)時(shí)或準(zhǔn)實(shí)時(shí)數(shù)據(jù),數(shù)據(jù)集中存儲(chǔ)到數(shù)據(jù)分布存儲(chǔ)和計(jì)算,數(shù)據(jù)機(jī)構(gòu)所有權(quán)轉(zhuǎn)變?yōu)閷W(xué)科數(shù)據(jù)所有權(quán)。這些因素成為天文學(xué)發(fā)展和進(jìn)步的動(dòng)力和源泉,同時(shí)也為天文學(xué)的發(fā)展提供了機(jī)遇和挑戰(zhàn),促進(jìn)天文學(xué)研究方式和方法的轉(zhuǎn)型。
大型巡天時(shí)代,天文學(xué)面臨著許多需要信息學(xué)和數(shù)據(jù)科學(xué)來(lái)解決的科學(xué)問(wèn)題,例如:不同星表的概率交叉認(rèn)證、距離估測(cè)、恒星和星系分類、圖像中的宇宙線識(shí)別、超新星的尋找與分類、各種天體的形態(tài)分類、新類型天體或新類型子類天體的發(fā)現(xiàn)、分類器分類規(guī)則的提高、大型數(shù)據(jù)流的分類、天文事件的實(shí)時(shí)分類、大型數(shù)據(jù)集的聚類、大型數(shù)據(jù)集中的新奇、反常和異常的現(xiàn)象或天體的探測(cè)等②http://www.lanl. gov/conferences/ salishan/ salishan2010/ pdfs/Kirk%20 Borne.pdf。
這一系列天文問(wèn)題的解決,需要借助新的技術(shù)和手段。在做分類、聚類、相關(guān)分析、離群探測(cè)、時(shí)間序列模式發(fā)現(xiàn)等數(shù)據(jù)挖掘任務(wù)時(shí),機(jī)器學(xué)習(xí)是關(guān)鍵技術(shù)。機(jī)器學(xué)習(xí)針對(duì)大數(shù)據(jù)的復(fù)雜性時(shí),也面臨著諸多挑戰(zhàn),如數(shù)據(jù)預(yù)處理、特征選擇、降維、算法和模型的選擇、數(shù)據(jù)不完備、不確定性估計(jì)、可擴(kuò)展性、可視化。許多復(fù)雜數(shù)據(jù)存在超維結(jié)構(gòu)(如聚類、相關(guān)性等),維數(shù)達(dá)到百維甚至萬(wàn)維,而且還在持續(xù)增長(zhǎng),需要選擇合適的挖掘算法,并對(duì)挖掘結(jié)果進(jìn)行解釋。關(guān)于天文學(xué)中的數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)可參考參考文獻(xiàn)[6-12]。
圖靈獎(jiǎng)得主、關(guān)系數(shù)據(jù)庫(kù)的鼻祖Jim Gray提出了科學(xué)研究的4個(gè)“范式”:第一范式,實(shí)驗(yàn)科學(xué);第二范式,理論科學(xué);第三范式,計(jì)算科學(xué);第四范式,數(shù)據(jù)密集型科學(xué)。在各行各業(yè)數(shù)據(jù)蜂擁階段,數(shù)據(jù)密集型科學(xué)成為當(dāng)前科學(xué)的主流。圖1給出了假設(shè)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)的科學(xué)的流程,目前數(shù)據(jù)驅(qū)動(dòng)的科學(xué)占據(jù)主導(dǎo)地位,實(shí)際應(yīng)用中這兩種研究方式和方法互為補(bǔ)充。圖2給出了小數(shù)據(jù)時(shí)代與大數(shù)據(jù)時(shí)代從數(shù)據(jù)到知識(shí)的過(guò)程。在小數(shù)據(jù)時(shí)代,科學(xué)家從望遠(yuǎn)鏡獲得數(shù)據(jù)后,需要自己親自動(dòng)手完成從原始數(shù)據(jù)到科學(xué)數(shù)據(jù)的轉(zhuǎn)換,科學(xué)家需要花費(fèi)大量的時(shí)間和精力進(jìn)行編程、分析、預(yù)處理數(shù)據(jù),最后再應(yīng)用專業(yè)知識(shí)推理和導(dǎo)出模型。從數(shù)據(jù)到知識(shí)的整個(gè)過(guò)程,除數(shù)據(jù)由望遠(yuǎn)鏡采集外,其他的工作都由科學(xué)家自己完成,在數(shù)據(jù)樣本不大的時(shí)候,這樣的科學(xué)模式是可行的。而在大數(shù)據(jù)時(shí)代,望遠(yuǎn)鏡采集數(shù)據(jù)后,數(shù)據(jù)需要存儲(chǔ)、傳輸、預(yù)處理,最后形成星表以供科學(xué)家使用。由于各個(gè)項(xiàng)目的望遠(yuǎn)鏡系統(tǒng)、地理位置和環(huán)境、大氣條件等情況不同,導(dǎo)致系統(tǒng)誤差不同,相應(yīng)的數(shù)據(jù)處理系統(tǒng)也應(yīng)根據(jù)項(xiàng)目的需要而制定,這樣一個(gè)項(xiàng)目需要具備一個(gè)數(shù)據(jù)預(yù)處理系統(tǒng)。這就需要大量人員的時(shí)間和精力投入數(shù)據(jù)預(yù)處理中。從望遠(yuǎn)鏡觀測(cè)得到的原始數(shù)據(jù),需要經(jīng)過(guò)降噪、儀器定標(biāo)、圖像處理、圖像壓縮、圖像轉(zhuǎn)化等一系列操作,才可以得到供科學(xué)家直接使用的星表,這樣科學(xué)家可以專注于自己的科學(xué),從而做起科學(xué)來(lái)更加容易、便捷??梢钥闯觯诖髷?shù)據(jù)時(shí)代,個(gè)人獨(dú)立做科研的時(shí)代已經(jīng)漸行漸遠(yuǎn),合作科研方式正式開(kāi)啟。
圖1 假設(shè)驅(qū)動(dòng)的科學(xué)與數(shù)據(jù)驅(qū)動(dòng)的科學(xué)
圖2 從數(shù)據(jù)到知識(shí)的過(guò)程
身處大數(shù)據(jù)時(shí)代,科學(xué)家必須意識(shí)到合作的重要性,而且必須是多學(xué)科多領(lǐng)域的合作,從而推動(dòng)科研項(xiàng)目的發(fā)展,提高科學(xué)產(chǎn)出。科學(xué)社區(qū)針對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn)和機(jī)遇采取了應(yīng)對(duì)措施,如:面向具體領(lǐng)域,不是以單位為基礎(chǔ),而是以分布的人員、數(shù)據(jù)、計(jì)算資源等構(gòu)成的新型科學(xué)組織為基礎(chǔ)。天文領(lǐng)域的國(guó)際虛擬天文臺(tái)聯(lián)盟③http://www. ivoa.net/為天文大數(shù)據(jù)提供了一個(gè)完整的研究環(huán)境。自從2000年虛擬天文臺(tái)發(fā)起至今,虛擬天文臺(tái)取得了驕人的成績(jī),為廣大天文學(xué)家所接受和使用。其成功在于多方面原因,如:所有數(shù)據(jù)以電子形式收集;精通計(jì)算機(jī)技術(shù)和數(shù)據(jù)技術(shù)人員的參與;制定統(tǒng)一的標(biāo)準(zhǔn)格式;收集的大數(shù)據(jù)都是有資金資助、機(jī)構(gòu)授權(quán)的數(shù)據(jù)集;建立了數(shù)據(jù)共享的文化;動(dòng)機(jī)來(lái)源于指數(shù)增長(zhǎng)的數(shù)據(jù);聯(lián)合機(jī)構(gòu)的支持/資助;數(shù)據(jù)沒(méi)有商業(yè)價(jià)值和隱私。虛擬天文臺(tái)優(yōu)于其他領(lǐng)域的虛擬組織,有諸多優(yōu)點(diǎn),如:互操作和標(biāo)準(zhǔn)等的進(jìn)步;擁有全球的天文數(shù)據(jù)網(wǎng)格和助力天文社區(qū)的科研;提供有用的網(wǎng)頁(yè)服務(wù);為社區(qū)提供了培訓(xùn)、科普教育資源。虛擬天文臺(tái)還有不盡完美之處,如缺乏數(shù)據(jù)探索和挖掘工具,這正是科學(xué)產(chǎn)出之所在。不過(guò)他們已經(jīng)意識(shí)到這方面的缺陷,正在加大力度發(fā)展。
多學(xué)科領(lǐng)域的交叉(如科學(xué)、計(jì)算機(jī)、信息技術(shù)等)和更廣泛的社區(qū)參與(貢獻(xiàn)者和用戶),提供了交叉科學(xué)方法共享的機(jī)制和有用的網(wǎng)頁(yè)服務(wù),大大方便了不同學(xué)科的互通互聯(lián)。對(duì)大多數(shù)的數(shù)據(jù)科學(xué)(如計(jì)算、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等)而言,都面臨著共同的挑戰(zhàn),一些應(yīng)對(duì)方法也可以共享。如何將信息架構(gòu)的發(fā)展、經(jīng)驗(yàn)和解決方案從一個(gè)領(lǐng)域挪用到另一個(gè)領(lǐng)域?目前已有一些較為成熟的項(xiàng)目值得借鑒和學(xué)習(xí)。數(shù)據(jù)驅(qū)動(dòng)的科學(xué)發(fā)現(xiàn)中心(CD3)是美國(guó)加州理工學(xué)院新成立的研究中心④http://cd3. caltech.edu,服務(wù)于全校的研究項(xiàng)目(如天文、物理、生物、地球物理等),是新的Caltech-JPL聯(lián)合數(shù)據(jù)科學(xué)和技術(shù)中心的一部分。該中心的目標(biāo)是幫助員工推進(jìn)和執(zhí)行數(shù)據(jù)密集項(xiàng)目,共享交叉學(xué)科的方法、思想、項(xiàng)目實(shí)施等成果。面向?qū)ο蟮臄?shù)據(jù)技術(shù)(object oriented data technology,OODT)是要構(gòu)建分布式數(shù)據(jù)密集系統(tǒng)的Apache開(kāi)源框架⑤http://oodt. apache.org,用于獲取和共享分布的資源,1998年獲美國(guó)國(guó)家航空航天局(National Aeronautics and Space Administration,NASA)資助。它應(yīng)用于行星科學(xué)、射電天文、地球科學(xué)、醫(yī)療衛(wèi)生、氣候檢測(cè)、癌癥診斷等,是NASA的第一個(gè)天文開(kāi)源項(xiàng)目,同時(shí)也是基于Apache軟件基金會(huì)的頂級(jí)項(xiàng)目,曾獲得2003年度NASA軟件比賽的第二名。現(xiàn)在數(shù)據(jù)集的高信息量足以驅(qū)動(dòng)有價(jià)值的數(shù)據(jù)挖掘。數(shù)據(jù)融合可以發(fā)現(xiàn)那些僅靠單數(shù)據(jù)集無(wú)法發(fā)現(xiàn)的知識(shí)。數(shù)據(jù)的復(fù)雜性需要人工智能幫助人們理解和認(rèn)識(shí),未來(lái)虛擬現(xiàn)實(shí)將成為終極前沿。所有的信息和工具都可以通過(guò)網(wǎng)頁(yè)聯(lián)系在一起,網(wǎng)頁(yè)已成為人們彼此聯(lián)系、工作、學(xué)習(xí)的主要方式,數(shù)據(jù)的獲取、處理方法、論文發(fā)表、教育等都可以通過(guò)網(wǎng)絡(luò)空間來(lái)實(shí)現(xiàn)。
LSST是位于智利的一架直徑8.4 m的天文望遠(yuǎn)鏡⑥https://www. lsst.org/,攝像機(jī)達(dá)到了32億像素,可以拍攝出6個(gè)波段的圖像,預(yù)計(jì)2020年投入使用。以聚光能力和視野寬度來(lái)說(shuō),LSST的規(guī)模是目前現(xiàn)役的和正在建造的任何一個(gè)巡天望遠(yuǎn)鏡的10倍以上。每周可以對(duì)整個(gè)南半球天空巡查兩次,每晚數(shù)據(jù)量將達(dá)15 TB。LSST預(yù)計(jì)在第一個(gè)月的運(yùn)行時(shí)間內(nèi)將觀察到比以前所有望遠(yuǎn)鏡加起來(lái)還要多得多的宇宙空間。LSST主要用來(lái)研究暗宇宙、宇宙的瞬間、太陽(yáng)系的細(xì)節(jié)、銀河系圖像。
LSST項(xiàng)目的產(chǎn)品將分為3級(jí):第一級(jí)是每晚探測(cè)的約1 000萬(wàn)個(gè)時(shí)間事件流和太陽(yáng)系內(nèi)約600萬(wàn)個(gè)天體的軌道星表,這些時(shí)域事件要在觀測(cè)到的1 min內(nèi)傳送到相應(yīng)的發(fā)布網(wǎng)絡(luò)中;第二級(jí)是每年產(chǎn)生的約370億個(gè)天體的星表(包括200億個(gè)星系和170億顆恒星)、約7萬(wàn)億單歷元探測(cè)事件、約30萬(wàn)億的約定要觀測(cè)的源,這些數(shù)據(jù)都可以通過(guò)在線獲得,另外包括深的疊加圖像;第三級(jí)是在數(shù)據(jù)中心可以將用戶定制的處理和分析的服務(wù)以及計(jì)算資源提供給用戶。就第三級(jí)而言,使天文學(xué)界可以基于LSST的軟件、服務(wù)或計(jì)算資源創(chuàng)建新產(chǎn)品,即:基于已有的軟件服務(wù)定制適合的測(cè)量和推理代碼,讓用戶可以在LSST數(shù)據(jù)中心運(yùn)行自己的代碼,從而平衡投入產(chǎn)出比。在不久的將來(lái),對(duì)于大型巡天項(xiàng)目,釋放的數(shù)據(jù)會(huì)作為其主要產(chǎn)品,在巡天結(jié)束之際,軟件以及由這些軟件處理產(chǎn)生的特殊或暫源星表,同樣也會(huì)作為其主要產(chǎn)品。釋放的數(shù)據(jù)會(huì)作為所有星表的一部分,更頻繁地廣泛使用,而且會(huì)保留很長(zhǎng)時(shí)間。LSST軟硬件的總體設(shè)計(jì)思路就是要讓這一切變?yōu)楝F(xiàn)實(shí)。
目前為止,還沒(méi)有能力實(shí)現(xiàn)最優(yōu)化地從數(shù)據(jù)到模型的推導(dǎo),這主要是因?yàn)橛?jì)算密集、I/O密集和數(shù)據(jù)量超大,此時(shí)的星表就覆蓋面積而言已經(jīng)是全天星表,而且精于多學(xué)科(如統(tǒng)計(jì)學(xué)、應(yīng)用數(shù)學(xué)、軟件工程等)的專家還未出現(xiàn)。不斷增長(zhǎng)的計(jì)算能力可以將天文學(xué)家從計(jì)算能力不足的困境中解脫出來(lái)。到2020年,大部分天文學(xué)家將成長(zhǎng)為擁有多學(xué)科知識(shí)的生力軍。另外,參與大型巡天項(xiàng)目和望遠(yuǎn)鏡項(xiàng)目的人們,應(yīng)該創(chuàng)建與這些項(xiàng)目相關(guān)的必要的軟件和數(shù)據(jù)處理系統(tǒng),這樣天文學(xué)家才可以真正地投入大數(shù)據(jù)的洪流中一展身手。
傳統(tǒng)天文學(xué)是數(shù)據(jù)饑渴的科學(xué),研究的方式和方法自然受限于這種數(shù)據(jù)缺乏的狀態(tài)。天文學(xué)過(guò)去是受硬件束縛的學(xué)科。那時(shí)天文學(xué)家對(duì)天文數(shù)據(jù)處理軟件系統(tǒng)一直不太重視,甚至不需要復(fù)雜的編程。由于數(shù)據(jù)少而質(zhì)量差,亦或沒(méi)有足夠的計(jì)算能力來(lái)正確處理數(shù)據(jù),天文學(xué)家一度是幸運(yùn)的,只是選擇一些源觀測(cè),一個(gè)晚上最多觀測(cè)上百來(lái)顆天體,一些簡(jiǎn)單的算法足以應(yīng)付少量數(shù)據(jù)的處理,根本的挑戰(zhàn)在于硬件。如今,天文學(xué)成為軟件束縛的學(xué)科。各種情況發(fā)生了質(zhì)的變化,收集的數(shù)據(jù)空前巨大?,F(xiàn)在的望遠(yuǎn)鏡和照相機(jī)技術(shù)飛速發(fā)展,達(dá)到了空前的水平,可獲得高質(zhì)量的數(shù)據(jù)。此外,計(jì)算機(jī)的能力也足以勝任比較復(fù)雜的計(jì)算,而且價(jià)格也越來(lái)越便宜。滯后的內(nèi)存容量迫使人們追求更加復(fù)雜的算法,開(kāi)發(fā)更好的軟件處理系統(tǒng)。為了最好地發(fā)揮昂貴望遠(yuǎn)鏡的效能,現(xiàn)在的大型項(xiàng)目從設(shè)計(jì)之初就開(kāi)始軟件與硬件同步發(fā)展。巡天計(jì)劃的出現(xiàn),使得數(shù)據(jù)從廣度和深度上變得更加豐富起來(lái),LSST正是這種轉(zhuǎn)換模式的典范。在這種狀態(tài)下,研究的成功將依賴于從現(xiàn)有的數(shù)據(jù)中挖掘出知識(shí)的能力。建造更大的儀器已經(jīng)不再是最劃算的事情。發(fā)展與之匹配的軟件項(xiàng)目勢(shì)在必行。這必將重新點(diǎn)燃類似虛擬天文臺(tái)概念的驅(qū)動(dòng),不過(guò)這個(gè)驅(qū)動(dòng)將側(cè)重于算法、工具和已經(jīng)成長(zhǎng)起來(lái)的軟件框架的再利用和合作。AstroPy和LSST項(xiàng)目已經(jīng)開(kāi)始推動(dòng)類似的項(xiàng)目前行。
天文大數(shù)據(jù)的核心價(jià)值在于如何從浩瀚的數(shù)據(jù)海洋中發(fā)現(xiàn)隱藏于其中的瑰寶,即發(fā)現(xiàn)人們感興趣的稀有天體或現(xiàn)象,亦或未知天體或現(xiàn)象,從而推動(dòng)天文學(xué)理論的發(fā)展。而推動(dòng)這一過(guò)程實(shí)現(xiàn)的橋梁需要借助天文統(tǒng)計(jì)學(xué)和天文信息學(xué)。這兩門新生學(xué)科,尤其天文信息學(xué)是近幾年才蓬勃發(fā)展起來(lái)的,是天文學(xué)發(fā)展到一定階段的必然產(chǎn)物。天文學(xué)研究的方式和方法是應(yīng)時(shí)代而發(fā)展變化的,小型數(shù)據(jù)研究大部分是假設(shè)驅(qū)動(dòng),單個(gè)科研工作者足以勝任;中型和大型數(shù)據(jù)研究亦或是假設(shè)驅(qū)動(dòng),更準(zhǔn)確地說(shuō)是數(shù)據(jù)驅(qū)動(dòng),合作研究成為主流。正是在這種形勢(shì)下,各種與天文統(tǒng)計(jì)和天文信息相關(guān)的國(guó)際組織成立。它們的共同目標(biāo)就是促進(jìn)大數(shù)據(jù)時(shí)代天文學(xué)的快速發(fā)展,培養(yǎng)面向大數(shù)據(jù)的新一代人才。
6.1 與天文統(tǒng)計(jì)和天文信息相關(guān)的國(guó)際組織
國(guó)際天文統(tǒng)計(jì)學(xué)會(huì)(International Astrostatistics Association,IAA)⑦h(yuǎn)ttp://iaa.mi. oa-brera.inaf. it/adm_program/ modules/ announcements/ announcements. php于2012年正式成立,總部設(shè)在意大利米蘭的布雷拉天文臺(tái),是全球第一個(gè)致力于天文統(tǒng)計(jì)學(xué)和天文信息學(xué)的科學(xué)學(xué)會(huì)。目前,會(huì)員數(shù)已超過(guò)550人,來(lái)自56個(gè)不同的國(guó)家和地區(qū)。學(xué)會(huì)的第一終極目標(biāo)是加強(qiáng)天文學(xué)家/天體物理學(xué)家與統(tǒng)計(jì)學(xué)家的合作;第二個(gè)目標(biāo)是讓天文學(xué)家更好地理解新的統(tǒng)計(jì)方法,從而提高對(duì)天文大數(shù)據(jù)的分析和解釋。學(xué)會(huì)不時(shí)地為會(huì)員提供詳細(xì)的關(guān)于天文統(tǒng)計(jì)的文章、即將舉行的會(huì)議、工作組和教育資源等信息。
國(guó)際天文學(xué)會(huì)天文信息和天文統(tǒng)計(jì)委員會(huì)⑧https://asaip. psu.edu/ organizations/ iau-commissiononastroinformati cs-andastrostatistics起源于2012-2015年度的國(guó)際天文學(xué)會(huì)天文統(tǒng)計(jì)與天文信息工作組,于2015年正式成立,主旨是促進(jìn)現(xiàn)代的計(jì)算和統(tǒng)計(jì)方法在天文研究領(lǐng)域的應(yīng)用。同年,國(guó)際天文學(xué)會(huì)時(shí)域天文學(xué)工作組正式成立,旨在協(xié)調(diào)全球變?cè)吹难芯?,包括變星和雙星、地外行星、吸積天體等以及在射電波段、可見(jiàn)光波段和高能波段在內(nèi)的多時(shí)域的巡天。并且美國(guó)天文學(xué)會(huì)也成立了時(shí)域天文工作組,鼓勵(lì)和促進(jìn)與時(shí)域天文相關(guān)的活動(dòng)和合作,如科學(xué)運(yùn)用時(shí)序數(shù)據(jù)、與其他波段信息的整合,進(jìn)一步提高科學(xué)產(chǎn)出;組織和資助與時(shí)域天文相關(guān)的會(huì)議、工作組、小型會(huì)議。
電氣與電子工程師協(xié)會(huì)挖掘復(fù)雜天文數(shù)據(jù)的特別工作組⑨https://asaip. psu.edu/ organizations/ ieee-astrominertask-force成立于2014年,隸屬于IEEE計(jì)算智能學(xué)會(huì)的數(shù)據(jù)挖掘技術(shù)委員會(huì),主要目標(biāo)是解決現(xiàn)代天文學(xué)面臨的問(wèn)題,即如何將全天的無(wú)窮盡的數(shù)據(jù)流高速地轉(zhuǎn)化為知識(shí)。廣義而言,盡管急切需要機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、計(jì)算智能方法,但是這些方面還有待進(jìn)一步研究和開(kāi)發(fā)。天文學(xué)家也開(kāi)始廣泛涉獵這些領(lǐng)域,保證工作組的出現(xiàn)和努力完全是為了更好地支持和推進(jìn)天文科學(xué)的研究。計(jì)算機(jī)領(lǐng)域?qū)<业挠幸饬x的貢獻(xiàn)是與天文學(xué)家緊密合作分不開(kāi)的。因此,組員將努力參與天文數(shù)據(jù)分析項(xiàng)目,而且最初組員的選擇也反映了這種思想。
美國(guó)天文學(xué)會(huì)的天文信息和天文統(tǒng)計(jì)工作組⑩https://asaip. psu.edu/ organizations/ aas-workinggroup-inastroinformaticsandastrostatistics是以“方法、人才、會(huì)議”為宗旨,有3個(gè)主要戰(zhàn)略目標(biāo):開(kāi)發(fā)、組織和維護(hù)方法資源,如軟件工具、文章、書籍、報(bào)告、研討會(huì)以及其他的教育資源;提高人力資源,如建立演講團(tuán)、構(gòu)建職業(yè)規(guī)劃、建立存檔的論壇、保證定期的新聞發(fā)布;組織專題會(huì)議。在2015年美國(guó)天文學(xué)會(huì)上,該工作組專門討論了在天文領(lǐng)域計(jì)算和統(tǒng)計(jì)需求日益增加的情況下的教育和職業(yè)規(guī)劃問(wèn)題。
大型綜合巡天望遠(yuǎn)鏡的信息和統(tǒng)計(jì)科學(xué)團(tuán)組?https://issc. science.lsst.org/旗下有40余名數(shù)據(jù)科學(xué)家,主要致力于開(kāi)發(fā)適合大型天文巡天數(shù)據(jù)的工具。該團(tuán)組成員包括天文學(xué)家、統(tǒng)計(jì)學(xué)家、計(jì)算機(jī)科學(xué)家、機(jī)器學(xué)習(xí)專家,他們有一個(gè)共同的目標(biāo),就是要解決LSST面臨的挑戰(zhàn),從而更好地實(shí)現(xiàn)LSST的科學(xué)目標(biāo)。
美國(guó)統(tǒng)計(jì)學(xué)會(huì)的天文統(tǒng)計(jì)興趣組?http://community. amstat.org/ astrostats/home成立于2014年,搭起了統(tǒng)計(jì)學(xué)家與天文學(xué)家合作的橋梁。
天文統(tǒng)計(jì)和天文信息門戶網(wǎng)站?https://asaip. psu.edu/是一個(gè)全新的服務(wù)于天文學(xué)家、統(tǒng)計(jì)學(xué)家和計(jì)算機(jī)科學(xué)家的交叉學(xué)科社區(qū)的網(wǎng)站。該網(wǎng)站由國(guó)際天文學(xué)會(huì)的天文統(tǒng)計(jì)和天文信息工作組主席Eric Feigelson和國(guó)際天文統(tǒng)計(jì)學(xué)會(huì)主席Joseph Hilbe維護(hù)和編輯。該網(wǎng)站的目標(biāo)是致力于促進(jìn)天文領(lǐng)域的高級(jí)算法研究和加強(qiáng)這些方法在更廣闊的天文領(lǐng)域的應(yīng)用。該網(wǎng)站提供了天文統(tǒng)計(jì)和天文信息領(lǐng)域的最新的文章摘要、一些相關(guān)課題的論壇、研究、專家文章、會(huì)議、各種各樣的網(wǎng)絡(luò)資源,如在線的課程、書籍、工作和博客等。該網(wǎng)站服務(wù)于國(guó)際天文統(tǒng)計(jì)學(xué)會(huì)、美國(guó)天文學(xué)會(huì)的天文信息和天文統(tǒng)計(jì)工作組、國(guó)際天文學(xué)會(huì)的天文統(tǒng)計(jì)和天文信息工作組、大型綜合巡天望遠(yuǎn)鏡的信息和統(tǒng)計(jì)科學(xué)團(tuán)組、美國(guó)統(tǒng)計(jì)學(xué)會(huì)的天文統(tǒng)計(jì)興趣組5個(gè)組織的公共教育。
6.2 與天文統(tǒng)計(jì)和天文信息相關(guān)的教育
科學(xué)家必須具備這種意識(shí):將已有的合適的分析技巧和方法應(yīng)用到實(shí)際數(shù)據(jù)中,從而推導(dǎo)出最好的結(jié)論。然而,這種意識(shí)只有在天文統(tǒng)計(jì)和天文信息領(lǐng)域獲得了足夠多培訓(xùn)的時(shí)候才可以具備。目前的課程還遠(yuǎn)遠(yuǎn)不夠,況且這些課程還沒(méi)有對(duì)天文學(xué)系的學(xué)生開(kāi)放或要求。實(shí)際科研中,科學(xué)家在軟件編程方面比較薄弱的時(shí)候,還需要親自動(dòng)手寫代碼或軟件。在“天文領(lǐng)域的軟件使用用戶:一份非正式調(diào)查”的報(bào)告中指出:所有使用軟件的天文學(xué)家中90%的用戶自己寫代碼,其中僅有8%的用戶接受過(guò)扎實(shí)培訓(xùn)?https://asaip. psu.edu/。因此,美國(guó)天文學(xué)會(huì)的天文信息和天文統(tǒng)計(jì)工作組在美國(guó)西雅圖2015年第225屆美國(guó)天文年會(huì)上組織了一個(gè)關(guān)于天文研究中的天文信息和天文統(tǒng)計(jì):邁向更好的課程的研討會(huì)。會(huì)中提出了若干關(guān)于教育的議題,主要結(jié)論如下。
· 教師的培訓(xùn)是很重要的。非教學(xué)時(shí)間教師的培訓(xùn)會(huì)有幫助。在線有很多課程,應(yīng)該給出一些指導(dǎo)性的建議,如哪些課程值得學(xué)習(xí)。
· 教師進(jìn)修課程所需的經(jīng)費(fèi)是需要籌備的。這樣的培訓(xùn)組織也是需要的。
· 天文學(xué)界要鼓勵(lì)學(xué)生和職工從事數(shù)據(jù)科學(xué)方面的培訓(xùn)。
· 一些導(dǎo)師可能不支持學(xué)生參加數(shù)據(jù)科學(xué)方面的培訓(xùn)。如果導(dǎo)師不支持,學(xué)生就難于參加培訓(xùn)。
· 課程的變更常常是不可能的,或者說(shuō)需要很長(zhǎng)時(shí)間來(lái)推行。增加一門新課程意味著要減少一門其他課程。這樣的修改需要經(jīng)過(guò)縝密的思考和具備強(qiáng)大的動(dòng)力??梢愿淖円环N策略,課程變?yōu)楸匦拚n和可選課。如果可選課設(shè)計(jì)組織得好,有趣并且廣告做得好,那樣選擇的學(xué)生人數(shù)自然會(huì)上升。
· 并不單單是天文學(xué)在這方面捉襟見(jiàn)肘,其他學(xué)科也面臨同樣的問(wèn)題??梢耘c其他領(lǐng)域的同行交流,與領(lǐng)導(dǎo)溝通,盡可能實(shí)現(xiàn)大學(xué)課程的調(diào)整。
· 人才流失經(jīng)常會(huì)發(fā)生而且是不可避免的。能夠跟上學(xué)術(shù)領(lǐng)域有才華的科學(xué)家的步伐是比較具有挑戰(zhàn)性的。在天文大數(shù)據(jù)時(shí)代,最好能與工業(yè)領(lǐng)域并駕齊驅(qū),同時(shí)應(yīng)該意識(shí)到數(shù)據(jù)科學(xué)是現(xiàn)代天文研究的重要組成部分。
針對(duì)天文領(lǐng)域出現(xiàn)的統(tǒng)計(jì)和信息問(wèn)題,一些天文學(xué)家根據(jù)自己的科研經(jīng)歷總結(jié)和編寫了天文統(tǒng)計(jì)和天文信息方面的書籍。表1列出了2012年以來(lái)相關(guān)的書籍。目前,天文信息方面的書籍還比較匱乏,還待這方面的有識(shí)之士去編撰。
關(guān)于天文統(tǒng)計(jì)和天文信息方面的大量的非正式培訓(xùn)不時(shí)地在各地開(kāi)展。各種各樣的會(huì)議和暑期班也相繼舉辦,會(huì)議包括:現(xiàn)代天文學(xué)中的統(tǒng)計(jì)挑戰(zhàn)、天文信息會(huì)議、21世紀(jì)宇宙學(xué)統(tǒng)計(jì)挑戰(zhàn)會(huì)議、天文數(shù)據(jù)分析軟件和系統(tǒng)會(huì)議等。暑期班包括:天文數(shù)據(jù)分析暑期班、天文學(xué)家的統(tǒng)計(jì)暑期班、天文大數(shù)據(jù)工具等。琳瑯滿目的關(guān)于統(tǒng)計(jì)和信息的資源可以在線獲得。例如:通過(guò)YouTube可以找到16 900個(gè)關(guān)于貝葉斯計(jì)算的視頻、7 710個(gè)關(guān)于非線性回歸的視頻、11 300個(gè)關(guān)于計(jì)算天體物理的視頻。通過(guò)注冊(cè)可以接受正式的網(wǎng)絡(luò)培訓(xùn)課程(如Coursera、statistics.com等),盡管這些課程是面向其他領(lǐng)域的。數(shù)據(jù)海洋列出了直接面向教育的資源。研究者可以根據(jù)自己的需求選取適合自己的課程或?qū)W習(xí)資源。
天文學(xué)中仍然存在著許多未解問(wèn)題,如什么是暗物質(zhì)和暗能量?宇宙在誕生之初的10-35s是否經(jīng)歷了膨脹階段?星系是如何形成和演化的?到底有多少顆太陽(yáng)系外行星?它們是否存在智慧生命?這些問(wèn)題的解答必將受益于大數(shù)據(jù)分析。面對(duì)天文大數(shù)據(jù)提出的挑戰(zhàn),知識(shí)發(fā)現(xiàn)工具有待改進(jìn)和提高,如可用性、可擴(kuò)展性、互動(dòng)的數(shù)據(jù)挖掘和可視化。在機(jī)器學(xué)習(xí)/人工智能方面,實(shí)現(xiàn)協(xié)作的人機(jī)發(fā)現(xiàn);在超維數(shù)據(jù)的可視化方面,加強(qiáng)人們的理解和認(rèn)知力,實(shí)現(xiàn)可視化的數(shù)據(jù)探索和發(fā)現(xiàn);在社區(qū)的參與和事業(yè)規(guī)劃方面需要克服智能和方法的惰性,實(shí)行獎(jiǎng)勵(lì)和鼓勵(lì)機(jī)制;需要探討新型的發(fā)表和合作方式,超出發(fā)表論文的范疇,開(kāi)發(fā)較好的合作工具;培養(yǎng)和造就下一代的大數(shù)據(jù)科學(xué)家。計(jì)算機(jī)技術(shù)和數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)引發(fā)科學(xué)的轉(zhuǎn)型,無(wú)論從定性還是定量上,數(shù)據(jù)驅(qū)動(dòng)的科學(xué)有別于傳統(tǒng)科學(xué)。任何一門數(shù)據(jù)密集型科學(xué)都面臨著許多共同的挑戰(zhàn),它們的解決方案促進(jìn)新的科學(xué)方法產(chǎn)生。大數(shù)據(jù)科學(xué)應(yīng)用的核心是人的素質(zhì),專業(yè)天文學(xué)家和公眾在數(shù)據(jù)科學(xué)方面的教育和素養(yǎng)必須大大提高。大數(shù)據(jù)時(shí)代標(biāo)志著天文學(xué)家獨(dú)自搞科研的時(shí)代結(jié)束,分享、合作、共贏成為大數(shù)據(jù)時(shí)代的主旋律,隨著天文統(tǒng)計(jì)學(xué)和天文信息學(xué)的蓬勃發(fā)展和深入應(yīng)用,天文學(xué)發(fā)現(xiàn)的黃金新時(shí)代即將來(lái)臨。
表1 2012年以來(lái)與天文統(tǒng)計(jì)和天文信息相關(guān)的書籍
[1] FEIGELSON E, BABU B. Big data in astronomy[J]. Significance, 2012, 9(4): 22-25.
[2] ZHANG Y, ZHAO Y. Astronomy in the big data era[J]. Data Science Journal, 2015, 14(11):1-9.
[3] TYSON J, BORNE K. Future sky surveys new discovery frontiers[M]//Advances in machine learning and data mining for astronomy. Boca Raton: CRC Press, 2012: 161-181.
[4] BORNE K D. Astroinformatics: a 21st century approach to astronomy[J]. Kirkborne Net, 2009, 42: 578.
[5] BORNE K D. Astroinformatics: dataoriented astronomy research andeducation[J]. Earth Science Informatics, 2010, 3(1): 5-17.
[6] DJORGOVSKI S, DONALEK C, MAHABAL A, et al. Some pattern recognition challenges in data-intensive astronomy[C]// The 18th International Conference on Pattern Recognition, August 20-24, 2006, Hong Kong, China. [S.l.:s.n.], 2006: 856-863.
[7] 張彥霞,趙永恒. 數(shù)據(jù)挖掘技術(shù)在天文學(xué)中的應(yīng)用[J]. 科研信息化技術(shù)與應(yīng)用,2011,2(3): 13-27. ZHANG Y X, ZHAO Y H. The application of data mining technologies in astronomy[J]. E-science Technology & Application, 2011, 2(3): 13-27.
[8] 張彥霞,趙永恒,崔辰州. 天文學(xué)中的數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)[J]. 天文學(xué)進(jìn)展, 2002, 20(4): 312-323. ZHANG Y X, ZHAO Y H, CUI C Z. Data mining and knowledge discovery in database of astronomy[J]. Progress in Astronomy, 2002, 20(4): 312-323.
[9] BALL N M, BRUNNER R J. Data mingand machine learningin astronomy[J]. International Journal of Modern Physics D, 2010, 19(7): 1049-1106.
[10] DAS K, BHADURI K. Parallel and distributed data mining for astronomy applications[M]// Advances in machine learning and data mining for astronomy. Boca Raton: CRC Press, 2012: 595-615.
[11] BORNE K. Virtual observatories data mining and astroinformatics[J]. Planets Stars and Stellar Systems, 2013(2): 404-443.
[12] BORNE K. Scientific data mining in astronomy[M]// Next generation of data mining. Boca Raton: CRC Press, 2009: 91-114.
Big data and paradigm shift for astronomy in the 21stcentury
ZHANG Yanxia, CUI Chenzhou, ZHAO Yongheng
Key Laboratory of Optical Astronomy, National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China
With the development of large space-based and ground-based observational technologies, the volume, output rate and complexity of astronomical data rapidly increase. The astronomy steps into a new data-intensive era. The characteristics of astronomical data were represented. The limitations of traditional astronomy were analyzed. The necessity and research direction of developing astrostatistics and astroinformatics were put forward. As a typical astronomical application, the operation and applications of LSST were introduced. The organizations related to astrostatistics and astroinformatics were summarized. The present situation and problems of public education about this respect were analyzed. All these were provided as references for the healthy development of big data in astronomy.
astronomical big data, astroinformatics, astrostatistics, survey
P11
A
10.11959/j.issn.2096-0271.2016067
張彥霞(1974-),女,博士,中國(guó)科學(xué)院國(guó)家天文臺(tái)研究員、碩士生導(dǎo)師,北京天文學(xué)會(huì)副秘書長(zhǎng),國(guó)際天文統(tǒng)計(jì)學(xué)會(huì)會(huì)士,國(guó)際天文學(xué)會(huì)天文信息與天文統(tǒng)計(jì)委員會(huì)委員。曾任國(guó)際天文學(xué)會(huì)天文統(tǒng)計(jì)與天文信息工作組委員會(huì)委員。主要從事天文大數(shù)據(jù)、天文信息學(xué)、天文統(tǒng)計(jì)學(xué)、多波段天文學(xué)等研究工作。在國(guó)內(nèi)外學(xué)術(shù)刊物上發(fā)表論文100余篇。
崔辰州(1976-),男,博士,中國(guó)科學(xué)院國(guó)家天文臺(tái)研究員、碩士生導(dǎo)師,國(guó)家天文臺(tái)信息與計(jì)算中心主任,北京市科技新星計(jì)劃入選者。率先在中國(guó)科學(xué)院國(guó)家天文臺(tái)建立起集科學(xué)數(shù)據(jù)庫(kù)、高性能計(jì)算、信息化環(huán)境研發(fā)三位一體的科研信息化研究與服務(wù)體系。多年來(lái),一直以科技資源整合與共享為研究主線,推動(dòng)虛擬天文臺(tái)的發(fā)展,已發(fā)表論文70多篇。
趙永恒(1964-),男,博士,中國(guó)科學(xué)院國(guó)家天文臺(tái)研究員、博士生導(dǎo)師,中國(guó)科學(xué)院“百人計(jì)劃”和國(guó)家“萬(wàn)人計(jì)劃”入選者?,F(xiàn)任中國(guó)天文學(xué)會(huì)常務(wù)理事,曾任國(guó)家重大科學(xué)工程LAMOST項(xiàng)目總經(jīng)理、北京天文學(xué)會(huì)理事長(zhǎng)、國(guó)際天文聯(lián)合會(huì)第五委員會(huì)科學(xué)組織委員會(huì)委員、世界數(shù)據(jù)中心天文學(xué)科中心主任。主要研究方向?yàn)榛顒?dòng)天體的理論研究、高能天體的觀測(cè)分析、天文數(shù)據(jù)分析、天文信息技術(shù)等,在國(guó)內(nèi)外學(xué)術(shù)刊物上發(fā)表論文300余篇。
2016-08-03
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃基金資助項(xiàng)目(No. 2014CB845700)
Foundation Item:National Key Basic Research Program of China (No.2014CB845700)