當今時代是科技的時代,信息的時代。為了能達到最大限度地節(jié)約時間、資源成本,人們越來越依賴于共享知識、信息提供的便利。然而,有效的知識、信息需要經(jīng)過龐大復(fù)雜的數(shù)據(jù)整合、提取來獲得。而海量的數(shù)據(jù)搜集、分析在為我們提供更多實用信息的同時,伴隨的是數(shù)據(jù)復(fù)雜性和維度多樣性等相關(guān)問題的產(chǎn)生。這就為統(tǒng)計學方法研究和應(yīng)用帶來了巨大的挑戰(zhàn)。
挑戰(zhàn)即機遇,中國人民大學統(tǒng)計與大數(shù)據(jù)研究院副教授郭紹俊,這些年來一直致力于高維統(tǒng)計學習、大維統(tǒng)計計算、生物統(tǒng)計及函數(shù)型數(shù)據(jù)分析等研究。他表示:“目前大數(shù)據(jù)時代,對中國的統(tǒng)計學來講是個很好的機會,可以讓更多人把統(tǒng)計學應(yīng)用并發(fā)揚光大。”著眼當下,統(tǒng)計學發(fā)展前景十分廣闊,其必將吸引更多的人投身至此。
統(tǒng)計學熱潮不會太久遠
社會的飛速進步,讓我們的生活變得與數(shù)據(jù)息息相關(guān)。個人的衣食住行等行為過程,企業(yè)機構(gòu)管理的操作進程等,每時每刻均會產(chǎn)生數(shù)據(jù)流。噴薄而出的數(shù)據(jù)亟需有效的處理方式從中攫取有益信息,供給反饋服務(wù)。
統(tǒng)計學作為研究數(shù)據(jù)方法的一種,在被提及時,大部分人印象還停留在分類、匯總、制表等淺層層面,且不明實際應(yīng)用效能,這是統(tǒng)計學面臨的尷尬之一。此外,統(tǒng)計學雖滲透領(lǐng)域廣泛,但作為思想工具充當?shù)拇蠖际恰澳缓笥⑿??!辈糠只诮y(tǒng)計學思想進行數(shù)據(jù)研究的學者,更樂于自稱經(jīng)濟學家、金融學家,而非統(tǒng)計學家。此類現(xiàn)象,相信不是統(tǒng)計學個例,有關(guān)現(xiàn)象成因是值得學術(shù)界探討思考的。
“目前,大數(shù)據(jù)熱潮集中在硬件的管理、存儲等功用能力上,尚未轉(zhuǎn)移到對數(shù)據(jù)本身的價值研究?!惫B俊如是分析。他還表示,由關(guān)注數(shù)據(jù)存儲到關(guān)注數(shù)據(jù)本身是一個循序漸進的過程,而統(tǒng)計學研究將在過程中承擔重要角色?!爱敂?shù)據(jù)管理、存儲的火熱退卻,數(shù)據(jù)分析勢必會成為主向?qū)?,屆時統(tǒng)計學優(yōu)勢也將顯現(xiàn)出來?!?/p>
統(tǒng)計學不可能只是泛化的紙上談兵,它的實際應(yīng)用如何呢?郭紹俊結(jié)合國內(nèi)外差異,做出相對細致的回答?!皣鈶?yīng)用相比國內(nèi)發(fā)展較快,以生物統(tǒng)計為例,國外發(fā)展甚至遠超統(tǒng)計系,經(jīng)典統(tǒng)計學奠基人之一Karl Pearson也曾致力于此?!鄙锝y(tǒng)計應(yīng)用覆蓋范圍廣,囊括了醫(yī)院、制藥廠等眾多機構(gòu)。
此外,區(qū)別國內(nèi)外統(tǒng)計知識的傳承,郭紹俊補充道:“國外學者樂于推廣宣傳知識技藝,長期積淀的基礎(chǔ)相對扎實,理論和應(yīng)用能夠雙管齊下。二戰(zhàn)時,國際著名統(tǒng)計學家John Tukey已經(jīng)使用應(yīng)用統(tǒng)計學解決實際問題。而我國介于文化緣由,很多先進的知識和方法論未能傳承?!睆陌l(fā)展角度看,國外統(tǒng)計學遵循了數(shù)據(jù)分析、方法論建立、基于方法搭建理論框架這一漸進過程,而中國統(tǒng)計學則直接從數(shù)理角度起步,跨過了應(yīng)用直達理論,在認識上難免存在不足?!叭缃駭?shù)據(jù)分析和統(tǒng)計學研究是一個分離狀態(tài),這樣其實并不合理。而大數(shù)據(jù)時代數(shù)據(jù)和數(shù)據(jù)分析的認識被不斷刷新,兩者之間交流是必不可少的。”
事實上,在統(tǒng)計學研究的導(dǎo)向之下,郭紹俊格外關(guān)注高維數(shù)據(jù)建模領(lǐng)域。針對數(shù)據(jù)噴發(fā)帶來的一系列問題,如考慮高維線性模型的參數(shù)估計以及變量選擇問題,基于最小二乘方法的傳統(tǒng)回歸技術(shù)就不再奏效,基于稀疏性假設(shè)下的正則化方法已成為研究高維數(shù)據(jù)的一類基本方法。他一直致力從各角度思考,尋找新的出發(fā)點,從而能夠在理論上揭示高維數(shù)據(jù)建模中正則化方法可能帶來的優(yōu)勢及風險。研究過程中,他提出了一連串新的高維統(tǒng)計分析和建模的工具。它們不僅能巧妙地利用稀疏性思想,還具有解決大范圍問題的普適性,從廣度和深度上直接推動了高維數(shù)據(jù)處理工具的發(fā)展。
“中國不缺少人才,缺少的是頂尖人才”
“雖然中國的統(tǒng)計學發(fā)展起步較晚,但勝在發(fā)展快、眼光遠,具有很強的后發(fā)優(yōu)勢。”著眼當前局勢,郭紹俊作出如是樂觀的判斷。他認為,國內(nèi)不缺少人才,欠缺的是對頂尖人才的培養(yǎng)。營造自由的學術(shù)氛圍,加快長聘制度的完善,增加學術(shù)引進等一系列措施,在他看來對尖端人才培養(yǎng)均能起到一定積極作用。
被問及身為科研工作者所具備的專業(yè)素養(yǎng)時,郭紹俊有一套自己的見解。“一如既往地堅持科研是樂趣,而不斷思考才會促使短暫的人生升華?!笨蒲惺且粋€漫長的過程,工作難度與時間付出呈現(xiàn)非絕對性正相關(guān),耐心、韌性也就成為必需品。除此之外,保持好奇心是孜孜不倦學習的動力之源,擺正心態(tài)、自身的勤勉、對物欲的節(jié)制亦是郭紹俊分外看重的。
樹人先樹己。對待研究工作,郭紹俊始終秉持“寧缺勿濫”的準則。他認為文章的精華在于新的統(tǒng)計思想的闡述,并一再強調(diào),統(tǒng)計學注重的是方法學習、統(tǒng)計思想交流,而非照本宣科?!八枷胧菚緹o法印刷的,卻恰恰是最重要的。同理,文獻的價值并非文字本身,而是其背后所要傳達的思想?!?/p>
扎實的計算機基礎(chǔ),深邃的統(tǒng)計思想是一個統(tǒng)計學者必備的。而現(xiàn)如今,統(tǒng)計學門檻過低,計算機技能要求尚淺,同時拘泥于學科維度限制,這些對統(tǒng)計學發(fā)展都不是好的現(xiàn)象。統(tǒng)計學從業(yè)人員并不適用“木桶效應(yīng)”,相對而言,硬性化計算機能力、靈活化統(tǒng)計學思想、輔以厚重的歷史感、深度的知識層,打破平庸地均衡發(fā)展,用尖端效應(yīng)帶來的獨立優(yōu)勢打造聯(lián)動模式明顯更符合當前局勢。
因興趣做出選擇
從最初對數(shù)學的喜愛轉(zhuǎn)變成如今對統(tǒng)計學的專注,郭紹俊走過了一個漫長的過程,感觸頗多。
說起選擇,對郭紹俊來說,本科選擇數(shù)學專業(yè)是沒有絲毫遲疑的。之后,通過對數(shù)學的接觸,他確定自己更想向應(yīng)用數(shù)學的方向發(fā)展,而在應(yīng)用數(shù)學范疇,他沒有被當時火熱的金融證券吸引,轉(zhuǎn)身投入到更加注重方法的統(tǒng)計學。選擇中國人民大學統(tǒng)計與大數(shù)據(jù)研究院,郭紹俊也有過一番深思熟慮。作為國內(nèi)數(shù)據(jù)研究的前沿平臺,研究院致力構(gòu)建世界一流水平的統(tǒng)計與數(shù)據(jù)學科,開展學科原創(chuàng)性研究,同時在領(lǐng)域內(nèi)展開多種形式的學術(shù)交流與教學合作。研發(fā)與教學并重,發(fā)展與育人同行,這正是吸引他的緣由所在。
提到恩師,郭紹俊表達了由衷的感謝之情。在中科院讀博士時,是陳敏研究員引領(lǐng)他進入富有魅力的統(tǒng)計學領(lǐng)域,而后在導(dǎo)師的極力推薦下,他赴國外跟隨國際一流統(tǒng)計學家進行前沿課題研究。在普林斯頓大學展開博士后研究時,他師承范劍青教授,在英國倫敦經(jīng)濟學院訪問時,他師從姚琦偉教授。他坦言從3位老師身上受益頗深,無論是教書育人還是學術(shù)研究,正是得益于恩師們的言傳身教,他感悟到什么是高水平的科學研究、什么是高尚的學術(shù)品味、什么是謙虛嚴謹?shù)膶W術(shù)風范。
現(xiàn)在,郭紹俊在專注科研工作的同時,走上三尺講臺教書育人,為統(tǒng)計學及數(shù)據(jù)科學注入新鮮的血液。閑暇時,他會打打羽毛球,還和記者笑稱之所以愛好羽毛球,是因為打羽毛球和統(tǒng)計科學研究一樣更注重方法和思想。雖然教學工作占據(jù)了他相當部分的生活,但在科學研究這條路上,郭紹俊將繼續(xù)義無反顧。