校內(nèi)的宣講會上,我第一次了解到英才計劃,具體的宣講內(nèi)容已記不太清了,但是,英才計劃的核心——“中學(xué)生科研”的概念卻像釘子一樣釘在了我的腦海中,這5個字就像繩索一般,一下子就拴住了我的心。
經(jīng)歷了筆試、面試等層層選拔后,我有幸入選英才計劃,成為了一名英才學(xué)員。我與張銘導(dǎo)師的初次見面是在2021年1月。受新冠疫情影響,我們只能采用線上方式進行溝通。盡管是線上交流,我仍然在短短的1個小時中學(xué)習(xí)到了許多。張銘老師向我分享了她的科研經(jīng)歷,主要是關(guān)于她在推薦系統(tǒng)、文本挖掘方面開展的研究,在這個過程中,我深刻地體會到了張銘老師嚴(yán)謹(jǐn)治學(xué)的態(tài)度和勇于創(chuàng)新的科研精神。
科學(xué)研究的道路是曲折漫長的。在選題初期,我陷入了“兩眼一抹黑”的尷尬境地。我堅持與張銘老師保持積極的溝通,最后她建議我從中學(xué)生的角度研究問題,回歸生活,從實際出發(fā)。在留心觀察生活,并閱讀了計算機相關(guān)的文獻后,我確定了5個備選課題,在與張銘老師深入溝通交流后,最終確定研究碑帖修復(fù)項目。
項目靈感來源于書法。小時候我有一段學(xué)習(xí)書法的經(jīng)歷,曾欣賞過歷朝歷代的書法作品。其中,印象最深的是《張猛龍碑》。 《張猛龍碑》距今約有1500年的歷史,在漫長歲月中,它歷經(jīng)風(fēng)吹雨打,傳承至今,碑帖上已有多處磨損。每當(dāng)我欣賞《張猛龍碑》時,總為帖中的殘缺感到遺憾,能不能設(shè)計一個可以自動修復(fù)殘缺文字的程序呢?這個問題吸引了我,引發(fā)了我的思考。
在研究碑帖修復(fù)時,主要遇到了3個方面的困難。
第1個困難是數(shù)據(jù)集的收集。網(wǎng)上有大量《張猛龍碑》的圖片,但是這些圖片并沒有統(tǒng)一的規(guī)范,圖片的內(nèi)容、尺寸和清晰度都有極大的差異,不能直接作為程序的輸入源。因此,找到一個可靠的數(shù)據(jù)來源成為當(dāng)務(wù)之急。經(jīng)歷了漫長的搜尋后,在一個書法網(wǎng)站上,我找到了清晰度較好、內(nèi)容較全的《張猛龍碑》圖片。由于從網(wǎng)站下載不便,我就寫了一個下載圖片的程序,然而問題并沒有得到解決。按照最初的設(shè)想,程序需要使用單個漢字作為輸入,而我收集的圖片,是由十幾個漢字組成的圖片,這意味著需要一種分割漢字的方法。在多次嘗試后,我打消了使用程序進行分割的念頭,決定采用人工方式進行單個漢字的提取。
建立好數(shù)據(jù)集后,我遇到了第2個困難。在閱讀了計算機視覺方面的文獻后,我嘗試從傳統(tǒng)的圖片修復(fù)領(lǐng)域入手進行碑帖修復(fù),結(jié)果差強人意,因為計算機字體有著統(tǒng)一的風(fēng)格,而《張猛龍碑》每個字都有獨特的藝術(shù)風(fēng)格,這令我十分沮喪。當(dāng)我想要放棄時,回憶起與張銘老師初次見面的情景,以及張銘老師對我的支持與鼓勵,便又鼓起幾分勇氣,振奮幾分精神,繼續(xù)鉆研下去。最終,我更換了研究角度,從圖像風(fēng)格遷移的角度人手,進行碑帖修復(fù)。
第3個困難是關(guān)于算法實驗的。在進行計算機領(lǐng)域的研究時,科研人員常常需要分析算法,研究它的性能。而在計算機視覺領(lǐng)域,對計算資源的要求非常嚴(yán)苛,需要比較高端的計算機硬件配置。我向張銘老師講述了項目對于算力的需求,她立即將組里的計算資源分享給我,并安排師兄指導(dǎo)我在服務(wù)器上配置開發(fā)環(huán)境和運行代碼。
中學(xué)生科研,不僅僅有科研,同樣需要過硬的人文素養(yǎng)。在科研過程中,科研人員經(jīng)常需要分享自己的科研成果,撰寫科研論文,參加答辯。作為一名英才學(xué)員,我也鍛煉到了上述的基本科學(xué)素養(yǎng)。
關(guān)于論文撰寫,在完善初稿后,張銘老師不僅給出了修改意見,還向我分享了組里師兄師姐們寫的論文。經(jīng)過認(rèn)真研讀和學(xué)習(xí)后,我從中看到了明顯的差距,也進一步明白了如何寫出一篇優(yōu)秀的科研論文。
除了撰寫論文,英才計劃還鍛煉了我的答辯能力。從開題報告,到中期答辯,再到結(jié)題報告,雖然每次答辯都會緊張,會有不完善的地方,但是,每一次答辯都在進步,是一次次對于自我的挑戰(zhàn)與突破。在結(jié)題報告的那天,播放完最后一張PPT時,過往一年的經(jīng)歷從我的腦海中穿過,似煙花般燦爛。
回望參與英才計劃的1年,我收獲了許多,也成長了許多。從最初一個連Pytorch框架是什么都不知道的懵懂少年,到完成一個初步的科研項目,在這個過程中,我接觸到了許多新知識,也掌握了科學(xué)研究的基本思維模式與方法。祝愿英才計劃越辦越好,能讓更多的中學(xué)生參與到科研中來,培養(yǎng)科研精神,提高基礎(chǔ)素養(yǎng),為中國的科研與發(fā)展打好基礎(chǔ),注入新鮮血液。
孫工博
2021級英才計劃計算機學(xué)科學(xué)員
就讀于北京市十一學(xué)校,師從北京大學(xué)張銘老師。在英才計劃期間,完成“基于端到端生成式對抗神經(jīng)網(wǎng)絡(luò)的碑帖修復(fù)”課題,并將源代碼及其數(shù)據(jù)集分享到了開源網(wǎng)站github上。21398F34-9AA9-47C7-B76B-62F3C59CFC0A