大數(shù)據(jù)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,因此,對大數(shù)據(jù)的挖掘、處理、分析等相關(guān)問題的熟練應(yīng)用是解決科學(xué)問題、反映科學(xué)發(fā)展新趨勢和新變化的關(guān)鍵。邱均平教授主持的國家社會科學(xué)基金重大項目“基于大數(shù)據(jù)的科教評價信息云平臺構(gòu)建和智能服務(wù)研究”(19ZDA348)將大數(shù)據(jù)的相關(guān)技術(shù)和方法應(yīng)用到科教評價領(lǐng)域,以提供智能化評價服務(wù)與決策。為闡述課題組在這方面的最新研究進(jìn)展,特撰寫這組以“大數(shù)據(jù)相關(guān)問題的應(yīng)用研究”為主題的專題論文,以期為推動大數(shù)據(jù)時代科教評價乃至其他各個領(lǐng)域的快速發(fā)展提供一定的借鑒和參考。
該專題共包含以下3篇文章:“近十年大數(shù)據(jù)環(huán)境下國際高等教育評價研究現(xiàn)狀分析——基于期刊的文本挖掘”“基于聚類和關(guān)聯(lián)規(guī)則的Altmetric TOP榜文獻(xiàn)特征分析”和“基于LDA模型的國內(nèi)大數(shù)據(jù)研究熱點(diǎn)主題分析”。其主要內(nèi)容是:①有關(guān)大數(shù)據(jù)挖掘問題的應(yīng)用研究,采用SATI、SPSS等工具進(jìn)行基于期刊的文本挖掘,探討國際高等教育評價現(xiàn)狀,以對我國高等教育評價提供啟示;②有關(guān)大數(shù)據(jù)處理問題的應(yīng)用研究,針對Altmetric TOP榜文獻(xiàn)采用K-Means聚類將不同指標(biāo)劃分級別,利用基于Aprioris算法的關(guān)聯(lián)規(guī)則探討不同情況下的傳播特征;③有關(guān)大數(shù)據(jù)分析問題的研究,通過LDA主題模型抽取國內(nèi)大數(shù)據(jù)研究主題并識別熱點(diǎn)主題,選取具有代表性的主題再次進(jìn)行LDA主題聚類,并運(yùn)用LDAvis對主題進(jìn)行可視化分析。
邱均平
杭州電子科技大學(xué)資深教授、博士生導(dǎo)師、院長