亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向科技大數(shù)據(jù)的科研團隊精準立體畫像生成方法

        2022-06-27 13:51:54許明英杜軍平梁美玉薛哲李昂
        預(yù)測 2022年3期
        關(guān)鍵詞:科研團隊畫像

        許明英 杜軍平 梁美玉 薛哲 李昂

        摘 要:針對科研團隊精準立體畫像構(gòu)建的現(xiàn)實需求,本文提出了面向科技大數(shù)據(jù)的科研團隊精準立體畫像生成方法。該方法包含科研團隊識別、科研團隊研究主題預(yù)測、科研團隊精準立體畫像生成三個模塊。基于迭代的中間中心度排名方法識別科研團隊負責(zé)人,通過2-派系和滾雪球方法識別科研團隊成員,實現(xiàn)科研團隊的識別。綜合考慮研究領(lǐng)域內(nèi)科研團隊研究主題間的交互影響,提出基于圖注意力網(wǎng)絡(luò)的主題融合的科研團隊研究主題預(yù)測方法,通過建模相同研究領(lǐng)域的團隊間的主題關(guān)聯(lián),提高科研團隊的研究主題預(yù)測準確率??蒲袌F隊精準立體畫像生成模塊通過科研團隊簡介生成、科研合作關(guān)系構(gòu)建、科研團隊研究主題及主題趨勢詞云生成科研團隊的精準立體畫像?;谔岢龅姆椒ㄔ谕ㄐ蓬I(lǐng)域的科研成果數(shù)據(jù)集上識別出科研團隊,預(yù)測科研團隊的研究主題,生成科研團隊精準立體畫像并進行可視化展示,驗證了所提方法的有效性。

        關(guān)鍵詞:科研團隊;畫像;團隊識別;主題預(yù)測;圖注意力網(wǎng)絡(luò)

        中圖分類號:TP391文獻標識碼:A文章編號:2097-0145(2022)03-0015-08doi:10.11847/fj.41.3.15

        Accurate Stereo Portrait Generation Method of Scientific Research Team

        for Scientific and Technological Big Data

        XU Ming-ying, DU Jun-ping, LIANG Mei-yu, XUE Zhe, LI Ang

        (Beijing Key Laboratory of Intelligent Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China)

        Abstract:In view of the practical demand of accurate stereo portrait construction of scientific research team, this paper proposes an accurate stereo portrait generation algorithm of scientific research team. The algorithm includes three modules: research team identification, research topic prediction and research team portrait generation. The leader of the scientific research team is identified based on the iterative middle centrality ranking method, and the members of the scientific research team are identified through the 2-faction and snowball methods, so as to realize the identification of the scientific research team. Considering the interaction between the research topics of the research team in the research field, a topic prediction method based on the topic fusion of the graph attention network is proposed to improve precision of topic prediction. The research team portrait generation module generates the accurate stereo portrait of the research team through the generation of the research team profile, the construction of research cooperation relationship, and the construction of the research team topic and trend cloud. Scientific research team is identified on the data set of scientific research achievements, and the accurate stereo portrait of scientific research team is generated and visualized. Experiments verify the effectiveness of the proposed method.Key words:scientific research team; portrait; team identification; topic prediction; graph attention network

        1 引言

        科研團隊合作在許多科學(xué)研究領(lǐng)域已經(jīng)變得勢在必行,科學(xué)、技術(shù)和工程領(lǐng)域超過90%的成果是通過團隊合作完成的[1]。隨著科研任務(wù)的復(fù)雜化和專業(yè)化程度的提高,科研任務(wù)越來越傾向于由科研團隊合作完成??蒲袌F隊合作有助于團隊成員實現(xiàn)科研團隊間的科技信息資源共享,獲取和整合科技知識、技術(shù)和其他必要的科技資源,從而提升科技創(chuàng)新能力[2,3]。相關(guān)調(diào)研發(fā)現(xiàn)信息檢索領(lǐng)域內(nèi)高產(chǎn)的學(xué)者更樂于合作,而且更愿意和自己研究興趣相似的人合作,科研團隊合作與研究質(zhì)量正相關(guān)[4]。

        如何從浩如煙海的科技大數(shù)據(jù)中快速、準確地識別出科研團隊,如何有效地刻畫科研團隊使團隊信息更加直觀地展示,為科研團隊管理、評審專家決策提供科學(xué)的決策支持是科技大數(shù)據(jù)領(lǐng)域亟需解決的重要科學(xué)問題[5]。從海量科技大數(shù)據(jù)中有效地識別科研團隊并對其進行分析[6,7]和刻畫,有助于快速掌握科研團隊現(xiàn)狀,改善對科研團隊的管理以及更好地引導(dǎo)科研團隊的發(fā)展。目前針對科研團隊畫像的研究相對較少,莫君蘭等[8]提出了科研團隊畫像的概念,通過融合多源異構(gòu)數(shù)據(jù)構(gòu)建科研團隊畫像。劉行兵等[9]使用AHP層次分析法,構(gòu)建了體現(xiàn)科研團隊協(xié)同創(chuàng)新能力的科研團隊畫像。現(xiàn)有的科研團隊畫像構(gòu)建方法沒有考慮對科研團隊的研究主題未來趨勢的刻畫,無法幫助科學(xué)家和政府預(yù)見未來的研究方向,無法為科研管理部門提供決策支持。

        本文提出了面向科技大數(shù)據(jù)的科研團隊精準立體畫像生成方法,該方法包括科研團隊識別、科研團隊研究主題預(yù)測、科研團隊精準立體畫像生成三個模塊??蒲袌F隊識別模塊通過獲取科技大數(shù)據(jù)中相關(guān)研究領(lǐng)域的科研成果等科技資源,基于社會網(wǎng)絡(luò)分析的思想[10,11],采用迭代的中間中心度排名方法識別出了團隊領(lǐng)導(dǎo)人與團隊成員[12]??蒲袌F隊研究主題預(yù)測模塊通過分析各個研究領(lǐng)域的科研團隊成果數(shù)據(jù)的特點[13~15],抽取科研團隊的研究主題,提出基于圖注意力網(wǎng)絡(luò)(GAT)的科研團隊主題融合方法預(yù)測科研團隊的研究主題未來趨勢??蒲袌F隊精準立體畫像生成模塊通過科研團隊簡介、科研團隊合作關(guān)系圖和科研團隊研究主題及預(yù)測詞云構(gòu)建科研團隊精準立體畫像,對科研團隊進行全面、立體地刻畫。

        本文的主要貢獻如下:(1)提出了面向科技大數(shù)據(jù)的科研團隊精準立體畫像生成方法,通過科研團隊識別、科研團隊研究主題預(yù)測、科研團隊精準立體畫像生成三個模塊構(gòu)建科研團隊畫像。(2) 針對科研團隊的科研成果數(shù)據(jù),提出了一種基于圖注意力網(wǎng)絡(luò)(GAT)的主題融合的研究主題預(yù)測方法,提高了科研團隊的主題趨勢預(yù)測準確率。(3) 在科技成果數(shù)據(jù)集上進行了實驗,挖掘出科研團隊,精準地預(yù)測出了科研團隊研究主題趨勢,設(shè)計模板生成了科研團隊精準立體畫像。

        2 相關(guān)工作

        2.1 科研團隊識別

        利用大型科技文獻數(shù)據(jù)構(gòu)建科研合作網(wǎng)絡(luò),識別科研團隊的方法得到了廣泛的研究[16,17]。通過學(xué)術(shù)合作關(guān)系構(gòu)建學(xué)術(shù)合作網(wǎng)絡(luò)[18,19],通過社會網(wǎng)絡(luò)分析法[20]識別科研團隊[21]。通常使用作者合著、文獻引用等信息構(gòu)建整體科研合作網(wǎng)絡(luò)[22],基于靜態(tài)分析法分析科研合作網(wǎng)絡(luò)的統(tǒng)計特征和合作成員的個人屬性[23]。選擇中間中心度作為識別團隊負責(zé)人的指標,通過中間中心度指標排名,挖掘出科研網(wǎng)絡(luò)中的團隊負責(zé)人和合作密切的團隊成員[24]。于永勝等[12]提出了基于迭代中間中心度方法,從而更準確地實現(xiàn)科研團隊的識別與挖掘。

        2.2 主題預(yù)測

        Prabhakaran等[25]使用歷史曲線上的時間分析來預(yù)測特定領(lǐng)域的研究主題的興衰。Li等[26]利用機器學(xué)習(xí)方法對納米材料生物醫(yī)學(xué)領(lǐng)域的研究成果進行挖掘,科學(xué)地預(yù)測其研究領(lǐng)域的發(fā)展趨勢。相關(guān)研究開始關(guān)注計算機科學(xué)領(lǐng)域的主題演化趨勢預(yù)測,Tesfamariam等[27]采用經(jīng)典的時間序列預(yù)測模型ARIMA預(yù)測計算機科學(xué)中國際會議的研究主題趨勢。LSTM被用來捕獲時序特征[28],并被用于科學(xué)研究主題預(yù)測任務(wù)。Liang等[29]使用科技出版物和科技期刊的相關(guān)數(shù)據(jù),應(yīng)用LSTM網(wǎng)絡(luò)預(yù)測候選主題的流行度分數(shù)以確定未來的研究主題。

        2.3 科研團隊畫像構(gòu)建

        對科研團隊進行分析與刻畫有助于改善對科研團隊的管理。隨著用戶畫像技術(shù)[30]的發(fā)展,融合多源異構(gòu)數(shù)據(jù)的科研人員畫像構(gòu)建方法得到了廣泛的研究[31,32],莫君蘭等[8]通過融合多源異構(gòu)數(shù)據(jù)構(gòu)建包含團隊結(jié)構(gòu)抽取、團隊緊密度提取、團隊研究主題提取、團隊影響力的科研團隊畫像。劉行兵等[9]使用AHP層次分析法,構(gòu)建體現(xiàn)科研團隊的協(xié)同創(chuàng)新能力的科研團隊畫像,通過科研團隊績效評價體系對科研團隊的創(chuàng)新能力進行數(shù)字化。然而,現(xiàn)有的科研團隊畫像構(gòu)建方法沒有考慮科研團隊的研究主題未來趨勢的刻畫。

        3 科研團隊精準立體畫像生成方法的提出

        針對科研團隊精準立體畫像構(gòu)建的現(xiàn)實需求,提出了科研團隊精準立體畫像生成方法??蒲袌F隊精準立體畫像生成方法的整體框架如圖1所示。

        科研團隊精準立體畫像生成方法包括三個模塊:科研團隊識別模塊、科研團隊研究主題預(yù)測模塊、科研團隊精準立體畫像生成模塊??蒲袌F隊識別模塊對科技論文的作者列表進行處理,去除沒有作者或作者機構(gòu)不存在的數(shù)據(jù),構(gòu)建科研合著網(wǎng)絡(luò),使用基于社會網(wǎng)絡(luò)分析法識別科研團隊。使用迭代中間中心度方法識別出不同研究領(lǐng)域的科研團隊負責(zé)人,通過2-派系和滾雪球方法識別科研團隊成員的核心成員和非核心成員??蒲袌F隊研究主題預(yù)測模塊采用基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合方法融合某科研團隊受到的其他科研團隊的主題影響,預(yù)測科研團隊主題未來發(fā)展趨勢??蒲袌F隊精準立體畫像生成模塊設(shè)計團隊簡介模板、團隊合作關(guān)系圖模板,對識別出的科研團隊的信息進行統(tǒng)計分析,基于設(shè)計的模板形成團隊簡介;根據(jù)科研團隊的科研成果的作者列表數(shù)據(jù)中作者的共現(xiàn)信息、科研團隊成員的碩博士論文中的作者及指導(dǎo)教師信息,抽取科研團隊負責(zé)人及團隊成員之間的合作信息及師徒關(guān)系,構(gòu)建團隊合作關(guān)系圖;生成科研團隊的研究主題及主題預(yù)測詞云,最終生成科研團隊的精準立體畫像。

        3.1 科研團隊識別

        團隊負責(zé)人是科研團隊的核心和靈魂,科研團隊負責(zé)人識別是科研團隊識別的重要部分。采用于永勝等[12]提出的方法基于迭代的中間中心度排名方法識別科研團隊負責(zé)人,通過2-派系和滾雪球方法識別科研團隊成員,從而實現(xiàn)科研團隊的識別與挖掘。科研團隊識別算法的具體步驟如表1所示。

        科研團隊識別模塊以學(xué)者合著列表為輸入構(gòu)建科研合著網(wǎng)絡(luò),計算科研合著網(wǎng)絡(luò)中所有節(jié)點的中間中心度排名,選取出科研團隊負責(zé)人,使用2-派系方法識別出與團隊負責(zé)人相連的核心科研人員,以科研團隊負責(zé)人和核心科研人員為基點通過滾雪球的方法識別出非核心科研人員。

        3.2 基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法(GATP)

        通過分析領(lǐng)域內(nèi)科研團隊成果數(shù)據(jù)的特性發(fā)現(xiàn),團隊的研究主題趨勢會受到該領(lǐng)域內(nèi)其他科研團隊的研究主題的影響,因此提出了基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法(GATP),GATP算法框架圖如圖2所示。

        圖2 基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測框架圖

        給定某研究領(lǐng)域內(nèi)多個科研團隊的研究主題,為了追蹤領(lǐng)域內(nèi)每個團隊的研究主題,通過部署多個循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM對不同團隊的研究主題序列進行建模,將每個研究團隊的研究主題編碼為多個低維的向量表示,區(qū)分不同科研團隊的研究主題。采用基于圖注意力網(wǎng)絡(luò)的科研團隊主題關(guān)聯(lián)融合方法建模研究領(lǐng)域內(nèi)科研團隊之間的主題關(guān)聯(lián),獲取領(lǐng)域內(nèi)其他科研團隊的研究主題對該科研團隊的主題影響。給定一個科研團隊在第t年及第t年之前的研究主題,基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法GATP,根據(jù)該科研團隊在第t年及第t年之前的研究主題和領(lǐng)域內(nèi)其他科研團隊對該科研團隊的主題影響預(yù)測該科研團隊在t+1年的研究主題。

        3.2.1 基于LSTM的科研團隊主題序列建模

        對于科技大數(shù)據(jù)某領(lǐng)域包含n個團隊的科技論文集P={p1,p2,…,pn},pi代表了一個團隊的科技論文集合,抽取團隊中主題詞集

        {w1,w2,…,wj,…,wv}。應(yīng)用one-hot向量pti∈Rv表示團隊i在第t年的研究主題,

        pti={pt1,pt2,…,ptj,ptv},ptj表示主題詞wj的歸一化詞頻,v是出現(xiàn)在科技論文集P中的詞匯。ptj的計算公式如(1)式所示。

        ptj=tf(wj)∑si=1tf(wj)(1)

        其中tf(wj)是主題詞wj在團隊pi中出現(xiàn)的詞頻,s是團隊pi中所有主題詞的數(shù)目。

        為了追蹤領(lǐng)域內(nèi)每個團隊的研究主題,區(qū)分不同團隊的研究主題表示,部署了多個LSTM對不同團隊的研究主題序列進行建模。以當前時間步長的研究主題為輸入,將研究主題迭代編碼為隱藏狀態(tài),以捕獲不同團隊的研究主題。團隊的主題序列由帶有不同參數(shù)的多個LSTM鏈建模。

        假設(shè)某一研究領(lǐng)域下有四個團隊:團隊i,團隊j,團隊k和團隊l。給定團隊i的研究主題pi={p1i,p2i,…,pti},pti是團隊i在第t年的研究主題,pti∈Rv。為了避免詞匯量增加時的維數(shù)災(zāi)難,部署詞嵌入矩陣,將pti轉(zhuǎn)換成稠密低維的向量。團隊i第t年的研究主題表示為xti。xti的計算公式如(2)式所示。

        xti=pti(2)

        其中是詞嵌入矩陣,∈Rdw×v,xti∈Rdw。

        將xti作為輸入,使用LSTM建模研究團隊i在第t年的研究主題表示hti。hti的計算公式如(3)式所示。

        hti=LSTM(ht-1i,xti)(3)

        3.2.2 基于圖注意力網(wǎng)絡(luò)的主題影響力融合

        對于領(lǐng)域內(nèi)的某一團隊,其研究主題會隨著領(lǐng)域內(nèi)其他團隊主題的影響而發(fā)生變化。除了跟蹤團隊內(nèi)的研究主題外,還需要計算領(lǐng)域內(nèi)其他團隊的研究主題對該團隊主題演變的科學(xué)影響。團隊之間主題的交互影響被建模為圖,通過部署圖注意力網(wǎng)絡(luò)獲得其他團隊對該團隊的主題影響。給定科研團隊在第t年的研究主題表示hti,htj,htk,htl。將它建模為圖G=(V,E)。其中V表示團隊的集合,即hti,htj,htk,htl。E是邊的集合,每條邊表示團隊的研究主題間的交互影響。

        團隊i的主題影響h_GATti聚合了其他團隊的研究主題,團隊i的主題影響計算公式如(4)和(5)式所示。

        eij=aT([Whti]‖[Whtj])(4)

        h_GATti=σ(∑j∈Niexp(Relu(eij))∑k∈Niexp(Relu(eik))·Whtj)(5)

        其中W是線性變換權(quán)重矩陣,a是注意力權(quán)重向量。Ni是與團隊i在同一領(lǐng)域的其他團隊。

        3.2.3 科研團隊的研究主題趨勢預(yù)測

        連接領(lǐng)域內(nèi)科研團隊i的主題表示hti和領(lǐng)域內(nèi)科研團隊i的主題影響h_GATti,將其輸入softmax預(yù)測器,得到科研團隊i在第t+1年預(yù)測主題詞的分布t+1i,計算公式如(6)式所示。

        t+1i=softmax(Wo[hti;h_GATti]+bo)(6)

        使用歸一化多項式邏輯損失作為損失函數(shù),最小化預(yù)測主題詞分布t+1i和目標主題詞分布pt+1i的KL散度。損失函數(shù)和KL散度的計算公式如(7)和(8)式所示。通過最小化一個領(lǐng)域內(nèi)所有科研團隊的研究主題序列的損失來實現(xiàn)科研團隊的主題預(yù)測最優(yōu)化。

        loss=∑s∈{i,j,k,l}∑Tt=1KL(t+1s‖pt+1s)(7)

        KL(t+1s‖pt+1s)=∑jt+1s,jlog

        t+1s,jpt+1s,j(8)

        3.3 科研團隊精準立體畫像生成方法

        科研團隊精準立體畫像包含三部分:科研團隊簡介、團隊合作關(guān)系圖構(gòu)建、科研團隊研究主題預(yù)測。為每個部分設(shè)計了模板,科研團隊簡介模板主要包括科研團隊總?cè)藬?shù)、科研團隊的主要研究領(lǐng)域、團隊負責(zé)人主持項目數(shù)、團隊項目總數(shù)、發(fā)表論文總數(shù)、被引用次數(shù)、團隊發(fā)表的會議論文數(shù)、期刊論文數(shù);團隊合作關(guān)系圖模板包括團隊負責(zé)人與科研團隊之間的合作關(guān)系以及之間的師徒關(guān)系、團隊成員所屬機構(gòu)及學(xué)科;研究團隊主題模板將科研團隊研究主題及主題趨勢以主題詞云的形式展示。

        科研團隊識別模塊識別出科研團隊負責(zé)人及科研團隊成員的基本信息,包含科研團隊人員的姓名、所屬機構(gòu)、研究方向、團隊負責(zé)人及團隊成員的主持基金信息、科研論文成果、論文被引信息。統(tǒng)計分析科研團隊的基本信息生成科研團隊簡介,通過團隊負責(zé)人及團隊成員的碩博論文信息挖掘科研團隊負責(zé)人及成員之間的合作關(guān)系及師徒關(guān)系?;诳蒲袌F隊研究主題預(yù)測出科研團隊的研究主題未來趨勢,通過科研團隊研究主題及主題趨勢生成研究主題及主題趨勢詞云圖。綜合科研團隊簡介、科研團隊合作關(guān)系圖、科研團隊研究主題及主題趨勢,生成科研團隊精準立體畫像。

        4 實驗驗證分析

        4.1 數(shù)據(jù)集

        搜集從2011年到2020年10年間通信領(lǐng)域的科技論文44164篇作為實驗數(shù)據(jù)集。每條數(shù)據(jù)包括科技論文的標題、摘要、所屬項目名稱、作者、作者所在的單位等字段。獲得的數(shù)據(jù)如果存在無效數(shù)據(jù)的問題,如無作者、單作者論文數(shù)據(jù),則將此類數(shù)據(jù)刪除,刪除無效數(shù)據(jù)后,剩余有效的科技論文43242篇??蒲袌F隊識別的前提是對作者數(shù)據(jù)進行消歧,而作者消歧需要與機構(gòu)數(shù)據(jù)結(jié)合,對機構(gòu)數(shù)據(jù)進行清洗,對作者數(shù)據(jù)進行清洗。獲取的數(shù)據(jù)中作者信息包括中文作者及英文作者,對于英文數(shù)據(jù)采取作者名字、機構(gòu)與中文數(shù)據(jù)進行對齊的方式將其轉(zhuǎn)化為統(tǒng)一的中文作者以方便后續(xù)處理。

        4.2 科研團隊識別

        構(gòu)建整體科研合著網(wǎng)絡(luò)。從整體合著網(wǎng)絡(luò)中提取出作者發(fā)文量最小閾值為10、作者合著頻次最小閾值為5的合著網(wǎng)絡(luò)作為初始科研合著網(wǎng)絡(luò),計算所有節(jié)點的中間中心度排名,選取出排名最高的學(xué)者作為科研團隊負責(zé)人。將該學(xué)者從合著網(wǎng)絡(luò)中刪除,繼續(xù)計算中間中心度排名,基于迭代的中間中心度排名方法通過反復(fù)迭代選擇團隊負責(zé)人,通過循環(huán)計算中間中心度值排名,每次只抽取排名最高的節(jié)點作為團隊負責(zé)人,然后從網(wǎng)絡(luò)中剔除該節(jié)點,繼續(xù)進行迭代計算,直到剩下節(jié)點的中間中心度值不大于1,獲得較好的科研團隊負責(zé)人識別結(jié)果。

        以基于迭代的中間中心度方法識別出的科研團隊負責(zé)人作為基點,在初始合著網(wǎng)絡(luò)中選取與團隊負責(zé)人有合著關(guān)系的結(jié)點集合,利用2-派系方法在整體科研合著網(wǎng)絡(luò)中識別出團隊的核心科研人員,在整體合著網(wǎng)絡(luò)中以科研團隊的團隊負責(zé)人、核心成員的各個作者為頂點,使用滾雪球的方式向下滾動一層,獲得該科研團隊的非核心成員。識別出了5個科研團隊并統(tǒng)計了5個科研團隊的詳細信息如表2所示。表2給出了識別出的5個科研團隊中每個團隊的團隊人數(shù)、研究領(lǐng)域、團隊項目數(shù)、發(fā)表論文數(shù)、被引次數(shù)、師徒關(guān)系對數(shù)。

        4.3 科研團隊研究主題預(yù)測的有效性分析

        將基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法GATP與經(jīng)典的時間序列預(yù)測方法ARIMA[33]、基于遞歸神經(jīng)網(wǎng)絡(luò)的研究主題預(yù)測方法LSTM、DARNN[34]、DSTP[35]進行比較。采用時間序列預(yù)測任務(wù)中的評價指標RMSE、precision@n(簡記為p@n,n表示預(yù)測的主題詞的數(shù)目)對主題預(yù)測性能進行評價。表3~表5給出了GATP算法及其對比算法在識別出的5個科研團隊上的RMSE值、平均RMSE值、主題預(yù)測準確率、主題預(yù)測平均準確率。

        表3是提出的基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法GATP和對比的預(yù)測方法在識別出的通信領(lǐng)域的5個科研團隊的科研成果數(shù)據(jù)集上的主題預(yù)測性能RMSE值和平均RMSE值。從表中可以看出,經(jīng)典的主題預(yù)測算法ARIMA的主題預(yù)測性能RMSE值和平均RMSE值是最大的,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測模型LSTM、DARNN和DSTP的主題預(yù)測性能RMSE值和平均RMSE值低于ARIMA。GATP在所有科研團隊上的RMSE值和平均RMSE值都是最小的。這說明提出的方法通過模型的訓(xùn)練將預(yù)測的主題詞分布無限與科研團隊的目標主題詞分布逼近,實現(xiàn)了主題預(yù)測性能RMSE值的最小化。

        表4是提出的基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法GATP和對比的主題預(yù)測方法在科研團隊1、2、3上的主題預(yù)測準確率。從表4可以看出,提出的主題預(yù)測算法GATP的主題預(yù)測準確率超過了經(jīng)典的預(yù)測模型ARIMA以及基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測模型。基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測模型LSTM、DARNN、DSTP方法在科研團隊1上的主題預(yù)測準確率高于ARIMA的主題預(yù)測準確率,而在科研團隊2、3上的主題預(yù)測準確率比ARIMA的預(yù)測準確率低。說明基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測模型LSTM、DARNN、DSTP在科研團隊1、2、3上的主題預(yù)測性能不穩(wěn)定,不適合科研團隊1、2、3的主題預(yù)測。GATP算法在科研團隊1、2、3上都達到了最好的預(yù)測性能。

        表5是GATP算法和比較的主題預(yù)測方法在科研團隊4、5的主題預(yù)測準確率和在5個團隊上的平均預(yù)測準確率。表5的實驗結(jié)果顯示了與表4類似的趨勢。基于神經(jīng)網(wǎng)絡(luò)的主題預(yù)測方法LSTM、DARNN、DSTP在科研團隊4、5上的預(yù)測準確率不如ARMIA。通過表4與表5的實驗結(jié)果得出結(jié)論,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測方法LSTM、DARNN、DSTP在各個科研團隊的主題預(yù)測準確率是不穩(wěn)定的。GATP實現(xiàn)了最好的主題預(yù)測性能,而且穩(wěn)定性較高,說明提出的GATP主題預(yù)測方法,通過部署圖注意力網(wǎng)絡(luò)融合相同研究領(lǐng)域內(nèi)其他團隊對某團隊的主題影響,實現(xiàn)了團隊主題的主題趨勢預(yù)測,表現(xiàn)出了最佳的主題預(yù)測性能,驗證了所提方法的有效性。

        5 科研團隊精準立體畫像生成

        選擇識別的科研團隊1,構(gòu)建該團隊的精準立體畫像。獲取該團隊的團隊負責(zé)人及團隊成員的信息,基于該科研團隊的統(tǒng)計信息,形成團隊簡介。生成科研團隊1的團隊簡介為:團隊共5人,主要研究領(lǐng)域為通信與信息系統(tǒng)。該團隊負責(zé)人主持項目5項,團隊項目數(shù)12項,發(fā)表論文420篇,論文被引用576次。團隊共發(fā)表會議論文96篇,期刊論文302篇?;谠摽蒲袌F隊的統(tǒng)計信息,獲取團隊成員間的指導(dǎo)關(guān)系,構(gòu)建科研團隊合作關(guān)系圖?;诳蒲袌F隊主題預(yù)測模塊從該科研團隊的科研成果中抽取研究主題,形成研究主題詞云,采用提出的GATP算法預(yù)測科研團隊的主題趨勢,形成主題趨勢詞云??蒲袌F隊合作關(guān)系圖和科研團隊研究主題詞云圖如圖3和圖4所示。

        科研團隊合作關(guān)系圖展示了團隊負責(zé)人與科研團隊成員之間的合作關(guān)系以及之間的師徒關(guān)系,并展示了科研團隊負責(zé)人及科研團隊成員所屬的機構(gòu)及學(xué)科??蒲袌F隊研究主題詞云圖展示該科研團隊的研究主題及未來研究主題趨勢。

        6 結(jié)論與啟示

        本文針對科研團隊精準立體畫像構(gòu)建的現(xiàn)實需求以及現(xiàn)有的科研團隊畫像的研究現(xiàn)狀,圍繞科研團隊識別、科研團隊研究主題預(yù)測、科研團隊精準立體畫像生成,提出了面向科技大數(shù)據(jù)的科研團隊精準立體畫像生成方法。在科研團隊的研究主題趨勢預(yù)測方面,科研團隊的研究主題趨勢受該團隊的研究主題的影響以及相同領(lǐng)域其他科研團隊的研究主題的影響,因此在預(yù)測科研團隊的研究主題時,提出了基于圖注意力網(wǎng)絡(luò)的科研團隊主題融合的主題趨勢預(yù)測算法,通過融合其他團隊主題的關(guān)聯(lián)信息,提高了科研團隊研究主題預(yù)測的準確性。在科研團隊畫像構(gòu)建方面,抽取了科研團隊的研究主題,將科研團隊的研究主題及主題趨勢通過詞云的方式展示出來,進而為科研管理部門提供項目決策支持。

        參 考 文 獻:

        [1]Yao X, Zhang C, Qu Z. Global village or virtual balkans? Evolution and performance of scientific collaboration in the information age[J]. Journal of the Association for Information Science and Technology, 2020, 71(4): 395-408.

        [2]Li W, Jia Y, Du J. Variance-constrained state estimation for nonlinearly coupled complex networks[J]. IEEE Transactions on Cybernetics, 2017, 48(2): 818-824.

        [3]Meng D, Jia Y, Du J, et al.. High-precision formation control of nonlinear multi-agent systems with switching topologies: a learning approach[J]. International Journal of Robust and Nonlinear Control, 2015, 25(13): 1993-2018.

        [4]Lariviere V, Desrochers N, Macaluso B, et al.. Contributorship and division of labor in knowledge production[J]. Social Studies of Science, 2016, 46(3), 417-435.

        [5]王偉.基于學(xué)術(shù)大數(shù)據(jù)的科學(xué)家合作行為分析與挖掘[D].大連:大連理工大學(xué),2010.

        [6]Wei X, Du J, Liang M, et al.. Boosting deep attribute learning via support vector regression for fast moving crowd counting[J]. Pattern Recognition Letters, 2019, 119: 12-23.

        [7]Meng D, Jia Y, Du J, et al.. Stability analysis of continuous-time iterative learning control systems with multiple state delays[J]. Acta Automatica Sinica, 2010, 36(5): 696-703.

        [8]莫君蘭,竇永香,開慶.基于多源異構(gòu)數(shù)據(jù)的科研團隊畫像的構(gòu)建[J].情報理論與實踐,2020,43(9):100-106.

        [9]劉行兵,翟亞超,柴斌,等.基于 AHP 模型的協(xié)同創(chuàng)新科研團隊畫像的構(gòu)建[J].科技管理研究,2021,(19):136-140.

        [10]Kou F, Du J, He Y, et al.. Social network search based on semantic analysis and learning[J]. CAAI Transactions on Intelligence Technology, 2016, 1(4): 293-302.

        [11]Kou F, Du J, Yang C, et al.. Hashtag recommendation based on multi-features of microblogs[J]. Journal of Computer Science and Technology, 2018, 33(4): 711-726.

        [12]于永勝,董誠,韓紅旗,等.基于社會網(wǎng)絡(luò)分析的科研團隊識別方法研究——基于迭代的中間中心度排名方法識別科研團隊領(lǐng)導(dǎo)人[J].情報理論與實踐,2018,41(7):105-110.

        [13]Zhao H, Liu Q, Zhu H, et al.. A sequential approach to market state modeling and analysis in online p2p lending[J]. IEEE Transactions on Systems, Man, and Cybernetics-Systems, 2017, 48(1): 21-33.

        [14]Sun B, Du J, Gao T. Study on the improvement of k-nearest-neighbor algorithm[A]. The 2009 International Conference on Artificial Intelligence and Computational Intelligence[C]. IEEE, Shang Hai, 2009. 390-393.

        [15]Hu W, Gao J, Li B, et al.. Anomaly detection using local kernel density estimation and context-based regression[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 32(2): 218-233.

        [16]Liang Y, Jia Y, Du J, et al.. Vector field guidance for three-dimensional curved path following with fixed-wing UAVs[A]. The 2015 American Control Conference[C]. Institute of Electrical and Electronics Engineers Inc, 2015. 1187-1192.

        [17]Meng D, Jia Y, Du J. Multi-agent iterative learning control with communication topologies dynamically changing in two directions[J]. IET Control Theory & Applications, 2013, 7(2): 261-270.

        [18]Cao J, Mao D, Cai Q, et al.. A review of object representation based on local features[J]. Journal of Zhejiang University Science, 2013, 14(7): 495-504.

        [19]Meng D, Jia Y, Du J. Stability of varying two-dimensional roesser systems and its application to iterative learning control convergence analysis[J]. IET Control Theory & Applications, 2015, 9(8): 1221-1228.

        [20]Kou F, Du J, Lin Z, et al.. A semantic modeling method for social network short text based on spatial and temporal characteristics[J]. Journal of Computational Science, 2018, 28: 281-293.

        [21]Chen W, Li Y, Yu J. Construction and evaluation of the safety risk factors of the urban utility tunnel based on the social network analysis[J]. Journal of Safety and Environment, 2020, 20(5): 1652-1660.

        [22]王曰芬,楊雪,余厚強,等.人工智能科研團隊的合作模式及其對比研究[J].圖書情報工作,2020,64(20):14-21.

        [23]Xue Z, Du J, Du D, et al.. Deep low-rank subspace ensemble for multi-view clustering[J]. Information Sciences, 2019, 482: 210-227.

        [24]李綱,李春雅,李翔.基于社會網(wǎng)絡(luò)分析的科研團隊發(fā)現(xiàn)研究[J].圖書情報工作,2014,58(7):63-70.

        [25]Prabhakaran V, William L, McFarland D. Predicting the rise and fall of scientific topics from trends in their rhetorical framing[A]. Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics[C]. Association for Computational Linguistics, Berlin, 2016. 1170-1180.

        [26]Li Y, Pu Q, Li S, et al.. Machine learning methods for research highlight prediction in biomedical effects of nanomaterial application[J]. Pattern Recognition Letters, 2019, 117: 111-118.

        [27]Tesfamariam M, Yemisrach G, Sergey V. Towards predicting trend of scientific research topics using topic modeling[A]. Proceedings of the 7th International Young Scientist Conference on Computational Science[C]. Elsevier B.V., 2018. 304-310.

        [28]Lu Z, Tan H, Li W. An evolutionary context-aware sequential model for topic evolution of text stream[J]. Information Sciences, 2019, 473: 166-177.

        [29]Liang Z, Maoa J, Luc K, et al.. Combining deep neural network and bibliometric indicator for emerging research topic prediction[J]. Information Processing & Management, 2021, 58(5): 1-18.

        [30]張壯,馮小年,錢鐵云.基于多模態(tài)融合技術(shù)的用戶畫像方法[J].北京大學(xué)學(xué)報,2020,56(1):105-111.

        [31]袁莎,唐杰,顧曉韜.開放互聯(lián)網(wǎng)中的學(xué)者畫像技術(shù)綜述[J].計算機研究與發(fā)展,2018,55(9):1903-1919.

        [32]顧曉韜.開放互聯(lián)網(wǎng)中的研究者畫像[D].北京:清華大學(xué),2017.

        [33]Hadi A, Amin K, Orkun K. ARIMA-based decoupled time series forecasting of electric vehicle charging demand for stochastic power system operation[J]. Electric Power Systems Research, 2016, 140: 378-390.

        [34]Qin Y, Song D, Chen H, et al.. A dual-stage attention-based recurrent neural network for time series prediction[A]. Proceedings of the 26th International Joint Conference on Artificial Intelligence[C]. International Joint Conferences on Artificial Intelligence Press, Melbourne, VIC, 2017. 2627-2633.

        [35]Qin Y, Chen D, Xiang S, et al.. Gated dual attention unit neural networks for remaining useful life prediction of rolling bearings[J]. IEEE Transactions on Industrial Informatics, 2020, 17(9): 6438-6447.

        猜你喜歡
        科研團隊畫像
        威猛的畫像
        “00后”畫像
        畫像
        畫像
        畫像
        淺談高職院??蒲袌F隊文化建設(shè)
        高??蒲袌F隊與研究生創(chuàng)新人才培養(yǎng)研究
        成才之路(2016年25期)2016-10-08 09:47:56
        國內(nèi)計算機領(lǐng)域科研團隊結(jié)構(gòu)分析
        高??蒲袌F隊知識共享的障礙與實現(xiàn)路徑探究
        基于組織學(xué)習(xí)的高??蒲袌F隊創(chuàng)新能力的提升路徑研究
        高教探索(2015年12期)2016-01-11 04:18:05
        久久开心婷婷综合中文| 亚洲福利视频一区| 97久久综合区小说区图片专区| 91亚洲精品久久久中文字幕| 精品厕所偷拍一区二区视频| 无码尹人久久相蕉无码| 爽妇网国产精品| 九九久久精品大片| 亚洲av高清一区三区三区| 日本道色综合久久影院| 亚洲精品久久久久中文字幕一福利| 亚洲另类激情综合偷自拍图| 国产熟女自拍视频网站| 黄色潮片三级三级三级免费| 97一期涩涩97片久久久久久久| 欧美第一黄网免费网站| 亚洲中文字幕久爱亚洲伊人 | 久久99久久久无码国产精品色戒| 国产成人久久综合第一区| 亚洲日本高清一区二区| 97色偷偷色噜噜狠狠爱网站 | 乱人伦人妻中文字幕无码| 日韩亚洲在线一区二区| 国产精品国产三级国产aⅴ下载| 性一交一乱一透一a级| 正在播放淫亚洲| 久久精品国产黄片一区| 五月四房播播| 少妇高潮惨叫喷水在线观看| yy111111少妇影院| 东京热加勒比久久精品| 亚洲熟妇久久国产精品| 综合精品欧美日韩国产在线| 国产高清不卡在线视频| 99re6在线视频精品免费| 99精产国品一二三产品香蕉| 北岛玲中文字幕人妻系列| 亚洲午夜经典一区二区日韩| 人妻少妇无码精品视频区| 国产精品亚洲欧美天海翼| 国产网友自拍视频在线观看|