文/李松 宋時(shí)佳
科技創(chuàng)新是科技進(jìn)步的基礎(chǔ)和動(dòng)力,近幾年來,科技部提出科技服務(wù)業(yè)是向社會(huì)提供智力服務(wù)和支撐的產(chǎn)業(yè),并在“十二五”中指出現(xiàn)代科技服務(wù)是基于數(shù)據(jù)、運(yùn)用先進(jìn)科學(xué)及技術(shù)、分析方法的產(chǎn)業(yè)。在科技服務(wù)業(yè)存在的重要共性服務(wù)的提取及有效利用是當(dāng)前研究的關(guān)鍵。然而,“碎片化”的服務(wù)資源具有多樣性和復(fù)雜性的特點(diǎn),當(dāng)前大數(shù)據(jù)時(shí)代為解決這類問題提供了可能。為實(shí)現(xiàn)創(chuàng)新、創(chuàng)業(yè)項(xiàng)目的順利、高效及合理評(píng)審,針對(duì)傳統(tǒng)的創(chuàng)新、創(chuàng)業(yè)項(xiàng)目中專家評(píng)審匹配度低、針對(duì)性差等問題,本文提出了基于區(qū)域協(xié)同過濾的專家評(píng)審智能推薦算法。通過實(shí)踐證明,基于區(qū)域協(xié)同過濾的專家評(píng)審智能推薦方法大大提高了專家評(píng)審的匹配度,加速了專家評(píng)審的效率和速度。
技術(shù)創(chuàng)新和產(chǎn)業(yè)變革成為科技服務(wù)業(yè)持續(xù)穩(wěn)定發(fā)展的核心動(dòng)力?;诖髷?shù)據(jù)的科技服務(wù)業(yè)通過虛擬化資源和數(shù)據(jù)處理,提供基于模型的資源可持續(xù)利用,同時(shí)創(chuàng)新、創(chuàng)業(yè)項(xiàng)目的專家評(píng)審是一個(gè)關(guān)鍵環(huán)節(jié),提高項(xiàng)目的匹配度能促進(jìn)科技技術(shù)的快速轉(zhuǎn)移,提高科技資源的利用效率和傳播,加速科技成果的轉(zhuǎn)化,具有很大的現(xiàn)實(shí)和經(jīng)濟(jì)意義。目前,我國產(chǎn)業(yè)結(jié)構(gòu)調(diào)整已經(jīng)進(jìn)入改革關(guān)鍵期,“創(chuàng)新驅(qū)動(dòng)”上升為國家戰(zhàn)略??萍挤?wù)業(yè)作為實(shí)現(xiàn)轉(zhuǎn)型升級(jí)的重要支撐,已成為中國經(jīng)濟(jì)增長的新動(dòng)力。通過對(duì)服務(wù)資源的虛擬化并有效利用,可以提高資源傳播速度,并通過數(shù)據(jù)挖掘提煉出數(shù)據(jù)背后的秘密,提高科技成果到生產(chǎn)力的轉(zhuǎn)變效率。
表1:專家評(píng)分矩陣
表2:匹配相關(guān)性和滿意度對(duì)比
圖1:基于大數(shù)據(jù)分析的服務(wù)資源推薦
目前科技服務(wù)的創(chuàng)新資源主要被一些龍頭企業(yè)、高校及科研機(jī)構(gòu)占有,服務(wù)資源相對(duì)“碎片化”,無法形成一個(gè)體系而成為信息孤島。資源的整合和有效利用并實(shí)現(xiàn)共享成為企業(yè)發(fā)展的前提。因此,通過當(dāng)下的科學(xué)技術(shù)及大數(shù)據(jù)分析實(shí)現(xiàn)資源的共享成為研究的熱點(diǎn):王宏起等人以黑龍江省科技創(chuàng)新創(chuàng)業(yè)共享服務(wù)平臺(tái)為實(shí)證研究對(duì)象,給出平臺(tái)未來發(fā)展對(duì)策建議;汪艷霞等人提出了“孵化-加速”三位一體耦合對(duì)接的科技服務(wù)資源集成路徑;梁曉星等人對(duì)制造任務(wù)的分解和制造資源的匹配方法進(jìn)行研究。
如圖1所示,根據(jù)科技服務(wù)基于模式的不同,可以將服務(wù)資源的智能推薦方法分為基于內(nèi)容、協(xié)同過濾、關(guān)聯(lián)規(guī)則、基于知識(shí)和基于需求五類方法。
圖2:專家評(píng)審流程
CF方法主要分為基于領(lǐng)域和基于模型的推薦兩種。基于模型的方法主要包括基于矩陣分解和潛在語義、基于貝葉斯和基于SVM三種方法?;诰仃嚪纸獾姆椒ㄈ缦拢涸撍惴ㄊ紫葘⑾∈杈仃囉镁堤顫M,然后利用矩陣分解將其分解為兩個(gè)矩陣相乘。
基于領(lǐng)域推薦的方法是利用的
其中,I(ij)是代表用戶i和用戶j共同評(píng)價(jià)過的物品,S(i,x)代表用戶i對(duì)物品x的評(píng)分。S’ 代表用戶i所有評(píng)分的平均分。本文根據(jù)創(chuàng)新、創(chuàng)業(yè)項(xiàng)目中的流程和專家評(píng)審特點(diǎn),提出利用領(lǐng)域協(xié)同過濾的方法實(shí)現(xiàn)資源推薦。
協(xié)同過濾算法通過對(duì)專家歷史行為數(shù)據(jù)進(jìn)行分析,挖掘出每個(gè)專家的研究領(lǐng)域,然后對(duì)專家群組進(jìn)行劃分并推薦相關(guān)領(lǐng)域的項(xiàng)目進(jìn)行評(píng)審。專家評(píng)審?fù)扑]的流程如圖2。
基于用戶領(lǐng)域的協(xié)同過濾算法步驟為:
(1)數(shù)據(jù)屬性表示:每個(gè)專家對(duì)項(xiàng)目領(lǐng)域的評(píng)價(jià)如表的矩陣形式,評(píng)價(jià)值越高說明匹配度越高。如表1所示。
(2)相似領(lǐng)域查找:基于公式3.1中的數(shù)據(jù),用公式(2)計(jì)算出相似性。設(shè)定閾值t,依據(jù)各個(gè)用戶之間相似度大小排序。與目標(biāo)用戶類似的前t個(gè)用戶的類似鄰居集,這是該推薦方法的核心。
(3)智能推薦:
通過利用本文提出的基于領(lǐng)域的協(xié)同過濾推薦方法,對(duì)比來自八個(gè)領(lǐng)域的160名專家評(píng)審項(xiàng)目的所用時(shí)間及匹配滿意度,可以得出,通過使用基于本文的評(píng)審項(xiàng)目推薦方法,專家評(píng)審項(xiàng)目匹配度及評(píng)審效率明顯提高。調(diào)查如表2所示。
本文通過基于協(xié)同過濾的專家評(píng)審?fù)扑]方法,提高了評(píng)審項(xiàng)目的匹配度和推薦結(jié)果滿意度,加速了科技服務(wù)資源利用及生產(chǎn)力的轉(zhuǎn)化速度。未來將進(jìn)一步研究基于深度學(xué)習(xí)的有效資源利用方法。