亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多屬性推薦算法在企業(yè)研發(fā)服務(wù)系統(tǒng)中的應(yīng)用

        2023-01-31 11:23:08田俊鵬李曉戈馬鮮艷
        關(guān)鍵詞:權(quán)值向量矩陣

        田俊鵬,李曉戈,2,馬鮮艷

        1(西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,西安 710000) 2(西安郵電大學(xué) 陜西省網(wǎng)絡(luò)數(shù)據(jù)分析與智能處理重點(diǎn)實(shí)驗(yàn)室,西安 710000)

        1 引 言

        現(xiàn)如今各行各業(yè)對(duì)于科技研發(fā)的需求日益上升,科技信息化開(kāi)始進(jìn)入大規(guī)模應(yīng)用階段,但企業(yè)卻很難尋找到專業(yè)的研發(fā)團(tuán)隊(duì)去滿足相應(yīng)的研發(fā)需求.相反,高校重點(diǎn)實(shí)驗(yàn)室作為國(guó)內(nèi)科研領(lǐng)域的重要組成部分,前沿科研應(yīng)用于行業(yè)相對(duì)遲緩.因此,加大產(chǎn)學(xué)研密切合作,既是檢驗(yàn)高校技術(shù)成果的有效途經(jīng),也是解決企業(yè)科技研發(fā)需求的有效方案.

        從實(shí)踐中發(fā)現(xiàn),部分在線技術(shù)轉(zhuǎn)移平臺(tái)雖然登記了大量專利信息、技術(shù)成果以及研發(fā)需求信息,但并未有一套成熟的系統(tǒng)針對(duì)需求給出與其匹配的技術(shù)供給,導(dǎo)致技術(shù)轉(zhuǎn)移成交量較少.以“陜西省中小企業(yè)服務(wù)平臺(tái)”為例,2020-2021年成交195例,僅占平臺(tái)全部需求的28%.關(guān)于在線平臺(tái)的科技研發(fā)推薦的難點(diǎn)關(guān)鍵在于:1)技術(shù)供給文本通常包含大量信息,相似度計(jì)算決定供需匹配的準(zhǔn)確性;2)單一屬性無(wú)法全面表征技術(shù)供給方的科研領(lǐng)域及能力,技術(shù)供給方通常會(huì)從多個(gè)方面介紹自己的科研領(lǐng)域,例如:論文、專利、項(xiàng)目、成果、儀器等.各種指標(biāo)屬性對(duì)于供需方成交的影響力不同,因此需要對(duì)各屬性數(shù)據(jù)計(jì)算結(jié)果賦予合適的權(quán)值,才能使供需匹配結(jié)果更加合理.因此,本文將基于文本語(yǔ)義匹配的方法[1],針對(duì)“陜西省中小企業(yè)服務(wù)平臺(tái)”的技術(shù)需求文本,以及平臺(tái)上公布的陜西省各高校重點(diǎn)實(shí)驗(yàn)室科研成果信息,探索技術(shù)需求匹配中的多維關(guān)鍵特征,為科技研發(fā)轉(zhuǎn)移提供可行方案.

        2 相關(guān)工作

        近年來(lái)在線技術(shù)轉(zhuǎn)移平臺(tái)發(fā)展迅速,為企業(yè)科技研發(fā)服務(wù)提供了基礎(chǔ)平臺(tái).但存在數(shù)據(jù)不對(duì)稱、技術(shù)供應(yīng)方成果多導(dǎo)致的人工檢索難等問(wèn)題.目前,線上供需推薦研究成果較少.2017年清華大學(xué)楊德林教授利用TF-IDF的方法計(jì)算余弦相似度[2],從網(wǎng)絡(luò)平臺(tái)的特點(diǎn)出發(fā),運(yùn)用文本表示及相似度計(jì)算模型,計(jì)算并評(píng)價(jià)了技術(shù)供需匹配效率.Mikolov等[3]開(kāi)發(fā)的Word2vec能夠利用大規(guī)模未經(jīng)標(biāo)注的語(yǔ)料高效地生成詞的向量表示,且利用依存關(guān)系和上下文關(guān)系來(lái)訓(xùn)練詞向量,可以包含更多的語(yǔ)義信息.2019年何喜軍[4]等人提出計(jì)算供需文本詞頻特征、相關(guān)性特征和語(yǔ)義特征的匹配模型,通過(guò)采集在線技術(shù)轉(zhuǎn)移平臺(tái)數(shù)據(jù),使用熵值法將多特征計(jì)算結(jié)果進(jìn)行融合.目前國(guó)內(nèi)外在語(yǔ)義層面上計(jì)算句子相似度的先進(jìn)研究方法大多是基于詞向量和深度模型的[5],這類方法在表征上下文語(yǔ)義信息方面還有許多不足之處.基于句向量的表示方法可以更好的表征句子的語(yǔ)義特征,表征更加豐富的上下文信息,可以通過(guò)均值模型或加權(quán)模型將詞向量轉(zhuǎn)化為句向量,也可以通過(guò)字向量拼接得到句向量的表示.2018年谷歌提出的Bert預(yù)訓(xùn)練模型通過(guò)取高層的隱向量求得對(duì)應(yīng)的句向量[6],可以更好的捕捉上下文語(yǔ)義關(guān)系.TextCNN[7]用于文本等序列化數(shù)據(jù)的特征提取有不錯(cuò)的效果,但在文本特征提取任務(wù)中滑動(dòng)窗口的大小較難確定.傳統(tǒng)的RNN也可用于序列化特征提取,但對(duì)于局部特征的捕捉能力有限.TextRCNN[8]網(wǎng)絡(luò)結(jié)合雙向RNN與TextCNN的特點(diǎn),對(duì)于解決“長(zhǎng)距離依賴”和捕捉局部特征問(wèn)題有明顯的改善.本文基于句向量的嵌入表示計(jì)算文本的相似度[9],以TextRCNN作為特征提取器,將不同屬性的相似性評(píng)分結(jié)合熵值法動(dòng)態(tài)構(gòu)建權(quán)重矩陣.最終實(shí)現(xiàn)融合多屬性的推薦方式,嘗試探索科研推薦的有效方案.

        3 多屬性融合企業(yè)研發(fā)推薦模型設(shè)計(jì)

        本文基于 “陜西省中小企業(yè)服務(wù)平臺(tái)”數(shù)據(jù)進(jìn)行企業(yè)研發(fā)供需推薦,其中包括各高校重點(diǎn)實(shí)驗(yàn)室數(shù)據(jù)172組,每組數(shù)據(jù)包含專利、論文、成果、項(xiàng)目以及專著等多個(gè)屬性.每個(gè)屬性包含若干條概要信息描述該屬性信息.數(shù)據(jù)結(jié)構(gòu)示例如圖1所示.

        圖1 多屬性數(shù)據(jù)結(jié)構(gòu)示例Fig.1 Example of multi-attribute data structure

        針對(duì)該供需數(shù)據(jù)特征,圖2展示了該推薦模型的系統(tǒng)流程.使用Bert預(yù)訓(xùn)練模型[10]作為供需文本的嵌入層,用于表征文本的上下文信息.結(jié)合TextRCNN模型用于學(xué)習(xí)文本相似性特征,輸出層使用Softmax函數(shù)作為相似性評(píng)分[11],對(duì)各屬性評(píng)分計(jì)算結(jié)果結(jié)合熵值法賦予權(quán)值,計(jì)算出每個(gè)實(shí)驗(yàn)室的推薦評(píng)分并排序.

        圖2 系統(tǒng)流程圖Fig.2 System flow chart

        3.1 供需文本嵌入表示

        句子表示階段采用基于Bert預(yù)訓(xùn)練模型表示上下文特征,可以獲得多層輸出,每一層輸出包括輸入的每個(gè)字對(duì)應(yīng)的隱向量,通過(guò)取高層的隱向量求得對(duì)應(yīng)的句向量,Bert使用了Transformer[12]作為算法的主要框架,如圖3所示.

        圖3 Bert模型結(jié)構(gòu)圖Fig.3 Bert model structure diagram

        由于Bert模型在設(shè)計(jì)的時(shí)候使用了完全基于注意力機(jī)制的雙向Transformer編碼結(jié)構(gòu).能夠計(jì)算出每個(gè)詞對(duì)句子中所有詞的關(guān)系,進(jìn)而能夠反映出詞與詞之間的相互關(guān)系以及重要程度.因此能夠蘊(yùn)含更多上下文信息,從而可以更好地服務(wù)于下游任務(wù).對(duì)于Bert的輸入表示是將Token Embeddings、Segment Embeddings以及Position Embeddings這3個(gè)向量進(jìn)行拼接[13],如圖4所示.

        圖4 Bert輸入表示Fig.4 Bert input representation

        3.2 神經(jīng)網(wǎng)絡(luò)特征提取

        通過(guò)嵌入層得到文本的向量表示后,該向量作為TextRCNN層的輸入,用以提取文本的相似性特征.TextRCNN結(jié)合了卷積網(wǎng)絡(luò)與循環(huán)網(wǎng)絡(luò)的優(yōu)點(diǎn),既可以獲取局部特征也可以獲取上下文特征.TextRCNN將經(jīng)過(guò)嵌入層得到的向量使用循環(huán)網(wǎng)絡(luò)RNN進(jìn)行上下文特征提取.LSTM[14]網(wǎng)絡(luò)可以學(xué)習(xí)長(zhǎng)期依賴信息,由記憶細(xì)胞、輸入門、遺忘門和輸出門組成,其中記憶細(xì)胞用來(lái)存儲(chǔ)和更新歷史信息,3個(gè)門結(jié)構(gòu)通過(guò)Sigmoid函數(shù)來(lái)決定信息的保留程度.記憶單元的結(jié)構(gòu)如圖5所示.

        圖5 LSTM網(wǎng)絡(luò)記憶單元結(jié)構(gòu)Fig.5 LSTM network memory cell structure

        由于LSTM網(wǎng)絡(luò)對(duì)于“長(zhǎng)距離依賴”具有更好的處理能力,本文使用LSTM網(wǎng)絡(luò)代替RNN網(wǎng)絡(luò)用于特征提取.首先使用LSTM處理輸入的向量,然后在每個(gè)時(shí)間步,把LSTM的輸出與對(duì)應(yīng)的句向量拼接,作為當(dāng)前時(shí)間步的“語(yǔ)義向量”,可以更好的表示文本的上下文特征.之后使用池化層進(jìn)行特征選擇,選取 K個(gè)重要的語(yǔ)義向量作為輸出的特征,把文本所有的語(yǔ)義向量取縱向最大池化操作得到特征表示輸出,Text-RCNN網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示.

        圖6 TextRCNN網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 TextRCNN network structure

        3.3 多屬性指標(biāo)評(píng)價(jià)體系構(gòu)建

        各重點(diǎn)實(shí)驗(yàn)室信息包括論文、專利、項(xiàng)目、專著以及成果等多屬性指標(biāo),各屬性指標(biāo)對(duì)于需求的重要性程度不同,需強(qiáng)化數(shù)據(jù)中的重要屬性,削弱次要屬性,引入多特征權(quán)值矩陣是一種可行的方法.本文采用熵值法確定多屬性權(quán)值矩陣.

        使用熵值法計(jì)算首先要進(jìn)行非負(fù)處理,由于相似評(píng)分均為正數(shù),故文本采用極差標(biāo)準(zhǔn)法對(duì)各項(xiàng)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理[15].標(biāo)準(zhǔn)化計(jì)算公式如公式(1)所示.

        (1)

        Bij為原始數(shù)據(jù),其中i=1,2,3,…,m;j=1,2,3,…,n;i和j分別表示第i個(gè)科技研發(fā)團(tuán)隊(duì)及該科技研發(fā)團(tuán)隊(duì)第j個(gè)科研成果屬性;(Bj)max和(Bj)min分別代表第j個(gè)成果屬性相似性得分的最大值和最小值.由于指標(biāo)中涉及百分比變量,為避免權(quán)重為0的情況,統(tǒng)一將歸一化后數(shù)值為0的指標(biāo)按0.01計(jì)算.

        首先,計(jì)算第i個(gè)實(shí)驗(yàn)室下第j個(gè)推薦指標(biāo)所占的比重Pij,計(jì)算公式如公式(2)所示.

        (2)

        計(jì)算第j個(gè)指標(biāo)的熵值ej,計(jì)算公式如公式(3)所示.

        (3)

        其中,ej為第j項(xiàng)指標(biāo)的熵值,n為評(píng)價(jià)指標(biāo)的數(shù)量,ln為自然對(duì)數(shù).計(jì)算第j個(gè)指標(biāo)的熵值Sj,計(jì)算公式如公式(4)所示.

        (4)

        設(shè)候選推薦實(shí)驗(yàn)室集合為Q={q1,q2,q3,…,qj},j為該數(shù)據(jù)集中科研團(tuán)隊(duì)的總數(shù),qi為第i個(gè)實(shí)驗(yàn)室.qi={p1,p2,…,qn}為該科研團(tuán)隊(duì)科研成果屬性集合.pm={c1,c2,c3,…,ck}表示第i個(gè)科研團(tuán)隊(duì)屬性m下的所有成果集合.定義相似度評(píng)分函數(shù)score來(lái)衡量候選實(shí)驗(yàn)室Qi下的每一項(xiàng)科研成果與需求r的相關(guān)程度,計(jì)算公式如公式(5)所示.最后根據(jù)評(píng)分結(jié)果進(jìn)行排序,給出推薦的科技研發(fā)團(tuán)隊(duì).

        (5)

        4 模型評(píng)價(jià)數(shù)據(jù)集及評(píng)價(jià)方法

        4.1 模型評(píng)價(jià)數(shù)據(jù)集準(zhǔn)備

        為驗(yàn)證Bert-TextRCNN網(wǎng)絡(luò)在短文本相似性匹配任務(wù)上的有效性驗(yàn)證,本文使用兩種數(shù)據(jù)集進(jìn)行驗(yàn)證,分別是ATEC螞蟻花唄數(shù)據(jù)集和LCQMC相似度匹配數(shù)據(jù)集.其中ATEC螞蟻花唄數(shù)據(jù)集由阿里巴巴螞蟻金服提供,采集于金融行業(yè),來(lái)自客服與顧客的直接對(duì)話,基本都是短句子;LCQMC相似度匹配數(shù)據(jù)集是哈爾濱工業(yè)大學(xué)為解決在中文領(lǐng)域大規(guī)模問(wèn)題匹配數(shù)據(jù)集的缺失,人工標(biāo)注的相似度任務(wù)數(shù)據(jù)集.兩種數(shù)據(jù)集的樣本構(gòu)造如表1及表2所示.由于這兩個(gè)數(shù)據(jù)集為非平衡數(shù)據(jù)集[16],故對(duì)數(shù)據(jù)集進(jìn)行欠采樣處理,既可以平衡模型對(duì)正負(fù)樣例的學(xué)習(xí)能力,還可以考察模型在小數(shù)據(jù)集上的表現(xiàn).數(shù)據(jù)集處理后結(jié)果如表3所示.

        表1 ATEC數(shù)據(jù)集樣例Table 1 Sample ATEC data set

        表2 LCQMC數(shù)據(jù)集樣例Table 2 Sample LCQMC data set

        表3 數(shù)據(jù)集欠采樣處理結(jié)果Table 3 Data set under-sampling processing result

        4.2 評(píng)價(jià)方法

        選擇ROC-AUC作為評(píng)價(jià)標(biāo)準(zhǔn),指標(biāo)越接近1,代表模型性能越好.根據(jù)ROC的橫縱坐標(biāo),可以構(gòu)建混淆矩陣,利用混淆矩陣可計(jì)算ROC曲線的兩個(gè)指標(biāo)TPR和FPR,即召回率和查準(zhǔn)率.根據(jù)TPR和FPR,可以計(jì)算出準(zhǔn)確率的綜合評(píng)分F1值,具體計(jì)算公式如公式(6)所示:

        (6)

        其中召回率表示模型正確預(yù)測(cè)出測(cè)試集正例數(shù)據(jù)數(shù)量與測(cè)試集數(shù)據(jù)總數(shù)的比率(其中TP表示正例數(shù)據(jù)預(yù)測(cè)正確的個(gè)數(shù),F(xiàn)N表示負(fù)例數(shù)據(jù)預(yù)測(cè)正確的個(gè)數(shù));準(zhǔn)確率用來(lái)評(píng)估測(cè)試集預(yù)測(cè)正確的正例數(shù)量與測(cè)試集數(shù)據(jù)預(yù)測(cè)成正例的比率(FP表示測(cè)試集負(fù)例數(shù)據(jù)預(yù)測(cè)錯(cuò)誤的個(gè)數(shù));F1值即為兩者的調(diào)和平均數(shù).

        5 實(shí)驗(yàn)與分析

        本章主要驗(yàn)證Bert-TextRCNN網(wǎng)絡(luò)模型各部分在短文本相似度匹配任務(wù)上的實(shí)驗(yàn)對(duì)比,驗(yàn)證本文所采用模型在該任務(wù)上的有效性,同時(shí)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析,探究模型各部分組成對(duì)實(shí)驗(yàn)結(jié)果的影響,為將來(lái)進(jìn)一步優(yōu)化改進(jìn)或應(yīng)用于其他領(lǐng)域提供參考依據(jù).

        5.1 相似度對(duì)照實(shí)驗(yàn)

        相似度對(duì)照實(shí)驗(yàn)?zāi)P筒捎肳ord2vecTextCNN、Word2vecTextRCNN、Bert-TextCNN以及Bert-TextRCNN這4種模型設(shè)置對(duì)照組,分別驗(yàn)證引入預(yù)訓(xùn)練模型Bert對(duì)于實(shí)驗(yàn)結(jié)果的影響以及TextCNN和TextRCNN對(duì)于短文本相似度匹配任務(wù)的不同表現(xiàn).實(shí)驗(yàn)結(jié)果如表4、表5所示.

        由實(shí)驗(yàn)結(jié)果可見(jiàn)Bert-TextRCNN在ATEC數(shù)據(jù)集和LCQMC數(shù)據(jù)集上的表現(xiàn)要優(yōu)于其他3種網(wǎng)絡(luò)結(jié)構(gòu),這得益于Bert預(yù)訓(xùn)練模型的遮蔽語(yǔ)言模型和多層Transfomer結(jié)構(gòu)作為特征提取器,可直接作為一種抽象特征來(lái)服務(wù)于下游任務(wù).對(duì)比實(shí)驗(yàn)表明,采用Bert預(yù)訓(xùn)練模型構(gòu)建句向量的效果要優(yōu)于Word2vec的詞向量表示方法.在文本相似度計(jì)算領(lǐng)域,TextRCNN的效果比TextCNN的表現(xiàn)更好,這是由于Text-CNN只能捕捉局部特征,而TextRCNN使用LSTM網(wǎng)絡(luò)代替卷積層,更好的捕捉序列化特征,從而捕捉到文本上下文語(yǔ)義信息.

        5.2 多特征權(quán)值矩陣對(duì)照實(shí)驗(yàn)

        在文本相似度實(shí)驗(yàn)的基礎(chǔ)上,采用在ATEC數(shù)據(jù)集和LCQMC數(shù)據(jù)集表現(xiàn)最好的Bert-TextRCNN模型作為相似度計(jì)算模型,在“陜西省中小企業(yè)研發(fā)服務(wù)平臺(tái)”成交信息數(shù)據(jù)集上測(cè)試引入多屬性權(quán)值矩陣對(duì)于推薦結(jié)果準(zhǔn)確性的影響.對(duì)于多屬性權(quán)重矩陣的構(gòu)建分為兩種思路,一種是根據(jù)各屬性數(shù)據(jù)分布情況使用熵值法[17]動(dòng)態(tài)確定各組數(shù)據(jù)不同屬性的權(quán)重,一種是根據(jù)業(yè)內(nèi)專家對(duì)于屬性的重要性評(píng)估,采用層次分析法確定固定權(quán)值矩陣.層次分析法確定權(quán)值過(guò)程如下:

        5.2.1 構(gòu)建判斷矩陣

        判斷矩陣是建立各層次之間關(guān)系的結(jié)構(gòu)化形式,根據(jù)各層次之間的重要性程度兩兩之間相互比較構(gòu)建判斷矩陣.首先根據(jù)相關(guān)專家對(duì)指標(biāo)的相關(guān)重要性進(jìn)行評(píng)估賦分,賦分標(biāo)準(zhǔn)按表6所示.

        表6 標(biāo)度取值及含義Table 6 Scale value and meaning

        根據(jù)10名相關(guān)領(lǐng)域的專家評(píng)價(jià)結(jié)果作為層次分析法分析的對(duì)象.隨機(jī)選取其中一位專家評(píng)價(jià)結(jié)果將其結(jié)果轉(zhuǎn)換為判斷矩陣B′如公式(7)所示,該矩陣具有正互反的特點(diǎn),即Bii=Bjj=1,Bij×Bji=1.

        (7)

        5.2.2 計(jì)算多特征指標(biāo)權(quán)重系數(shù)

        利用幾何平均法計(jì)算權(quán)重系數(shù)分為以下步驟:首先將判斷矩陣B′的元素按照行相乘得到一個(gè)新的列向量Mi,接著計(jì)算Mi的n次方根Vi,最后對(duì)Vi進(jìn)行歸一化處理得到wi,具體計(jì)算如公式(8)所示,特征權(quán)重映射如表7所示.

        (8)

        表7 屬性權(quán)重映射關(guān)系Table 7 Attribute weight mapping

        共設(shè)置3組對(duì)照實(shí)驗(yàn).分別驗(yàn)證引入熵值法、層次分析法與不引入多特征權(quán)重矩陣分別對(duì)于多屬性推薦中權(quán)值矩陣對(duì)推薦結(jié)果的影響.測(cè)試數(shù)據(jù)使用“陜西省中小企業(yè)研發(fā)服務(wù)平臺(tái)”所發(fā)布188條成交記錄作為測(cè)試數(shù)據(jù)集進(jìn)行測(cè)試,從中隨機(jī)抽取若干條成交記錄中的需求文本進(jìn)行結(jié)果分析,平臺(tái)成交記錄示例如表8所示.通過(guò)對(duì)推薦得分的前5名實(shí)驗(yàn)室的科研成果內(nèi)容根據(jù)成交結(jié)果判別推薦的準(zhǔn)確性.為了消除某一屬性內(nèi)實(shí)體數(shù)量過(guò)多而導(dǎo)致的得分堆疊致使推薦分?jǐn)?shù)過(guò)高,從而影響推薦結(jié)果的問(wèn)題,故對(duì)相似度計(jì)算模型的得分進(jìn)行剪枝操作,相似度得分低于0.3認(rèn)為與目標(biāo)需求不相關(guān),故置為0.對(duì)比實(shí)驗(yàn)結(jié)果示例如表9、表10及表11所示.

        表8 成交結(jié)果示例Table 8 Sample auction results

        表9 相似度計(jì)算模型結(jié)合熵值法推薦結(jié)果Table 9 Similarity calculation model combined with entropy method recommendation results

        表10 相似度計(jì)算模型結(jié)合層次分析法推薦結(jié)果Table 10 Similarity calculation model combined with analytic hierarchy process recommended results

        針對(duì)需求“涇河大橋上部結(jié)構(gòu)鋼結(jié)構(gòu)…”,通過(guò)在數(shù)據(jù)集中人工篩選,其中“陜西省結(jié)構(gòu)與抗震重點(diǎn)實(shí)驗(yàn)室”與“陜西省公路橋梁與隧道重點(diǎn)實(shí)驗(yàn)室”是與其最為匹配的目標(biāo)科技研發(fā)團(tuán)隊(duì).需求“關(guān)于高溫碳化金屬有機(jī)框架材料…”,通過(guò)人工篩選,其中“陜西省納米材料與技術(shù)重點(diǎn)實(shí)驗(yàn)室”與“陜西省輕化工助劑重點(diǎn)實(shí)驗(yàn)室”是與其最為匹配的目標(biāo)科技研發(fā)團(tuán)隊(duì).對(duì)比實(shí)際成交結(jié)果,實(shí)際成交方均被包含于上述人工篩選的科研團(tuán)隊(duì)中,可知該實(shí)例交易記錄不存在太多客觀擾動(dòng)因素.分析實(shí)驗(yàn)結(jié)果,在引入熵值法的推薦結(jié)果中對(duì)應(yīng)需求的實(shí)際成交方排名分別為第2名和第1名,表明權(quán)值矩陣可以調(diào)整推薦結(jié)果,且引入熵值法的推薦結(jié)果要明顯優(yōu)于層次分析法.這是由于熵值法會(huì)根據(jù)推薦得分的數(shù)據(jù)分布情況動(dòng)態(tài)確定各指標(biāo)權(quán)值,充分強(qiáng)化高分?jǐn)?shù)據(jù),削弱低分?jǐn)?shù)據(jù).而層次分析法權(quán)值矩陣固定,對(duì)于每組得分都賦予相同權(quán)值,且判斷矩陣由人為填寫,致使推薦結(jié)果附帶一定的主觀性.

        表11 相似度計(jì)算模型(不引入權(quán)值矩陣)推薦結(jié)果示例Table 11 Similarity calculation model(without introducing weight matrix)recommendation results

        熵值法對(duì)各指標(biāo)的權(quán)值計(jì)算與數(shù)據(jù)的分布有關(guān),數(shù)據(jù)量的離散程度不同,最終確定的權(quán)重也不同,為驗(yàn)證在小樣本上權(quán)值矩陣對(duì)推薦結(jié)果帶來(lái)的影響,在上述實(shí)驗(yàn)的基礎(chǔ)上抽取172個(gè)待推薦的科研團(tuán)隊(duì)其中的50個(gè),但這50個(gè)目標(biāo)團(tuán)隊(duì)中要包含與實(shí)際需求最相關(guān)的2個(gè)科研團(tuán)隊(duì),使用表8所示成交實(shí)際樣例進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果如表12所示.

        表12 小數(shù)據(jù)樣例推薦結(jié)果示例Table 12 Small data sample recommended example results

        由實(shí)驗(yàn)結(jié)果可以看出,本文提出的推薦算法在小數(shù)據(jù)集上的推薦結(jié)果并未受到明顯的影響,表明采用熵值法確定指標(biāo)權(quán)重的方法在小量數(shù)據(jù)上實(shí)現(xiàn)科研團(tuán)隊(duì)推薦具有一定的抗擾動(dòng)性,這是熵值法的計(jì)算方式與該推薦任務(wù)的特殊性結(jié)合導(dǎo)致的結(jié)果.由公式(2)和公式(3)可知,對(duì)于成果項(xiàng)中的第j項(xiàng)指標(biāo),對(duì)應(yīng)的指標(biāo)值Bij的差異越大,熵值就越小,其所包含的信息量越多.由公式(5)可知,熵值越小,對(duì)應(yīng)成果指標(biāo)的權(quán)值越大.在科技研發(fā)團(tuán)隊(duì)推薦任務(wù)中,第j項(xiàng)指標(biāo)下指標(biāo)值Bij離散程度較大,說(shuō)明j指標(biāo)下有n(0

        6 結(jié) 語(yǔ)

        本文為實(shí)現(xiàn)技術(shù)供需雙方信息共享和加速供需有效對(duì)接,充分利用互聯(lián)網(wǎng)平臺(tái)以實(shí)現(xiàn)技術(shù)交易的有效途徑,提出一種融合多屬性表示的相似度計(jì)算模型,利用句向量與序列化結(jié)合最大池化的特征提取方式,使文本的相似度度量結(jié)果更加準(zhǔn)確.實(shí)驗(yàn)采集“陜西省中小企業(yè)服務(wù)平臺(tái)”的供需數(shù)據(jù)用于驗(yàn)證模型在供需匹配領(lǐng)域的有效性,并驗(yàn)證權(quán)值矩陣可以有效的提高供需推薦的準(zhǔn)確性.但由于只在“陜西省中小企業(yè)研發(fā)平臺(tái)”進(jìn)行供需推薦測(cè)試,數(shù)據(jù)量相對(duì)較小,且由于在實(shí)際研發(fā)中存在價(jià)格、事件、效率等客觀因素,未進(jìn)行人工標(biāo)注測(cè)試集,僅采用隨機(jī)抽取部分交易成交信息驗(yàn)證分析模型的準(zhǔn)確性.為增強(qiáng)實(shí)驗(yàn)結(jié)果的說(shuō)服力,該部分內(nèi)容還有待優(yōu)化,是今后繼續(xù)改善提升的方向.由于該領(lǐng)域標(biāo)注數(shù)據(jù)集的缺乏,本文使用了通用領(lǐng)域LCQMC數(shù)據(jù)集訓(xùn)練好的模型作為相似度得分計(jì)算模型,用其對(duì)提出的推薦算法進(jìn)行驗(yàn)證,如果使用相關(guān)領(lǐng)域的數(shù)據(jù)集應(yīng)該會(huì)取得更好的效果.基于圖結(jié)構(gòu)的推薦方式目前在許多領(lǐng)域有不錯(cuò)的表現(xiàn),未來(lái)工作中將考慮采用基于知識(shí)圖譜以及圖神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行改進(jìn).

        猜你喜歡
        權(quán)值向量矩陣
        一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
        向量的分解
        聚焦“向量與三角”創(chuàng)新題
        CONTENTS
        基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
        初等行變換與初等列變換并用求逆矩陣
        向量垂直在解析幾何中的應(yīng)用
        向量五種“變身” 玩轉(zhuǎn)圓錐曲線
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年3期)2015-09-10 07:22:44
        久久国产精品av在线观看| 欧美日韩一区二区三区自拍| 波多野结衣一区| 国产人成视频免费在线观看| 日韩精品视频免费在线观看网站| 久久伊人精品一区二区三区 | 亚洲av无码乱码国产精品fc2| 最新国产成人综合在线观看| 亚洲永久免费中文字幕| 日韩亚洲欧美久久久www综合| 99热久久这里只精品国产www| 国产高清在线91福利| av免费在线播放观看| 亚洲乱码中文字幕久久孕妇黑人| 日本无遮挡吸乳呻吟视频| 狠狠色丁香婷婷久久综合2021| 一本久道久久丁香狠狠躁| 少妇扒开毛茸茸的b自慰| 亚洲国产精品久久久久久久| 一区二区三区四区亚洲综合| 久久人妻一区二区三区免费| 久久9精品区-无套内射无码| 免费在线视频一区| 内射中出后入内射极品女神视频| 亚洲精品乱码久久久久久| 男女一边摸一边做爽爽的免费阅读| 亚洲av无码专区在线亚| 大香蕉视频在线青青草| 国产欧美日韩精品丝袜高跟鞋| 中文在线а√天堂官网| 韩国美女主播国产三级| 日本久久伊人特级黄色| 久热综合在线亚洲精品| 亚洲国产精品无码久久九九大片健| 东风日产车是不是国产的| 99国产精品久久久蜜芽| 永久无码在线观看| 久久99国产精品久久99密桃| 男人的天堂av网站| 国产福利午夜波多野结衣| 久久久人妻一区精品久久久|