亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合多角度信息和圖卷積網(wǎng)絡(luò)的社交網(wǎng)絡(luò)節(jié)點(diǎn)分類模型

        2022-06-18 02:21:48梁安婷劉小洋黃賢英
        關(guān)鍵詞:約束卷積社交

        劉 超,梁安婷,劉小洋,黃賢英

        (重慶理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 重慶 400054)

        0 引言

        當(dāng)前各種在線交流分享平臺(tái)發(fā)展迅猛,產(chǎn)生大量社交網(wǎng)絡(luò)數(shù)據(jù)。這些數(shù)據(jù)蘊(yùn)含著個(gè)體信息、個(gè)體活動(dòng)及個(gè)體間的交互信息,能體現(xiàn)用戶的屬性與偏好,展示用戶之間的關(guān)系等。如何挖掘社交網(wǎng)絡(luò)數(shù)據(jù)中的信息,利用其價(jià)值一直備受研究者們關(guān)注。節(jié)點(diǎn)分類是將代表實(shí)體的節(jié)點(diǎn)進(jìn)行類別劃分,是社交網(wǎng)絡(luò)的研究熱點(diǎn)之一,有著重要的實(shí)際應(yīng)用價(jià)值,例如在交流分享平臺(tái)中(微博、抖音等),對(duì)用戶進(jìn)行精確分類,有助于后續(xù)為用戶推薦共同點(diǎn)更多的好友及可能感興趣的事件,增強(qiáng)用戶的使用體驗(yàn);在電商平臺(tái)中(淘寶、京東等),精確分類買(mǎi)家有助于商家的把控和售賣(mài),提高交易成功的概率。然而如何從節(jié)點(diǎn)自身屬性和網(wǎng)絡(luò)結(jié)構(gòu)中提取更多的信息,有效融合這些信息,實(shí)現(xiàn)社交網(wǎng)絡(luò)節(jié)點(diǎn)分類任務(wù)依然是個(gè)有待研究的問(wèn)題。

        同質(zhì)性(homophily)和共引規(guī)律(co-citation regularity)是社會(huì)科學(xué)中的2種重要性質(zhì),源于人與人之間的交流來(lái)往。社交網(wǎng)絡(luò)是人際網(wǎng)絡(luò)的延伸,已有研究[1-3]證明社交網(wǎng)絡(luò)同樣具備上述性質(zhì)。研究者已經(jīng)利用這2種性質(zhì)對(duì)社交網(wǎng)絡(luò)問(wèn)題進(jìn)行了一些探索,如Getoor[4]對(duì)網(wǎng)絡(luò)數(shù)據(jù)的近似推理算法進(jìn)行了比較,在社交網(wǎng)絡(luò)中,同質(zhì)性是應(yīng)用到鏈接分類的鏈接模式之一,并且鏈接到相同文檔的文檔很可能具有相同標(biāo)簽;Bhagat等[5]在處理帶權(quán)邊的多重圖的標(biāo)記問(wèn)題時(shí),分別利用同質(zhì)性和共引規(guī)律提出了兩類算法,兩類算法在博客的標(biāo)簽分配上分別取得了較好的效果。這些研究表明,在社交網(wǎng)絡(luò)的研究中,利用同質(zhì)性和共引規(guī)律能提升解決相關(guān)問(wèn)題的性能,遺憾的是,研究尚未應(yīng)用到社交網(wǎng)絡(luò)節(jié)點(diǎn)分類,同時(shí),在2種性質(zhì)和節(jié)點(diǎn)自身信息及網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的融合問(wèn)題上,沒(méi)有相關(guān)文獻(xiàn)進(jìn)行探討。為了利用2種性質(zhì)更好地挖掘并融合網(wǎng)絡(luò)拓?fù)浜凸?jié)點(diǎn)自身屬性,在圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)的基礎(chǔ)上進(jìn)行改進(jìn),提出能融合更多信息的模型,提高節(jié)點(diǎn)分類效果?;谕|(zhì)性和共引規(guī)律,提取出同質(zhì)型節(jié)點(diǎn)和共引型節(jié)點(diǎn)兩類節(jié)點(diǎn)。通過(guò)相似度度量算法,計(jì)算被分類節(jié)點(diǎn)與其他所有節(jié)點(diǎn)特征向量的相似度,找到相似度最高的前k1個(gè)節(jié)點(diǎn)作為該節(jié)點(diǎn)的同質(zhì)型節(jié)點(diǎn);計(jì)算被分類節(jié)點(diǎn)與其他所有節(jié)點(diǎn)的鄰接向量的相似度,找到相似度最高的前k2個(gè)節(jié)點(diǎn)作為該節(jié)點(diǎn)的共引型節(jié)點(diǎn)。對(duì)被分類節(jié)點(diǎn)與對(duì)應(yīng)的同質(zhì)型節(jié)點(diǎn)進(jìn)行鏈接,構(gòu)成同質(zhì)矩陣空間,同理,對(duì)被分類節(jié)點(diǎn)與對(duì)應(yīng)共引型節(jié)點(diǎn)進(jìn)行鏈接,構(gòu)成共引矩陣空間。分別在2種矩陣空間進(jìn)行卷積,提取相應(yīng)的節(jié)點(diǎn)信息,對(duì)被分類節(jié)點(diǎn)進(jìn)行信息補(bǔ)充,提高分類精確度。

        在Wang等[6]的研究基礎(chǔ)上,利用上述兩類節(jié)點(diǎn),挖掘更全面的信息并進(jìn)行融合,提出融合多角度信息和圖卷積網(wǎng)絡(luò)的社交網(wǎng)絡(luò)節(jié)點(diǎn)分類模型(a social network node classification model based on multi-angle information fusion and graph convolutional network,MAIF-GCN)。主要貢獻(xiàn)如下:

        1) 提取蘊(yùn)含著節(jié)點(diǎn)同質(zhì)信息和共引信息的兩類關(guān)系型節(jié)點(diǎn)。①同質(zhì)型節(jié)點(diǎn):和被分類節(jié)點(diǎn)有著相似屬性(特征向量相似度高)的節(jié)點(diǎn);②共引型節(jié)點(diǎn):和被分類節(jié)點(diǎn)鏈接著更多相同節(jié)點(diǎn)(鄰接向量相似度高)的節(jié)點(diǎn)。提取兩類關(guān)系節(jié)點(diǎn)的信息,即挖掘被分類節(jié)點(diǎn)的隱藏信息,后續(xù)實(shí)驗(yàn)證明,提出的兩類關(guān)系節(jié)點(diǎn)能對(duì)被分類的社交網(wǎng)絡(luò)節(jié)點(diǎn)信息進(jìn)行更好地補(bǔ)充,對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)分類有益。

        2) 提出一種新的融合多角度信息和圖卷積網(wǎng)絡(luò)的節(jié)點(diǎn)分類模型MAIF-GCN。從鄰接鄰居、同質(zhì)最近鄰和共引最近鄰多個(gè)角度挖掘被分類節(jié)點(diǎn)的相關(guān)信息,通過(guò)平均嵌入相加、注意力機(jī)制進(jìn)行信息融合,實(shí)驗(yàn)證明,該模型在傳統(tǒng)社交網(wǎng)絡(luò)數(shù)據(jù)集上取得很好的分類效果。

        1 相關(guān)工作

        Kipf等[7]和Defferrard等[8]提出的GCN能有效捕捉節(jié)點(diǎn)的相關(guān)信息,在節(jié)點(diǎn)分類問(wèn)題上表現(xiàn)出很好的分類效果,是處理節(jié)點(diǎn)分類問(wèn)題的常用方法。如Derr等[9]利用平衡理論來(lái)正確地匯總和傳播經(jīng)過(guò)簽名的GCN模型各層的信息,使分類問(wèn)題泛化至社交媒體中的簽名網(wǎng)絡(luò)(或既有正面鏈接又有負(fù)面鏈接的圖表);Hu等[10]為了增加接收域,提出了一種新的深度層次圖卷積網(wǎng)絡(luò)(hierarchical graph convolutional networks,H-GCN)用于半監(jiān)督節(jié)點(diǎn)分類;Lin等[11]提出了基于圖卷積網(wǎng)絡(luò)的結(jié)構(gòu)融合,從多視圖數(shù)據(jù)的多圖結(jié)構(gòu)中挖掘出更完整的分布結(jié)構(gòu),以半監(jiān)督的方式提高引文網(wǎng)絡(luò)節(jié)點(diǎn)分類性能。

        GCN的巨大成功部分歸功于它提供了一種基于拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)特征的融合策略來(lái)學(xué)習(xí)節(jié)點(diǎn)嵌入,然而,最近的一些研究揭示了GCN在融合節(jié)點(diǎn)特征和拓?fù)浣Y(jié)構(gòu)方面的某些弱點(diǎn)。例如,Li等[12]的研究表明,GCN實(shí)際上對(duì)節(jié)點(diǎn)特征進(jìn)行了拉普拉斯平滑,使嵌入到整個(gè)網(wǎng)絡(luò)中的節(jié)點(diǎn)逐漸收斂;Hoang等[13]和Wu等[14]證明了特征信息在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上傳播時(shí),拓?fù)浣Y(jié)構(gòu)對(duì)節(jié)點(diǎn)特征起到低通濾波的作用;Wang等[6]通過(guò)實(shí)驗(yàn)證明,GCN對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)特征的融合能力與最佳甚至令人滿意的距離相去甚遠(yuǎn)。

        無(wú)法充分融合節(jié)點(diǎn)自身屬性和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)來(lái)提取相關(guān)信息,可能會(huì)嚴(yán)重影響GCN在分類任務(wù)中的性能,為解決此問(wèn)題,不少研究者在GCN的基礎(chǔ)上進(jìn)行改進(jìn):Velikovi等[15]提出了圖注意網(wǎng)絡(luò)(graph attention network,GATs) ,他們?yōu)橐粋€(gè)鄰域中的不同節(jié)點(diǎn)指定不同的權(quán)值,以此調(diào)整從鄰居節(jié)點(diǎn)接收的信息量,提高分類精確度;Abu-El-Haija等[16]提出了一個(gè)利用鄰接矩陣的多次冪的圖卷積層,通過(guò)堆疊高階卷積層獲取更多信息,達(dá)到提高分類精度的效果;Wu等[17]提出了一個(gè)名為DEMO-Net(degree-specific graph neural networks)的通用圖神經(jīng)網(wǎng)絡(luò)模型,該模型根據(jù)節(jié)點(diǎn)的度值將特征聚合表達(dá)為一個(gè)多任務(wù)學(xué)習(xí)問(wèn)題。這些改進(jìn)方法都在一定程度上提高了節(jié)點(diǎn)分類的精度,在處理節(jié)點(diǎn)分類問(wèn)題上起著不可忽視的作用,可見(jiàn),更好地融合網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)信息,更多地提取相關(guān)信息,是提高節(jié)點(diǎn)分類效果的先決條件,是解決節(jié)點(diǎn)分類問(wèn)題的重要目標(biāo)。

        Bhagat等[18]在發(fā)表的社交網(wǎng)絡(luò)節(jié)點(diǎn)分類研究綜述中,提到社交網(wǎng)絡(luò)存在的2個(gè)重要特性:一為同質(zhì)性,即個(gè)體之間的聯(lián)系與那些在本質(zhì)上相似的個(gè)體相關(guān);二為共引規(guī)律,即相似的人傾向于提及或聯(lián)系相同的事物。然而,對(duì)這2個(gè)重要特性的研究尚未應(yīng)用到社交網(wǎng)絡(luò)節(jié)點(diǎn)分類領(lǐng)域。Wang等[6]就GCNs能否在信息豐富的復(fù)雜圖中最優(yōu)地整合節(jié)點(diǎn)特征和拓?fù)浣Y(jié)構(gòu)進(jìn)行研究,針對(duì)GCNs融合節(jié)點(diǎn)特征和拓?fù)浣Y(jié)構(gòu)的能力不夠理想的缺陷,提出了一種用于半監(jiān)督分類的自適應(yīng)多通道圖卷積網(wǎng)絡(luò)(adaptive multi-channel graph convolutional networks,AM-GCN)。其核心思想是同時(shí)從節(jié)點(diǎn)特征、拓?fù)浣Y(jié)構(gòu)及其組合中提取特定的和共同的嵌入,并利用注意機(jī)制學(xué)習(xí)自適應(yīng)嵌入的重要性權(quán)重。在進(jìn)行節(jié)點(diǎn)特征和拓?fù)浣Y(jié)構(gòu)信息融合的過(guò)程中,AM-GCN無(wú)意識(shí)地使用了同質(zhì)性,受其使用方法的啟發(fā),本文中從理論上證明為何該構(gòu)建方法能夠?qū)Ψ诸慄c(diǎn)信息進(jìn)行補(bǔ)充,并進(jìn)一步添加共引規(guī)律,構(gòu)建能提取更多信息、融合信息更完整的分類模型。

        2 提出的MAIF-GCN模型

        2.1 問(wèn)題描述

        為研究社交網(wǎng)絡(luò)節(jié)點(diǎn)分類問(wèn)題,在給定圖數(shù)據(jù)G= (A,X)的條件下,盡可能精確地將圖中的n個(gè)節(jié)點(diǎn)分為C類中的某一類,使用的符號(hào)定義即變量描述如表1所示。

        表1 符號(hào)定義

        為解決上述問(wèn)題,提出了融合多角度信息和圖卷積網(wǎng)絡(luò)的節(jié)點(diǎn)分類MAIF-GCN模型,模型概覽如圖1所示。

        圖1 融合多角度信息和圖卷積網(wǎng)絡(luò)的社交網(wǎng)絡(luò)節(jié)點(diǎn)分類模型(MAIF-GCN)

        2.2 構(gòu)造2個(gè)矩陣空間

        為了提高社交網(wǎng)絡(luò)節(jié)點(diǎn)分類精度,基于社會(huì)科學(xué)中確定的2個(gè)可以應(yīng)用于在線社交網(wǎng)絡(luò)的重要現(xiàn)象——同質(zhì)性和共引規(guī)律,提出兩類能為分類節(jié)點(diǎn)提供有用信息的相關(guān)節(jié)點(diǎn)——同質(zhì)型節(jié)點(diǎn)和共引型節(jié)點(diǎn)。為挖掘兩類節(jié)點(diǎn)信息,構(gòu)造相應(yīng)的關(guān)系矩陣空間,在構(gòu)建好的關(guān)系矩陣空間中進(jìn)行卷積操作,就能融合相應(yīng)關(guān)系的節(jié)點(diǎn)信息。

        X是特征向量矩陣,該矩陣每一行代表著一個(gè)節(jié)點(diǎn)的特征,將一行向量同其他所有行向量進(jìn)行相似度的計(jì)算,便能求得這些其他節(jié)點(diǎn)同這個(gè)節(jié)點(diǎn)在特征即性質(zhì)上的相似程度。通過(guò)對(duì)特征向量矩陣的每一行和其他行進(jìn)行相似度的計(jì)算,得出和每個(gè)節(jié)點(diǎn)性質(zhì)最相似的k1個(gè)節(jié)點(diǎn)。將“性質(zhì)相似”這種聯(lián)系作為邊,相似度最高的k1個(gè)節(jié)點(diǎn)將產(chǎn)生鏈接,由此得出每個(gè)節(jié)點(diǎn)的同質(zhì)向量FAi∈R1×n,將所有節(jié)點(diǎn)的同質(zhì)向量拼接起來(lái),得到同質(zhì)矩陣空間FA∈Rn×n。

        A是鄰接矩陣,該矩陣每一行代表著一個(gè)節(jié)點(diǎn)同其他節(jié)點(diǎn)的聯(lián)系,存在聯(lián)系則為1,否則為0。將一行向量同其他所有行的向量進(jìn)行相似度的計(jì)算,便能求得其他所有節(jié)點(diǎn)同該節(jié)點(diǎn)偏好或傾向最相近的k2個(gè)節(jié)點(diǎn)。將“偏好或傾向相近”這種聯(lián)系作為邊,傾向相近度最高的幾個(gè)節(jié)點(diǎn)將產(chǎn)生鏈接,否則不鏈接,由此得出每個(gè)節(jié)點(diǎn)的共引向量CoAi∈R1×n,將所有節(jié)點(diǎn)的共引向量拼接起來(lái),得到共引矩陣空間CoA∈Rn×n。

        經(jīng)過(guò)上述理論鋪墊發(fā)現(xiàn),2種矩陣空間都是由求解向量間相似度獲取的。常見(jiàn)的相似度的計(jì)算有歐幾里得度量、皮爾遜相關(guān)系數(shù)、余弦相似度等。通過(guò)對(duì)比計(jì)算,幾種相似度度量算法對(duì)最近鄰的計(jì)算結(jié)果幾乎一致,此種算法的選擇不影響最終分類結(jié)果。本文中最終使用余弦相似度進(jìn)行相似度的度量:

        (1)

        2.3 提出的融合多角度信息和圖卷積網(wǎng)絡(luò)的社交網(wǎng)絡(luò)節(jié)點(diǎn)分類模型MAIF-GCN

        2.3.1獲取空間嵌入

        在共引矩陣空間進(jìn)行圖卷積,提取并融合共引型節(jié)點(diǎn)的節(jié)點(diǎn)信息,得到共引矩陣空間卷積后的嵌入ZCo(CoEmb), 其中,Wco是在共引矩陣空間進(jìn)行學(xué)習(xí)的權(quán)重矩陣:

        (2)

        在鄰接矩陣空間進(jìn)行圖卷積,提取并融合鄰居節(jié)點(diǎn)的節(jié)點(diǎn)信息,得到鄰接矩陣空間卷積后的嵌入ZA(AEmb),其中,WA是在鄰接矩陣空間進(jìn)行學(xué)習(xí)的權(quán)重矩陣:

        (3)

        在同質(zhì)矩陣空間進(jìn)行圖卷積,提取并融合同質(zhì)型節(jié)點(diǎn)的節(jié)點(diǎn)信息,得到同質(zhì)矩陣空間卷積后的嵌入ZF(FEmb),其中,WF是在同質(zhì)矩陣空間進(jìn)行學(xué)習(xí)的權(quán)重矩陣:

        (4)

        2.3.2融合空間嵌入

        不同社交網(wǎng)絡(luò)中,三類節(jié)點(diǎn)向被分類節(jié)點(diǎn)提供的信息的重要程度不同,有時(shí)可能只有單一類型的節(jié)點(diǎn)提供對(duì)分類有幫助的信息,但有時(shí)需要2種或3種關(guān)系節(jié)點(diǎn)共同提供信息。

        鄰接矩陣空間、同質(zhì)矩陣空間和共引矩陣空間3種單空間都經(jīng)過(guò)了相同的預(yù)處理,因此在3種單空間進(jìn)行卷積后的嵌入輸出格式一致,即矩陣大小一致,可以直接進(jìn)行加減。 將單空間嵌入通過(guò)相加平均進(jìn)行組合,節(jié)點(diǎn)會(huì)融合不同空間卷積后的信息,得到聯(lián)合嵌入。

        將單空間嵌入、兩兩單空間聯(lián)合嵌入和3個(gè)單空間聯(lián)合嵌入共同放進(jìn)注意力機(jī)制進(jìn)行融合,得到最終嵌入,同時(shí)獲得各種嵌入的重要性。由上述獲取聯(lián)合空間嵌入的操作易知,單空間嵌入與聯(lián)合空間嵌入輸出格式一致。將所有嵌入在第二維上進(jìn)行拼接,得到每個(gè)節(jié)點(diǎn)在不同角度上的多維表示。本文的注意力機(jī)制使用兩層全連接進(jìn)行學(xué)習(xí),再通過(guò)softmax函數(shù),從每個(gè)節(jié)點(diǎn)在不同角度上的多維表示,學(xué)習(xí)到分類該節(jié)點(diǎn)時(shí)在每個(gè)角度,即每種嵌入上所占的比重。

        1) 組合單空間嵌入(eg:共引與鄰接單空間嵌入組合ZCoA(CoAComE),3個(gè)單空間嵌入組合ZTotal(ComETotal)):

        (5)

        (6)

        2) 融合空間嵌入:

        (αCo,αA,αF,αCoA,αFA,αCoF,αTotal)=

        att(ZCo,ZA,ZF,ZCoA,ZFA,ZCoF,ZTotal)

        (7)

        將3種單空間嵌入和聯(lián)合嵌入共同放進(jìn)注意力機(jī)制,通過(guò)注意力機(jī)制得到每個(gè)節(jié)點(diǎn)對(duì)應(yīng)各種嵌入的重要性,使用該表示重要性的向量將各種嵌入融合起來(lái),得到終極嵌入Z(Emb):

        Z=αCo·ZCo+αA·ZA+αF·ZF+

        αCoA·ZCoA+αFA·ZFA+αCoF·ZCoF+

        αTotal·ZTotal

        (8)

        2.3.3半監(jiān)督多標(biāo)簽分類

        (9)

        2.3.4約束和目標(biāo)函數(shù)

        1) 一致性約束

        考慮到雖然提取信息的角度不同,但最終信息給予的對(duì)象是同一節(jié)點(diǎn),因此,這些不同的信息會(huì)有些許相似或存在某種聯(lián)系。通過(guò)將不同關(guān)系矩陣空間中提取到的信息進(jìn)行相互約束,使得挖掘到的信息更有利于分類。這種相互約束,就是提取出的信息的一致性約束。

        各嵌入在正則化后乘以自身的轉(zhuǎn)置轉(zhuǎn)化為對(duì)稱矩陣,用對(duì)稱矩陣的最小二乘進(jìn)行一致性約束。鄰接矩陣嵌入ZA正則化后表示為ZAnor,同理,同質(zhì)矩陣嵌入、共引矩陣嵌入正則化后的表示為ZFnor、ZConor。正則化后的不同空間嵌入乘以自身的轉(zhuǎn)置轉(zhuǎn)化為對(duì)稱矩陣,分別得對(duì)稱陣如下:

        (10)

        以鄰接矩陣和同質(zhì)矩陣為例,用最小二乘得此2種空間嵌入的一致性約束LCoA如下:

        (11)

        同理可得鄰矩和共引矩陣嵌入的一致性約束LFA,同質(zhì)矩陣和共引矩陣嵌入的一致性約束LCoF。不同網(wǎng)絡(luò)對(duì)于矩陣空間的相似性要求不同,通過(guò)對(duì)一致性約束進(jìn)行加權(quán)相加,得到總的一致性約束:

        (12)

        式中:α、β為超參數(shù),不同網(wǎng)絡(luò)通過(guò)調(diào)節(jié)α、β來(lái)調(diào)整各空間嵌入的一致性約束。

        2) 目標(biāo)函數(shù)

        (13)

        3) 綜合目標(biāo)函數(shù)

        結(jié)合一致性約束和目標(biāo)函數(shù),得到模型的綜合目標(biāo)函數(shù)L:

        L=Lt+θ·LCom

        (14)

        式中:θ為超參數(shù),不同網(wǎng)絡(luò)的數(shù)據(jù)集在經(jīng)此模型訓(xùn)練時(shí),通過(guò)調(diào)節(jié)此超參數(shù)對(duì)一致性約束的權(quán)重進(jìn)行調(diào)整。

        算法1模型算法流程。

        輸入:社交網(wǎng)絡(luò)圖數(shù)據(jù)G=(A,X),L個(gè)帶標(biāo)簽的樣本節(jié)點(diǎn);

        1) 通過(guò)式(1)得到FA和CoA;

        repeat:

        3) 通過(guò)式(2)—(4)分別計(jì)算得到單空間嵌入ZCo、ZA和ZF,通過(guò)式(5)與式(6)獲取組合空間嵌入ZCoA、ZFA、ZCoF與ZTotal;

        4) 使用式(7)獲得不同嵌入的比重(αCo,αA,αF,αCoA,αFA,αCoF,αTotal),式(8)加權(quán)融合,得到最終嵌入Z;

        6) 通過(guò)式(10)—(12)計(jì)算一致性約束LCom,式(13)進(jìn)行交叉熵?fù)p失求和,得到Lt;

        7) 使用式(14)得到綜合目標(biāo)函數(shù)L;

        8) 梯度下降法更新模型參數(shù);

        until 滿足訓(xùn)練停止條件

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 實(shí)驗(yàn)設(shè)置

        3.1.1數(shù)據(jù)描述

        使用2個(gè)傳統(tǒng)社交網(wǎng)絡(luò)數(shù)據(jù)集BlogCatalog[19]和Flickr[19](數(shù)據(jù)集信息見(jiàn)表2),以分類準(zhǔn)確率(accuracy)與F1-measure作為度量指標(biāo),測(cè)試本文提出的MAIF-GCN模型。在BlogCatalog和Flickr數(shù)據(jù)集上,將本文模型與傳統(tǒng)的社交網(wǎng)絡(luò)節(jié)點(diǎn)分類算法及一些先進(jìn)的GCNs變體模型進(jìn)行對(duì)比,并結(jié)合試驗(yàn)結(jié)果對(duì)模型進(jìn)行分析。

        表2 用于模型測(cè)試的數(shù)據(jù)集信息

        1) BlogCatalog數(shù)據(jù)集:一個(gè)社會(huì)關(guān)系網(wǎng)絡(luò)。節(jié)點(diǎn)屬性由用戶配置文件的關(guān)鍵字構(gòu)造,圖是由博主和他(她)的社會(huì)關(guān)系(比如好友)組成,標(biāo)簽代表作者提供的主題類別,所有節(jié)點(diǎn)劃分為6類。

        2) Flickr數(shù)據(jù)集:Flickr是用戶分享圖片和視頻的社交網(wǎng)絡(luò)。節(jié)點(diǎn)表示Flickr中的用戶,圖是用戶之間的好友關(guān)系,標(biāo)簽用于標(biāo)識(shí)用戶的興趣小組,所有節(jié)點(diǎn)劃分為9類。

        3.1.2對(duì)比實(shí)驗(yàn)

        將MAIF-GCN模型與6種先進(jìn)且效果良好的圖神經(jīng)模型進(jìn)行對(duì)比,對(duì)比模型詳情如下:

        1) GCN[7]:一種半監(jiān)督圖卷積網(wǎng)絡(luò)模型,它通過(guò)聚合鄰居的信息來(lái)學(xué)習(xí)節(jié)點(diǎn)表示。

        2) Chebyshev[8]:一種基于切比雪夫?yàn)V波器的GCN方法。

        3) GAT[15]:一種利用注意機(jī)制聚集節(jié)點(diǎn)特征的圖神經(jīng)網(wǎng)絡(luò)模型。

        4) DEMO-Net[17]:一種用于節(jié)點(diǎn)分類的度數(shù)特定圖神經(jīng)網(wǎng)絡(luò)。

        5) MixHop[16]:一種基于GCN的方法,在一個(gè)圖卷積層中混合高階鄰居的特征表示。

        6) AM-GCN[6]:一種用于半監(jiān)督分類的自適應(yīng)多通道圖卷積網(wǎng)絡(luò)。

        3.1.3參數(shù)設(shè)置

        如表2數(shù)據(jù)集所示,訓(xùn)練集有3種標(biāo)簽率(如BlogCatalog數(shù)據(jù)集存在120、240、360個(gè)標(biāo)簽節(jié)點(diǎn)),2個(gè)數(shù)據(jù)集都選擇1 000個(gè)節(jié)點(diǎn)作為測(cè)試集。所有對(duì)比模型都在他們相應(yīng)論文建議的參數(shù)基礎(chǔ)上進(jìn)行調(diào)優(yōu),以求更高的精度。除本文模型外,模型AM-GCN的分類結(jié)果都優(yōu)于其他模型,為了方便對(duì)比,本文模型與AM-CGN模型共有的參數(shù),取值與該模型一致,在3個(gè)不同的矩陣空間進(jìn)行兩層圖卷積,2個(gè)數(shù)據(jù)集的隱藏層nhid1都是512,輸出層nhid2都是128;120個(gè)標(biāo)簽節(jié)點(diǎn)的BlogCatalog數(shù)據(jù)集使用0.000 2的學(xué)習(xí)率進(jìn)行Adam優(yōu)化,180個(gè)標(biāo)簽節(jié)點(diǎn)的Flickr數(shù)據(jù)集使用0.000 3,除此之外,2個(gè)數(shù)據(jù)集的其他訓(xùn)練集都用0.000 5作為優(yōu)化函數(shù)的學(xué)習(xí)率。一致性約束系數(shù)θ和所取同質(zhì)型節(jié)點(diǎn)的個(gè)數(shù)k1及共引型節(jié)點(diǎn)的個(gè)數(shù)k2值將在后文進(jìn)行討論,根據(jù)分析結(jié)果取值,最終設(shè)置BlogCatalog數(shù)據(jù)集的一致性約束系數(shù)θ為1,k1取值為5,k2取值為6;Flickr數(shù)據(jù)集的一致性約束系數(shù)θ為0.1,k1取值為6,k2取值為3。

        3.2 實(shí)驗(yàn)結(jié)果與分析

        3.2.1實(shí)驗(yàn)結(jié)果

        社交網(wǎng)絡(luò)節(jié)點(diǎn)分類對(duì)比實(shí)驗(yàn)結(jié)果見(jiàn)表3。由實(shí)驗(yàn)結(jié)果可以得出,MAIF-GCN的準(zhǔn)確率(Accuracy)與F1-measure在2個(gè)數(shù)據(jù)集上都優(yōu)于所有對(duì)比模型。事實(shí)上,除卻本文中提出的MAIF-GCN,AM-GCN的準(zhǔn)確率和F1-measure都是最高的, 已被提出者證明其信息融合能力的優(yōu)越,而MAIF-GCN在此模型分類結(jié)果的基礎(chǔ)上,將BlogCatalog數(shù)據(jù)集的分類精確度和F1-measure指標(biāo)提高3%及以上,將Flickr數(shù)據(jù)集的分類精確度提高3%及以上、F1-measure指標(biāo)提高2%及以上,充分說(shuō)明本文模型在引入社會(huì)科學(xué)中的2種性質(zhì)后,具有更進(jìn)一步的信息挖掘與融合能力,證明了提出的兩類型節(jié)點(diǎn)在解決社交網(wǎng)絡(luò)節(jié)點(diǎn)分類時(shí)具有積極作用。

        表3 社交網(wǎng)絡(luò)節(jié)點(diǎn)分類實(shí)驗(yàn)結(jié)果

        3.2.2嵌入分布分析

        可視化各種嵌入方式的占比,直觀表示不同嵌入方式在分類時(shí)的占比情況,觀測(cè)提取的兩類型節(jié)點(diǎn)在社交網(wǎng)絡(luò)節(jié)點(diǎn)分類中的作用。單空間嵌入、兩兩單空間聯(lián)合嵌入和3個(gè)單空間聯(lián)合嵌入共同放進(jìn)注意力機(jī)制進(jìn)行融合,在得到最終嵌入的同時(shí),獲得各種嵌入的重要性。下載訓(xùn)練過(guò)程中各嵌入的注意力值,使用箱須圖進(jìn)行繪制,得到嵌入分布分析如圖2所示。

        Blogcatalog數(shù)據(jù)集上各嵌入方式(箱須圖橫軸從左往右)占比均值分別為:0.013,0.434,0.149,0.045,0.265,0.029,0.065;Flickr數(shù)據(jù)集上分別為:0.010,0.822,0.017,0.026,0.094,0.011,0.020。

        從圖2和嵌入占比均值可以直觀地看到每種嵌入的分布情況,并且總結(jié)出以下結(jié)論:① 同質(zhì)矩陣單空間嵌入在2種數(shù)據(jù)集中都占比最高,遠(yuǎn)超傳統(tǒng)鄰矩,充分說(shuō)明在社交網(wǎng)絡(luò)節(jié)點(diǎn)分類中,同質(zhì)型節(jié)點(diǎn)對(duì)分類節(jié)點(diǎn)的正向作用;② 同質(zhì)和共引矩陣空間的融合嵌入在2種數(shù)據(jù)集的嵌入中都占比次高,且在2個(gè)數(shù)據(jù)集的嵌入中,共引矩陣單空間嵌入都比鄰接矩陣單空間嵌入要高,這兩點(diǎn)證實(shí)了共引型節(jié)點(diǎn)同樣對(duì)被分類節(jié)點(diǎn)的精確分類有益;③ 單空間嵌入占比較大,但融合嵌入的比例同樣不可忽視,因此,在社交網(wǎng)絡(luò)節(jié)點(diǎn)分類時(shí),要挖掘融合多方面的信息,才能對(duì)節(jié)點(diǎn)進(jìn)行精確分類。

        圖2 嵌入分布分析

        3.2.3參數(shù)分析

        本文模型的超參數(shù)有k1、k2、θ、α、β。參數(shù)k1和k2是獲取的:“近鄰”個(gè)數(shù),這里的“近鄰”并非直觀意義上的位置相近,而是同質(zhì)或共引意義相近?;诹瓤臻g理論,k1、k2取值范圍以數(shù)字6為中心,分別測(cè)試兩類型的“近鄰”個(gè)數(shù)從2~9對(duì)分類產(chǎn)生的影響。圖3展示了k1取值(2~9)對(duì)節(jié)點(diǎn)分類精度的影響,圖4展示了k2取值(2~9)對(duì)節(jié)點(diǎn)分類精度的影響。

        圖3 參數(shù)k1分析

        圖4 參數(shù)k2分析

        參數(shù)θ是損失函數(shù)中共同一致性約束的系數(shù),調(diào)整θ即改變一致性約束對(duì)節(jié)點(diǎn)分類影響的力度,圖5展示了θ取值(0.000 1~10 000)對(duì)節(jié)點(diǎn)分類精度的影響。

        α、β是共同一致性約束中,2種單獨(dú)一致性約束的系數(shù),調(diào)節(jié)α、β值,就能調(diào)整3種單獨(dú)一致性約束在共同一致性約束中的占比。3種約束的占比情況由α、β共同決定,2個(gè)參數(shù)的實(shí)驗(yàn)數(shù)據(jù)單獨(dú)進(jìn)行可視化不夠直觀,將每組α、β的實(shí)驗(yàn)數(shù)據(jù)同時(shí)繪制,以便分析出更合理的超參數(shù)配比。圖6、圖7分別展示了α、β取值(0.000 1~10 000)對(duì)Blogcatalog、Flickr數(shù)據(jù)集節(jié)點(diǎn)分類精度的影響。

        圖5 參數(shù)θ分析

        圖6 參數(shù)α、β分析(Blogcatalog)

        圖7 參數(shù)α、β分析(Flickr)

        同質(zhì)最“近鄰”參數(shù)k1的分析見(jiàn)圖3,BlogCatalog隨著k1值的增加,分類精確度先增加再減少,類標(biāo)簽數(shù)為20、40、60的數(shù)據(jù)集分別在k1取5、8、4處獲得最優(yōu)。這可能是因?yàn)锽logCatalog隨著圖變得更密集,特征平滑,而且更大的k1可能引入更多的噪聲連邊。而Flickr的精確度在中間存在小波峰,隨著k1值的增加,精確度先增大后減小再趨于平緩,它可能同樣受特征平滑和噪聲的影響,類標(biāo)簽數(shù)為20、40、60的Flickr數(shù)據(jù)集都在k1取6或9處獲得最優(yōu)。

        共引最“近鄰”參數(shù)k2的分析見(jiàn)圖4。圖4中,BlogCatalog在類標(biāo)簽數(shù)為20時(shí),精確度隨k2的增加先增大后減小再趨于平緩,k2在6或9處取得最優(yōu);當(dāng)標(biāo)記數(shù)據(jù)增多,隨著k2值的增加,BlogCatalog的分類精確度先增加再減少,與k1情況相似,可能因BlogCatalog變得密集,特征平滑,或引入更多的噪聲連邊,類標(biāo)簽數(shù)為40和60的BlogCatalog數(shù)據(jù)集分別在k2取6和5處獲得最優(yōu)效果。Flickr的精確度波動(dòng)小,同樣是隨著k2值的增加,精確度先增大后減小,原因與BlogCatalog數(shù)據(jù)集一致,類標(biāo)簽數(shù)為20、40、60的Flickr數(shù)據(jù)集,都在k2取3時(shí)獲得最佳效果。

        共同一致性約束θ的分析見(jiàn)圖5,2個(gè)數(shù)據(jù)集的精確度,都隨著一致性約束系數(shù)θ的增加,先非常緩慢的上升,而后,BlogCatalog數(shù)據(jù)集以1為拐點(diǎn),F(xiàn)lickr數(shù)據(jù)集以0.1為拐點(diǎn),精確度隨著θ值的增加下降。兩數(shù)據(jù)集分別在θ取1和0.1左右獲得最優(yōu)效果?,F(xiàn)象表明,2個(gè)數(shù)據(jù)集都不期望從3個(gè)空間中提取出太相似的信息。

        一致性約束系數(shù)α、β分析見(jiàn)圖6、圖7。如圖6(a)所示,圓形標(biāo)記實(shí)線是超參數(shù)α的消融實(shí)驗(yàn)結(jié)果,此時(shí)β恒為1(第3種單獨(dú)約束系數(shù)一直為1),反映α對(duì)應(yīng)的單獨(dú)約束的占比對(duì)分類結(jié)果的影響;星形標(biāo)記線是超參數(shù)β的消融實(shí)驗(yàn)結(jié)果,此時(shí)α恒為1,反映β對(duì)應(yīng)的單獨(dú)約束的占比對(duì)分類結(jié)果的影響;X形標(biāo)記線是超參數(shù)α、β同時(shí)進(jìn)行消融實(shí)驗(yàn)的結(jié)果,此時(shí)第3種單獨(dú)約束仍為1,α、β取值的一致變化將改變第3種單獨(dú)約束的占比,反映了第3種單獨(dú)約束的占比對(duì)分類結(jié)果的影響,α、β取值越大,第3種約束占比越小。將每個(gè)數(shù)據(jù)集的3種單獨(dú)約束對(duì)分類結(jié)果的影響可視化到同一張圖上,觀測(cè)分析超參數(shù)α、β的配比。

        圖6中,所有子圖中的圓形標(biāo)記線大體呈上升趨勢(shì),α取值大,分類效果較好;子圖(a)中除波峰,星形標(biāo)記線大體呈下降趨勢(shì),β取值較小,分類效果好;子圖(c)中除波峰,星形標(biāo)記線大體呈上升趨勢(shì),說(shuō)明第3種約束占比小,α、β取值大于等于1(第3種單獨(dú)約束系數(shù)一直為1)。子圖(a)中,在類標(biāo)簽數(shù)為20的Blogcatalog數(shù)據(jù)集中,圓形標(biāo)記實(shí)線大體呈上升趨勢(shì),在1 000處達(dá)到峰值,星形標(biāo)記線在1處取得最大值,X形標(biāo)記線在10處取得最大值,再往后對(duì)精確度沒(méi)有影響,說(shuō)明α對(duì)應(yīng)約束占比最大,第3種約束占比最小,β值對(duì)應(yīng)約束較為折中取得最佳效果,但因X形標(biāo)記線后面趨于平緩,α取值不適宜過(guò)大。綜上,α值取100左右,β值取10左右時(shí),模型效果較好;在類標(biāo)簽數(shù)為40和60的Blogcatalog數(shù)據(jù)集中,圓形標(biāo)記實(shí)線呈上升趨勢(shì),在1 000處達(dá)到峰值,星形標(biāo)記線和X形標(biāo)記線都在0.1處取得最大值,β對(duì)應(yīng)約束應(yīng)比另外兩約束小,α值取10左右,β值取0.1左右時(shí),模型效果較好。

        圖7中,3個(gè)子圖的圓形標(biāo)記實(shí)線和星形標(biāo)記線走向幾乎相反,說(shuō)明在Flickr數(shù)據(jù)集上,類標(biāo)簽個(gè)數(shù)對(duì)一致性約束占比有影響,需要逐個(gè)分析。圖7(a)中,圓形標(biāo)記實(shí)線在0.1處取得最大值,星形標(biāo)記線和X形標(biāo)記線都在10處取得最大值,α值對(duì)應(yīng)一致性約束占比小,β值對(duì)應(yīng)一致性約束占比大,第3種約束占比小。綜上,在類標(biāo)簽數(shù)為20的Flickr數(shù)據(jù)集上,α值取1,獲得的模型效果較好,β值取10左右模型效果較好。圖7(b)中,圓形標(biāo)記實(shí)線不隨值的變化改變走向,星形標(biāo)記線和X形標(biāo)記線都在10處取得最大值,β值對(duì)應(yīng)一致性約束占比大,第3種約束占比小,α值對(duì)應(yīng)一致性約束的占比比β大,比第3種約束小,α值取5左右,β值取10左右獲取的模型效果較好。圖7(c)中,圓形標(biāo)記實(shí)線在10處達(dá)到最大值,且取值再往上精確度不變,星形標(biāo)記線在0.1處取得最大值,X形標(biāo)記線在100處取得最大值,第3種約束占比最小。綜上,α值對(duì)應(yīng)約束占比大,β值對(duì)應(yīng)約束占比小,但比第3種約束占比大,α值取5左右,β值取10左右獲取的模型效果較好。

        對(duì)不同數(shù)據(jù)集,給出的α、β近似值的模型的分類結(jié)果比取距離該近似值較遠(yuǎn)的值高0.2%~0.8%,且分類精確度對(duì)α、β的取值不敏感,一定范圍(20左右)內(nèi)變化非常小,可忽略不計(jì)。

        3.2.4剝離實(shí)驗(yàn)分析

        為了進(jìn)一步評(píng)估本文模型各模塊的有效性,進(jìn)行剝離實(shí)驗(yàn),將MAIF-GCN及其4種變體在所有數(shù)據(jù)集上的分類結(jié)果進(jìn)行比較。對(duì)比分類實(shí)驗(yàn)結(jié)果見(jiàn)表4。

        1) GCN:沒(méi)有同質(zhì)矩陣空間和共引矩陣空間的MAIF-GCN模型。不存在同質(zhì)矩陣空間和共引矩陣空間的嵌入,節(jié)點(diǎn)只在鄰接矩陣空間進(jìn)行卷積操作,進(jìn)而分類,模型退化為傳統(tǒng)的GCN模型。

        2) MAIF-GCN-F:沒(méi)有同質(zhì)矩陣空間的MAIF-GCN模型(只有鄰接矩陣嵌入、共引矩陣嵌入及兩者的組合嵌入)。

        3) MAIF-GCN-Co:沒(méi)有共引矩陣空間的MAIF-GCN模型(只有鄰接矩陣嵌入、同質(zhì)矩陣嵌入及兩者的組合嵌入)。

        4) MAIF-GCN-cst:去掉一致性約束的MAIF-GCN模型。不對(duì)各單空間嵌入進(jìn)行一致性約束,只通過(guò)模型訓(xùn)練,將各種嵌入進(jìn)行組合和融合,進(jìn)而進(jìn)行分類的MAIF-GCN模型。

        表4 MAIF-GCN及其變體模型節(jié)點(diǎn)分類實(shí)驗(yàn)結(jié)果

        分析表4,可以得出以下結(jié)論:① MAIF-GCN的結(jié)果始終優(yōu)于其他4種變體,表明引入并結(jié)合利用同質(zhì)矩陣和共引矩陣空間,進(jìn)行3種單空間嵌入的一致性約束是有效的。② MAIF-GCN-F和MAIF-GCN-Co的分類精確度都比GCN的高,分別表明了共引矩陣空間和同質(zhì)矩陣空間的有效性。③ MAIF-GCN-Co的結(jié)果比MAIF-GCN-F好,意味著同質(zhì)性在本模型中起著更重要的作用。④ 對(duì)比MAIF-GCN-cst和表3中的其他實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),MAIF-GCN-cst雖然沒(méi)進(jìn)行約束,但仍取得了對(duì)抗baseline的非常有競(jìng)爭(zhēng)力的表現(xiàn)。

        3.2.5不同類型數(shù)據(jù)集驗(yàn)證實(shí)驗(yàn)

        為了進(jìn)一步驗(yàn)證所提出模型的效性,驗(yàn)證利用2種性質(zhì)在解決社交網(wǎng)絡(luò)節(jié)點(diǎn)分類問(wèn)題時(shí)真實(shí)有效,使用不同類型的數(shù)據(jù)集進(jìn)行對(duì)比實(shí)驗(yàn)分析。

        將社交網(wǎng)絡(luò)數(shù)據(jù)集ego-Facebook[20]中的2個(gè)網(wǎng)絡(luò)進(jìn)行處理,用于節(jié)點(diǎn)分類對(duì)比實(shí)驗(yàn)。該數(shù)據(jù)集因收集的節(jié)點(diǎn)特征不同分為10個(gè)小網(wǎng)絡(luò),取其中缺失標(biāo)簽較少、節(jié)點(diǎn)個(gè)數(shù)較多,且類別較多的網(wǎng)絡(luò)0(后稱FaceNet_0)和網(wǎng)絡(luò)1912(后稱FaceNet_1912)進(jìn)行實(shí)驗(yàn),清洗掉網(wǎng)絡(luò)中缺失特征或標(biāo)簽的節(jié)點(diǎn),進(jìn)行數(shù)據(jù)規(guī)整化后進(jìn)行分類,驗(yàn)證模型在分類類別較多時(shí)的性能。同時(shí),使用另一社區(qū)檢測(cè)數(shù)據(jù)集UAI2010和其他2個(gè)不同類型的數(shù)據(jù)集進(jìn)行對(duì)比實(shí)驗(yàn)分析,對(duì)比本文模型在不同類型數(shù)據(jù)集上的分類效果。驗(yàn)證實(shí)驗(yàn)數(shù)據(jù)集信息見(jiàn)表5。

        表5 用于模型驗(yàn)證的數(shù)據(jù)集信息

        1) FaceNet_0[20]:Facebook社交網(wǎng)絡(luò)小子集,節(jié)點(diǎn)特征為Facebook用戶的性別、生日等屬性信息,圖由用戶間的朋友關(guān)系組成,將用戶所屬的圈子作為類別,所有節(jié)點(diǎn)劃分為25類。

        2) FaceNet_1912[20]:Facebook社交網(wǎng)絡(luò)小子集,節(jié)點(diǎn)特征為Facebook用戶的性別、生日等屬性信息(與Facebook_0不完全相同),圖由用戶間的朋友關(guān)系組成,將用戶所屬的圈子作為類別,所有節(jié)點(diǎn)劃分為47類。

        3) Citeseer[7]:引文網(wǎng)絡(luò)。節(jié)點(diǎn)代表文章,圖表示文章之間的引用關(guān)系,標(biāo)簽用于識(shí)別文章所屬的類別,所有節(jié)點(diǎn)劃分為6類。

        4) UAI2010[21]:一個(gè)已經(jīng)在圖卷積網(wǎng)絡(luò)中進(jìn)行了社區(qū)檢測(cè)測(cè)試的數(shù)據(jù)集,所有節(jié)點(diǎn)劃分為19類。

        5) ACM[22]:從ACM數(shù)據(jù)集中提取,節(jié)點(diǎn)代表文章,特征是文章關(guān)鍵詞的詞袋表示,圖的連邊代表兩篇論文出自同一作者,所有節(jié)點(diǎn)劃分為3類。

        不同類型的數(shù)據(jù)集進(jìn)行節(jié)點(diǎn)分類的實(shí)驗(yàn)結(jié)果見(jiàn)表6。本小節(jié)所有對(duì)比模型都在相應(yīng)論文建議的參數(shù)基礎(chǔ)上進(jìn)行調(diào)優(yōu),以求更高的精度。

        表6 不同類型數(shù)據(jù)集實(shí)驗(yàn)結(jié)果

        通過(guò)實(shí)驗(yàn)結(jié)果可以看到:MAIF-GCN在前3個(gè)數(shù)據(jù)集上的分類結(jié)果明顯優(yōu)于其他模型,提高1%及以上;MAIF-GCN作用于后2個(gè)數(shù)據(jù)集上時(shí),鮮少有分類精度不變或降低的情況,有的數(shù)據(jù)集存在較小提升。前3個(gè)數(shù)據(jù)集是社交網(wǎng)絡(luò)數(shù)據(jù)集(UAI2010是用于社區(qū)探測(cè)的數(shù)據(jù)集,能夠歸為社交網(wǎng)絡(luò)一列),網(wǎng)絡(luò)存在本文模型引入的2種性質(zhì),因此本文模型能夠產(chǎn)生效用,從對(duì)比實(shí)驗(yàn)結(jié)果看也的確如此。后2個(gè)數(shù)據(jù)集不屬于社交網(wǎng)絡(luò)范疇,模型引入的2種性質(zhì)不一定存在于后2種網(wǎng)絡(luò),從結(jié)果也可以看出,后2個(gè)數(shù)據(jù)集分類精度雖提升卻有限,且存在不提升或略有降低的情況,但不提升和降低的情況極少,多數(shù)精度仍是提升的。由實(shí)驗(yàn)結(jié)果分析得出:

        1) MAIF-GCN在處理社交網(wǎng)絡(luò)節(jié)點(diǎn)分類的問(wèn)題上具有積極作用;在不同的社交網(wǎng)絡(luò)數(shù)據(jù)集上總能取得較好的效果體現(xiàn)了MAIF-GCN的泛化能力。

        2) 其他類型數(shù)據(jù)集上的分類精度不提升或降低的情況極少,展現(xiàn)了MAIF-GCN的優(yōu)越性。

        4 結(jié)論

        根據(jù)社交網(wǎng)絡(luò)中存在的同質(zhì)性和共引規(guī)律這2種性質(zhì),提取出兩類對(duì)社交網(wǎng)絡(luò)中被分類節(jié)點(diǎn)產(chǎn)生正向影響的節(jié)點(diǎn):①和被分類節(jié)點(diǎn)有著相似屬性(相似特征向量)的同質(zhì)型節(jié)點(diǎn);②和被分類節(jié)點(diǎn)鏈接著較多相同節(jié)點(diǎn)(相似領(lǐng)域節(jié)點(diǎn))的共引型節(jié)點(diǎn)。分別計(jì)算特征向量和鄰接矩陣中鏈接向量的相似程度,選取同質(zhì)性相似度最高的前k1個(gè)節(jié)點(diǎn)和共引性相似度最高的前k2個(gè)節(jié)點(diǎn),構(gòu)建兩類型節(jié)點(diǎn)相應(yīng)的同質(zhì)矩陣空間和共引矩陣空間。在構(gòu)建的2個(gè)矩陣空間進(jìn)行卷積,融合相應(yīng)類型的節(jié)點(diǎn)信息。為了更好地融合各角度提取到的信息,除了單獨(dú)在矩陣空間進(jìn)行卷積,還將不同空間卷積的結(jié)果相加,通過(guò)注意力機(jī)制,將提取到的各類型信息進(jìn)一步融合,最終進(jìn)行分類,提高分類精度。

        本文中提出的MAIF-GCN模型挖掘并融合了相鄰節(jié)點(diǎn)、同質(zhì)型節(jié)點(diǎn)及共引型節(jié)點(diǎn)3種不同類型的關(guān)系節(jié)點(diǎn),聚合了鄰接鄰居、同質(zhì)最近鄰、共引最近鄰及三者組合的多角度的信息。在傳統(tǒng)社交網(wǎng)絡(luò)數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),MAIF-GCN的分類精度比最先進(jìn)的分類模型高,證明了提出的兩類型節(jié)點(diǎn)對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)分類具有正向影響,證實(shí)了MAIF-GCN模型合理有效。

        猜你喜歡
        約束卷積社交
        社交之城
        社交牛人癥該怎么治
        意林彩版(2022年2期)2022-05-03 10:25:08
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        “碳中和”約束下的路徑選擇
        約束離散KP方程族的完全Virasoro對(duì)稱
        社交距離
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        你回避社交,真不是因?yàn)閮?nèi)向
        文苑(2018年17期)2018-11-09 01:29:28
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        適當(dāng)放手能讓孩子更好地自我約束
        人生十六七(2015年6期)2015-02-28 13:08:38
        国产婷婷成人久久av免费| 中文字幕无码日韩欧毛| 欧美—iGAO视频网| 一本色道精品亚洲国产一区| 亚洲av综合色区无码专区桃色| 激情亚洲一区国产精品| 日韩精品无码一本二本三本色| 熟女无套内射线观56| 国产精品刺激好大好爽视频| 亚洲av套图一区二区| 91视色国内揄拍国内精品人妻| 国产免费久久精品99久久| 天干天干啦夜天干天2017| 精品九九视频| 国产高清不卡二区三区在线观看| 中文字幕一区久久精品| 日韩精品一区二区午夜成人版| 国产专区国产av| 亚洲人成影院在线高清| 日本免费看一区二区三区| 人人鲁人人莫人人爱精品| 无码手机线免费观看| 在线观看精品视频一区二区三区 | 成人性生交大片免费看i| 欧美成人家庭影院| 久久精品娱乐亚洲领先| 色欲AV无码久久精品有码| 亚洲中文乱码在线观看| 久久久久人妻一区二区三区| 在线观看国产精品日韩av| 杨幂国产精品一区二区| 在线播放草猛免费视频| 免费人成视频xvideos入口| 精选麻豆国产AV| 日本韩国一区二区高清| 国产精品av在线| 在线观看av中文字幕不卡| 中文字幕精品乱码一二三区| 国精产品一区一区二区三区mba| 欧美极品jizzhd欧美| 老汉tv永久视频福利在线观看|