李 陽 呂 欣
(國家信息中心博士后科研工作站 北京 100045)
基于關(guān)鍵節(jié)點的社會網(wǎng)絡(luò)治理路徑研究
李 陽 呂 欣
(國家信息中心博士后科研工作站 北京 100045)
(liyang_cas@163.com)
互聯(lián)網(wǎng)+時代的到來,社會網(wǎng)絡(luò)被賦予了全新的內(nèi)涵與功能,其中關(guān)鍵節(jié)點在拓撲結(jié)構(gòu)中占據(jù)了重要的位置,在社會網(wǎng)絡(luò)中承載著重要的功能.隨著社會網(wǎng)絡(luò)中數(shù)據(jù)規(guī)模的不斷增加,關(guān)鍵節(jié)點的承載數(shù)據(jù)蘊含了重要的價值,立足對關(guān)鍵節(jié)點的挖掘,發(fā)揮關(guān)鍵節(jié)點在社會網(wǎng)絡(luò)中的導(dǎo)向作用,有利于了解社會網(wǎng)絡(luò)的運行機理與規(guī)律,進一步創(chuàng)新社會網(wǎng)絡(luò)治理方式,使之更好地服務(wù)于我國的經(jīng)濟社會.
社會網(wǎng)絡(luò);關(guān)鍵節(jié)點;拓撲結(jié)構(gòu);信息傳播;主題模型
隨著信息化時代的到來,互聯(lián)網(wǎng)日益融入到我們的經(jīng)濟、工作、生活當中,隨著互聯(lián)網(wǎng)+行動計劃的實施,社會網(wǎng)絡(luò)繼續(xù)深入到了我們生活的各個領(lǐng)域,被賦予了全新的內(nèi)涵,擴展了豐富的功能,我們置身于一種泛社會化的網(wǎng)絡(luò)之中.
在社會網(wǎng)絡(luò)中,節(jié)點被抽象為行動主體,邊被抽象為行動主體之間的聯(lián)系,節(jié)點可以作為一種組織結(jié)構(gòu)、一個商家、一個用戶等等,政府機構(gòu)、企業(yè)、用戶等等在線上的社會網(wǎng)絡(luò)中交互共存.因此,在日益網(wǎng)絡(luò)泛化與功能擴展的社會網(wǎng)絡(luò)中,關(guān)鍵節(jié)點越來越發(fā)揮著重要的作用,例如政府機構(gòu)可以進行政務(wù)信息發(fā)布、突發(fā)公共事件監(jiān)測等,企業(yè)可以進行市場營銷、廣告投放等,個人可以關(guān)注經(jīng)濟生活、快速分享興趣等;與此同時,在管理措施與技術(shù)手段相對滯后的情況下,也出現(xiàn)了一些信息泄露、金融詐騙、謠言傳播等事件,在知名博主、大V用戶等關(guān)鍵節(jié)點的分享與轉(zhuǎn)發(fā)下,造成了級聯(lián)的擴散,帶來了一定的負面影響.
立足于對社會網(wǎng)絡(luò)中關(guān)鍵節(jié)點的挖掘研究,展開對其結(jié)構(gòu)承載功能的統(tǒng)計分析,有利于及時了解社會網(wǎng)絡(luò)上的社會民生、公共事件、經(jīng)濟生活等信息,具有重要的導(dǎo)向作用,能夠進一步創(chuàng)新社會網(wǎng)絡(luò)的治理,提高社會網(wǎng)絡(luò)的管理水平.
關(guān)鍵節(jié)點在社會網(wǎng)絡(luò)中發(fā)揮了重要的作用,因此立足于關(guān)鍵節(jié)點的研究,有助于深化理解社會網(wǎng)絡(luò)運行機理,早期對關(guān)鍵節(jié)點的研究是從拓撲結(jié)構(gòu)開始的.
2.1 基于拓撲結(jié)構(gòu)
在基于圖的拓撲結(jié)構(gòu)的基礎(chǔ)上,早期的研究者認為節(jié)點在網(wǎng)絡(luò)中的位置反映了其重要程度,主要通過度中心性、接近中心性、介數(shù)中心性、特征向量中心性、子圖中心性、k-shell分解法、結(jié)構(gòu)洞、PageRank等方法來評估節(jié)點的重要性.
早期的這些研究中主要以拓撲特征為指標,對節(jié)點的局部拓撲重要性進行度量.但是隨著網(wǎng)絡(luò)上功能的不斷擴展與泛化,出現(xiàn)了更多的社區(qū)結(jié)構(gòu)、主題興趣、信息傳播等領(lǐng)域,因此在拓撲結(jié)構(gòu)分析的基礎(chǔ)上,需要融入更多的屬性要素來深化對關(guān)鍵節(jié)點的研究.
2.2 基于信息傳播
隨著傳播動力學研究的深入,研究者認為具有網(wǎng)絡(luò)連通性強的節(jié)點在信息傳播過程中有助于信息傳播.早期的信息擴散研究是以傳染病模型為主在復(fù)雜網(wǎng)絡(luò)上展開研究的,將節(jié)點視為活動主體并具有3種狀態(tài):易感染態(tài)S、感染態(tài)I以及免疫態(tài)R,基于傳染病模型的主要研究主要集中于SI模型、SIS模型以及SIR模型等.
隨著網(wǎng)絡(luò)科學理論研究的深入,研究者開始從社會學角度出發(fā),在社交網(wǎng)絡(luò)中建立信息傳播模型,根據(jù)模擬傳播的范圍來度量關(guān)鍵用戶的影響力,來進一步挖掘關(guān)鍵用戶,即影響力最大化問題[1-6].
社會學模型主要考慮的是概率問題,隨著研究問題的深入和細化,信息傳播更多需要考慮主題性、相關(guān)性等問題,使得經(jīng)典的社會學模型無法面向場景地評估應(yīng)對信息傳播,還有待對傳播模型進行改進.
2.3 基于主題模型
社會網(wǎng)絡(luò)中節(jié)點關(guān)聯(lián)的內(nèi)容信息對節(jié)點的重要性評估具有現(xiàn)實意義.一些意見領(lǐng)袖的關(guān)注興趣常常吸引粉絲的關(guān)注與分享,一些用戶的消費習慣常常有助于進行廣告營銷,如何基于節(jié)點的關(guān)聯(lián)內(nèi)容信息,將無結(jié)構(gòu)的原始文本數(shù)據(jù)轉(zhuǎn)化為面向主題的屬性計算具有重要的意義.目前一些計算方法主要包括布爾模型、向量空間模型[7]、概率主題模型[8-10]等.
基于內(nèi)容的主題模型,在節(jié)點的內(nèi)容關(guān)聯(lián)分析方面提供了基于概率的量化方案,但是隨著互聯(lián)網(wǎng)+時代的到來,數(shù)據(jù)的多源性、異構(gòu)性、時序性成為關(guān)注的要點,同時如何融合多源的語義分析需要主題模型的進一步改進.
隨著物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等信息化技術(shù)的蓬勃發(fā)展,互聯(lián)網(wǎng)把人、機、物等都連接在一起,社會網(wǎng)絡(luò)與各個領(lǐng)域行業(yè)進行了深度的融合,功能得到了極大的擴展,進入了一個范圍更大的異質(zhì)、泛化的經(jīng)濟與社會網(wǎng)絡(luò).同時,當前社會網(wǎng)絡(luò)的發(fā)展上面臨以下特點.
3.1 管理扁平化
在互聯(lián)網(wǎng)+時代,商業(yè)流、金融流、服務(wù)流、通信流等趨勢的加速,公眾可以成為自媒體,充分表達個人訴求或者群體民意;同時在多主體、多社區(qū)、多訴求的背景下,公眾的關(guān)注需求瞬息萬變.傳統(tǒng)金字塔式的管理方式無法應(yīng)對快速發(fā)展的社會網(wǎng)絡(luò),隨著時間上的滯后與信息上的缺失會導(dǎo)致整體決策的效力低下.扁平化的管理縮短了組織層級、打通了層級壁壘、下移了主體權(quán)限,在經(jīng)濟領(lǐng)域已凸顯其推動作用,社會治理領(lǐng)域也需要順應(yīng)發(fā)展趨勢,積極借鑒扁平化方式.對于政府而言,需要及時對公共事件作出了解掌握,快速回應(yīng)社會網(wǎng)絡(luò)反映的社情民意;對于企業(yè)而言,需要圍繞用戶多樣化需求,快速應(yīng)對市場活動.
3.2 數(shù)據(jù)規(guī)?;?/p>
在互聯(lián)網(wǎng)+時代,隨著社會網(wǎng)絡(luò)與各個領(lǐng)域的深度融合,公眾是數(shù)據(jù)的使用者,也伴隨著數(shù)據(jù)的記錄、積累、共享、傳播等行為,成為數(shù)據(jù)的生產(chǎn)者.例如2011年美國弗吉尼亞地震中,在此期間用戶利用社交媒體不斷地制作、加工、分享、轉(zhuǎn)發(fā)數(shù)據(jù),猶如一個個傳感器,以至于信息傳播速度超過了地震波的震感.這種通過群體實時產(chǎn)生數(shù)據(jù)的方式產(chǎn)生了規(guī)模越來越大的數(shù)據(jù),也可稱為帶有時間性和空間性的時空大數(shù)據(jù).大數(shù)據(jù)的意義在于蘊含的重要價值,隨著計算能力的逐步提升,對于大數(shù)據(jù)的存儲、計算、可視化等技術(shù)也在不斷提高,面對數(shù)據(jù)規(guī)模不斷的增長,當前提高對大數(shù)據(jù)的計算與挖掘能力顯得尤為關(guān)鍵.
3.3 主體征信化
社會網(wǎng)絡(luò)上的確產(chǎn)生了大量的數(shù)據(jù),同時也充斥著大量的虛假信息,因此真實、可信數(shù)據(jù)能夠降低經(jīng)濟成本、增強社會互信.由于管理與措施的相對滯后,出現(xiàn)了類如P2P網(wǎng)貸的信用問題、層出不窮的信息詐騙等事件,如果不加強征信體系建設(shè),將無法為經(jīng)濟社會的發(fā)展提供安全保障.面向互聯(lián)網(wǎng)的大規(guī)模數(shù)據(jù),深入挖掘相關(guān)性信息,立足于拓撲、區(qū)域、場景、消費等多維度建立指標框架,為主體信用體系的評估融入多源數(shù)據(jù)資源成為一個重要的手段.因此,基于社會網(wǎng)絡(luò)上大規(guī)模的多源異構(gòu)數(shù)據(jù),客觀公正地對社會主體信用進行量化評估,將有利于促進社會信用體系建設(shè).
當前處于社會網(wǎng)絡(luò)發(fā)展的融合期,在我們不斷用信息化技術(shù)來擴展社會網(wǎng)絡(luò)功能的同時,也衍生了一系列的管理滯后與信息安全方面的問題.針對社會網(wǎng)絡(luò)而言,通過對其支撐結(jié)構(gòu)和承載功能的關(guān)鍵節(jié)點展開研究,可以為我們創(chuàng)新治理社會網(wǎng)絡(luò)積極發(fā)揮導(dǎo)向作用.為了更好地推進社會網(wǎng)絡(luò)治理,使之能夠更好地服務(wù)于經(jīng)濟生活,提出以下建議.
4.1 拓展社區(qū)發(fā)現(xiàn)方法,深化異質(zhì)網(wǎng)絡(luò)互聯(lián)
基于互聯(lián)網(wǎng)+融合所形成的異質(zhì)社會互聯(lián)網(wǎng)絡(luò),需要根據(jù)結(jié)構(gòu)與功能定位,研究結(jié)構(gòu)形成機理與社區(qū)凝聚策略,建立異質(zhì)社區(qū)劃分的評估標準,為社會網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)與功能分類提供支撐.以在線社會網(wǎng)絡(luò)為例,通過分析節(jié)點之間的鏈接結(jié)構(gòu)、節(jié)點的主題特征以及節(jié)點的交互行為等信息,來發(fā)現(xiàn)層次化、重疊化社區(qū),有助于更好的社區(qū)管理、社區(qū)自治、商業(yè)的廣告投放與市場營銷等.
4.2 深化區(qū)域節(jié)點定位,適應(yīng)網(wǎng)絡(luò)去中心化
當前社會網(wǎng)絡(luò)的逐步發(fā)展,關(guān)鍵節(jié)點(例如大V用戶)的形成,將現(xiàn)實社會中的權(quán)利不對等進一步放大,因此越來越多主題社區(qū)、興趣圈子的出現(xiàn),趨向于用戶越來越追求平等化、自組織的權(quán)利.隨著社會網(wǎng)絡(luò)功能的不斷擴展與延伸,需要積極順應(yīng)去中心化的趨勢,尤其應(yīng)加大區(qū)域節(jié)點的定位,綜合關(guān)聯(lián)分析節(jié)點的社區(qū)屬性在網(wǎng)絡(luò)結(jié)構(gòu)中承載的功能.例如對區(qū)域性關(guān)鍵節(jié)點進行定位,對跨社區(qū)的橋節(jié)點進行統(tǒng)計,可以為金融、商業(yè)等領(lǐng)域的精準營銷、客戶定制提供量化參考.
4.3 研制數(shù)據(jù)匯聚標準,推動節(jié)點多源融合
面對大規(guī)模多源信息的整合,尤其是包括大量的非結(jié)構(gòu)化數(shù)據(jù),缺乏統(tǒng)一的標準,勢必降低大數(shù)據(jù)整合的價值.建立多源數(shù)據(jù)的匯聚標準,通過提出多特征識別的融合算法,對具有不同特征模式的多源信息進行梳理,加強多源信息的互補集成,建立一種基于知識規(guī)則的表征框架,將多源異質(zhì)的大數(shù)據(jù)轉(zhuǎn)換為支撐分析的小數(shù)據(jù),改善大數(shù)據(jù)環(huán)境下計算損耗的決策問題.
4.4 加強數(shù)據(jù)融合分析,建立節(jié)點征信體系
社會網(wǎng)絡(luò)上隱私泄露、信息詐騙等問題,對互聯(lián)網(wǎng)時代的社會信任體系提出了嚴峻挑戰(zhàn),充分融合多源異質(zhì)的互聯(lián)網(wǎng)數(shù)據(jù),可以作為傳統(tǒng)征信體系的有力補充.健全信息采集的立法工作,明確面向個人互聯(lián)網(wǎng)數(shù)據(jù)的采集、存儲、加工、交易等領(lǐng)域規(guī)范細則,推進征信業(yè)務(wù)開展的有法可依;構(gòu)建綜合的征信指標體系,基于大數(shù)據(jù)計算技術(shù),分別面向個人、組織、企業(yè)、政府等領(lǐng)域,通過對節(jié)點的多源數(shù)據(jù)進行融合分析,將更多直接信用記錄以外的間接數(shù)據(jù)納入到計算框架中,服務(wù)于金融領(lǐng)域、商業(yè)領(lǐng)域、行政監(jiān)管等場景領(lǐng)域,推動社會信用體系建設(shè).
4.5 構(gòu)建節(jié)點評估指標,加強網(wǎng)絡(luò)態(tài)勢感知
面向社會網(wǎng)絡(luò)的關(guān)鍵節(jié)點,以功能承載為依托,對關(guān)鍵節(jié)點進行梳理、匯總、分類,以此有效整合關(guān)聯(lián)的拓撲結(jié)構(gòu)、社情民意、熱點追蹤等關(guān)聯(lián)要素,構(gòu)建起多層次、多維度的指標體系,通過對關(guān)鍵節(jié)點進行客觀、科學的評估,充分發(fā)揮關(guān)鍵節(jié)點在社會網(wǎng)絡(luò)中的導(dǎo)向作用,推動對社會網(wǎng)絡(luò)的公共事件態(tài)勢進行感知,為政府公共服務(wù)、金融商業(yè)營銷等提供科學支撐,為公眾提供優(yōu)質(zhì)化的社會網(wǎng)絡(luò)服務(wù),進而推動我國經(jīng)濟社會的健康發(fā)展.
人類社會已經(jīng)進入信息化的互聯(lián)網(wǎng)+時代,社會網(wǎng)絡(luò)承載著更為廣闊的功能,在經(jīng)濟、社會、文化、軍事等領(lǐng)域發(fā)揮著重要的作用,也深刻影響著公眾利益與國家安全.因此,要深刻領(lǐng)會創(chuàng)新社會網(wǎng)絡(luò)治理的理念,著重以關(guān)鍵節(jié)點挖掘為立足點,理解社會網(wǎng)絡(luò)的運行機理,通過加強社區(qū)發(fā)現(xiàn)、數(shù)據(jù)融合、征信體系、量化評估等方法,發(fā)揮關(guān)鍵節(jié)點在社會網(wǎng)絡(luò)中的導(dǎo)向作用,積極響應(yīng)社會網(wǎng)絡(luò)上發(fā)生的社情民意,提高社會網(wǎng)絡(luò)的綜合治理與惠民服務(wù)水平,促進經(jīng)濟社會的健康發(fā)展,建立起社會網(wǎng)絡(luò)創(chuàng)新治理的長效機制.
[1]Domingos P, Richardson M. Mining the network value of customers[C] //Proc of the 7th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2001: 57-66
[2]Richardson M, Domingos P. Mining knowledge-sharing sites for viral marketing[C] //Proc of the 8th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2002: 61-70
[3]Granovetter M. Threshold models of collective behavior[J]. American Journal of Sociology, 1978, 83(6): 1420-1443
[4]Goldenberg J, Libai B, Muller E. Talk of the network: A complex systems look at the underlying process of word-of-mouth[J]. Marketing Letters, 2001, 12(3): 211-223
[5]Goldenberg J, Libai B, Muller E. Using complex systems analysis to advance marketing theory development: Modeling heterogeneity effects on new product growth through stochastic cellular automata[J]. Academy of Marketing Science Review, 2001, 31(3): 8-11
[6]Kempe D, Kleinberg J, Tardos é. Maximizing the spread of influence through a social network[C] //Proc of the 9th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2003: 137-146
[7]Salton G, Wong A, Yang C S. A vector space model for automatic indexing[J]. Communications of the ACM, 1975, 18(11): 613-620
[8]Deerwester S C, Dumais S T, Landauer T K, et al. Indexing by latent semantic analysis[J]. JASIS, 1990, 41(6): 391-407
[9]Hofmann T. Probabilistic latent semantic indexing[C] //Proc of the 22nd ACM SIGIR Int Conf on Research and Development in Information Retrieval. New York: ACM, 1999: 50-57
[10]Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022
李 陽
博士,高級工程師,主要研究方向為社交網(wǎng)絡(luò)、信息安全、數(shù)據(jù)挖掘.
liyang_cas@163.com
呂 欣
博士,國家信息中心副研究員,主要研究方向為網(wǎng)絡(luò)安全評價體系、網(wǎng)絡(luò)安全戰(zhàn)略、網(wǎng)絡(luò)空間安全體系結(jié)構(gòu).
lux@cei.gov.cn
The Research of Governance Path of Social Network Based on the Key Node
Li Yang and Lü Xin
(PostdoctoralScientificWorkstation,StateInformationCenter,Beijing100045)
With the advent of the internet plus era, social network has been given new functions and meanings, in which the key nodes occupy a crucial position in the topology, and bear significant functions in the social network. With the increase of data scale in social network, the holding data in the key nodes contains a great value, standing on the mining of key nodes and playing an oriented role of key nodes in social network which can help us to understand the operating mechanism and regularity of social network, further govern social network with innovativeness, and serve our economic society effectively.
social network; key nodes; topology; information propagation; topic model
2016-11-30
國家社科基金重大項目(11&ZD061)
TP309