亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社交網(wǎng)絡(luò)分析的詐騙團(tuán)體挖掘方法研究

        2018-05-25 08:50:48賈志娟
        關(guān)鍵詞:特征文本分析

        賈志娟,趙 靚,周 娜

        (鄭州師范學(xué)院 信息科學(xué)與技術(shù)學(xué)院,河南 鄭州 450044)

        0 引 言

        根據(jù)2015年發(fā)布的《中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2016年6月,中國(guó)網(wǎng)民規(guī)模達(dá)7.10億,互聯(lián)網(wǎng)普及率達(dá)到51.7%,超過全球平均水平3.1個(gè)百分點(diǎn)。同時(shí),國(guó)內(nèi)微博用戶總量從12年的2.74億增長(zhǎng)到15年底的5.03億,可見增長(zhǎng)之迅速。作為一種新興的社交媒體,微博作為信息發(fā)布和傳播的主流平臺(tái),正在逐漸改變著人們的生活方式。網(wǎng)民們熱衷于在微博上分享自己的心情,評(píng)論當(dāng)前流行的元素,探討當(dāng)今的社會(huì)熱點(diǎn),并關(guān)注自己的喜好,這給微博的數(shù)據(jù)挖掘帶來(lái)了相當(dāng)大的價(jià)值,同時(shí)也使得詐騙團(tuán)體的行動(dòng)更加便利[1-2]。

        社會(huì)網(wǎng)絡(luò)以用戶為基礎(chǔ),具有主體繁多、用戶影響力差異顯著、用戶特征與信息資源復(fù)雜且事件突發(fā)性強(qiáng)等特性。中國(guó)社會(huì)網(wǎng)絡(luò)環(huán)境比較復(fù)雜,尤其是詐騙謠言等信息對(duì)社會(huì)的影響較大,引導(dǎo)不當(dāng)極易引發(fā)社會(huì)矛盾。微博的出現(xiàn)進(jìn)一步推動(dòng)了社會(huì)網(wǎng)絡(luò)的發(fā)展。而且微博具有較為活躍的用戶量,若僅僅依靠傳統(tǒng)的統(tǒng)計(jì)方法無(wú)法高效地提取有價(jià)值的信息,這就急需一種更高效的技術(shù)能對(duì)海量文本數(shù)據(jù)進(jìn)行分析和挖掘,社會(huì)網(wǎng)絡(luò)分析和數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。因此利用社會(huì)網(wǎng)絡(luò)分析和數(shù)據(jù)挖掘技術(shù)對(duì)微博中詐騙團(tuán)體的語(yǔ)言行為進(jìn)行研究是可行的而且是很有必要的[3-4]。

        對(duì)此,國(guó)內(nèi)外相關(guān)學(xué)者做了大量研究。張劭捷等將垂直搜索的技術(shù)、文本分析和挖掘的技術(shù)應(yīng)用于微博的輿情分析,分析了網(wǎng)絡(luò)熱點(diǎn)話題的發(fā)現(xiàn)模型等,并設(shè)計(jì)了一個(gè)基于微博設(shè)計(jì)網(wǎng)絡(luò)的輿情分析系統(tǒng)[5];繆茹一等對(duì)微博進(jìn)行細(xì)粒度情感分析,將情感分為七種類別,提出了融合微博顯性和隱形特征的情感聚類方法,開發(fā)出一個(gè)情感分析與監(jiān)控系統(tǒng)[6]。國(guó)外微博的發(fā)展始于2006年,是由Evan Williams推出的Twitter把人們引入微博的世界,從而一系列關(guān)于微博的研究相應(yīng)出現(xiàn)[7]。

        鑒于國(guó)內(nèi)外對(duì)微博中詐騙團(tuán)體的挖掘方面的研究較少,因此在前人研究的基礎(chǔ)上,通過結(jié)合社會(huì)網(wǎng)絡(luò)分析方法和數(shù)據(jù)挖掘算法,分析出詐騙團(tuán)體應(yīng)該具備的特征屬性,從而挖掘出微博上潛在的詐騙團(tuán)體,幫助網(wǎng)民減少受騙。

        1 相關(guān)理論知識(shí)

        1.1 社會(huì)網(wǎng)絡(luò)分析

        社會(huì)網(wǎng)絡(luò)是指社會(huì)行動(dòng)者及其關(guān)系的集合。一般情況下,社會(huì)網(wǎng)絡(luò)的形式化界定用點(diǎn)和線來(lái)表示網(wǎng)絡(luò),社會(huì)網(wǎng)絡(luò)可簡(jiǎn)單地理解為各種社會(huì)關(guān)系交織成的結(jié)構(gòu)[8-9]。社會(huì)網(wǎng)絡(luò)的形式化可表達(dá)包括社群圖和矩陣兩種方法。其中社群圖用于表示一個(gè)社會(huì)群體成員之間的復(fù)雜關(guān)系,由表示社會(huì)成員的點(diǎn)和線連成的圖構(gòu)成。舉例說(shuō)明,圖1為一個(gè)簡(jiǎn)單的微博傳播的社群圖,抽象出關(guān)系為:用戶A發(fā)一條微博消息M0,然后B進(jìn)行轉(zhuǎn)發(fā)生成M1,繼而C、D、E進(jìn)行轉(zhuǎn)發(fā)M1分別生成M2、M3、M4,然后博主F轉(zhuǎn)發(fā)M2生成M5,G轉(zhuǎn)發(fā)M5生成M6。

        圖1 微博的傳播社群圖

        社會(huì)網(wǎng)絡(luò)分析是一個(gè)針對(duì)社會(huì)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)和節(jié)點(diǎn)之間的關(guān)系進(jìn)行分析和解釋的重要工具。通過社會(huì)網(wǎng)絡(luò)分析可以了解社會(huì)網(wǎng)絡(luò)的內(nèi)部特性和節(jié)點(diǎn)之間的角色關(guān)系。其中用來(lái)表示社會(huì)網(wǎng)絡(luò)內(nèi)部特征的組件包括社會(huì)網(wǎng)絡(luò)的密度、中間程度、各節(jié)點(diǎn)的角色等,以此為基礎(chǔ)來(lái)分析社會(huì)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)[10-12]。

        1.2 文本特征選擇

        特征選擇的過程是一個(gè)挑選文本特征的過程,首先要查找能夠表示訓(xùn)練文本的特質(zhì)集合,然后按照評(píng)估函數(shù)從中挑選出對(duì)分類有較高貢獻(xiàn)的特征項(xiàng)構(gòu)成特征子集。最常用的方法有TF*IDF、互信息/信息增益、期望交叉熵等,文中使用應(yīng)用較為廣泛的TF*IDF法。

        Salton在1988年提出使用TF*IDF法計(jì)算單詞權(quán)重,其中TF為詞頻,即特征詞在文本中出現(xiàn)的頻率,用于表示該詞描述文檔內(nèi)容的能力;IDF為反文檔頻率,即lg(N/n+0.01)(其中N是文本總數(shù),n是出現(xiàn)該詞的文本數(shù)),用于計(jì)算該詞區(qū)分文檔的能力。該方法認(rèn)為:如果某個(gè)單詞在一個(gè)文本中頻繁出現(xiàn),那么它在另一個(gè)相同類型的文本中出現(xiàn)的次數(shù)也會(huì)很多,反之也成立。同時(shí),如果一個(gè)單詞出現(xiàn)的文本頻率越小,則認(rèn)為該單詞的文檔區(qū)別能力越強(qiáng),因此引入反文檔頻率,最終以TF和IDF的乘積來(lái)定義特征空間坐標(biāo)系的值[13-15]。

        2 微博中詐騙團(tuán)體的模型構(gòu)建與實(shí)現(xiàn)

        利用社會(huì)網(wǎng)絡(luò)分析與數(shù)據(jù)挖掘算法分析出微博中詐騙團(tuán)體應(yīng)該具備的特征,并挖掘出新浪微博上潛在的詐騙團(tuán)體。為了實(shí)現(xiàn)這個(gè)目的,文中的實(shí)證主要分為以下四個(gè)步驟:微博數(shù)據(jù)采集:網(wǎng)絡(luò)爬蟲程序的開發(fā);文本數(shù)據(jù)清洗;詐騙團(tuán)體的社會(huì)網(wǎng)絡(luò)特征和文本特征的挖掘;詐騙團(tuán)體預(yù)測(cè)及評(píng)估。流程如圖2所示。

        圖2 研究流程

        2.1 微博數(shù)據(jù)采集:網(wǎng)絡(luò)爬蟲程序的開發(fā)

        要分析微博平臺(tái)上的詐騙團(tuán)體,首先要對(duì)微博上關(guān)于詐騙的熱點(diǎn)、文章和相關(guān)評(píng)論數(shù)據(jù)進(jìn)行采集,對(duì)比多種網(wǎng)絡(luò)上的爬蟲工具。選用C#自己開發(fā)出一款爬蟲軟件,對(duì)比C#的網(wǎng)絡(luò)庫(kù)采集數(shù)據(jù)。設(shè)定微博為新浪微博,通過關(guān)鍵詞“仇恨”字段獲取相關(guān)的URL,使用C#的httpwebrequest類庫(kù)訪問URL獲取返回結(jié)果,解析出需要的數(shù)據(jù)。

        2.2 數(shù)據(jù)處理

        取到文本信息后,首先要對(duì)文本數(shù)據(jù)進(jìn)行清洗。文本數(shù)據(jù)里存在大量的冗余雜亂的數(shù)據(jù),好多基本上是沒有任何價(jià)值的,如果將這些數(shù)據(jù)也引入到詞頻統(tǒng)計(jì)里,必然對(duì)模型的最終結(jié)果產(chǎn)生深遠(yuǎn)的影響。因此在建模之前需要對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理,刪除掉大量無(wú)價(jià)值的信息,包括去重、機(jī)械壓縮去詞和短句刪除。

        數(shù)據(jù)經(jīng)過預(yù)處理之后,在進(jìn)行數(shù)據(jù)挖掘之前還需要對(duì)文本數(shù)據(jù)進(jìn)行分詞處理,即將連續(xù)的字序列按照一定的標(biāo)準(zhǔn)重新組合成詞的過程。而且不同的分詞效果會(huì)直接影響到詞語(yǔ)在文本中的重要程度,因此采用Python中評(píng)價(jià)較高的中文分詞包“jieba”對(duì)文本數(shù)據(jù)進(jìn)行斷詞,最后整理成有字詞組成的數(shù)據(jù)集。

        生成數(shù)據(jù)集之后,還需要計(jì)算一個(gè)詞對(duì)于一個(gè)文本的重要程度,最常用的方法就是TF-IDF算法。某個(gè)詞對(duì)文章的貢獻(xiàn)度越大,它的TF-IDF值就越大,所以按TF-IDF值從大到小排序,排在最前面的就是文章的關(guān)鍵詞,也就是特征值。其中:

        TF=單詞在文章中出現(xiàn)的次數(shù)/文章的總次數(shù)

        IDF=log(文章總數(shù)/包含該詞的文章數(shù)+1)

        TF-IDF=TF*IDF

        2.3 詐騙團(tuán)體社會(huì)網(wǎng)絡(luò)分析特征獲取和文本特征的挖掘

        2.3.1 通過社會(huì)網(wǎng)絡(luò)分析特征獲取

        首先從整體社會(huì)網(wǎng)絡(luò)的角度對(duì)詐騙團(tuán)體進(jìn)行社會(huì)特征值的挖掘,主要從兩個(gè)方面進(jìn)行分析,一是網(wǎng)絡(luò)密度,二是平均最短路徑。

        通過網(wǎng)絡(luò)密度分析可以對(duì)詐騙團(tuán)體的訓(xùn)練集中社會(huì)網(wǎng)絡(luò)之內(nèi)部節(jié)點(diǎn)互動(dòng)鏈接的強(qiáng)度進(jìn)行大致的了解,密度高的社會(huì)網(wǎng)絡(luò)通常代表與中心高度密集或高度相關(guān)而且信息傳遞速度更快。平均最短路徑可用于衡量社會(huì)網(wǎng)絡(luò)中,信息在節(jié)點(diǎn)與節(jié)點(diǎn)之間的傳播效率,路徑越短,傳遞信息的效率越高。

        其次從網(wǎng)絡(luò)節(jié)點(diǎn)的角度進(jìn)行分析,主要對(duì)節(jié)點(diǎn)的連接度和中心性進(jìn)行分析。通過分析節(jié)點(diǎn)與節(jié)點(diǎn)之間的連接度,可以了解節(jié)點(diǎn)在整個(gè)社會(huì)網(wǎng)絡(luò)中的活動(dòng)范圍,而對(duì)中心性進(jìn)行分析,主要是用于衡量單個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要程度,可以借此來(lái)掌控整個(gè)社會(huì)網(wǎng)絡(luò)的主要信息流向等,其目的就是為了挖掘出社會(huì)網(wǎng)絡(luò)中的重要節(jié)點(diǎn)。

        通過對(duì)詐騙團(tuán)體的中心性進(jìn)行分析,可以挖掘出詐騙團(tuán)體內(nèi)部各節(jié)點(diǎn)之間的角色擔(dān)當(dāng)以及詐騙團(tuán)體內(nèi)部各節(jié)點(diǎn)的結(jié)構(gòu),以此來(lái)?yè)?dān)任詐騙團(tuán)體的特征值,方便后續(xù)挖掘研究。

        2.3.2 通過文本挖掘獲取特征關(guān)鍵詞

        在對(duì)訓(xùn)練集中的數(shù)據(jù)進(jìn)行處理之后,對(duì)得到的數(shù)據(jù)集計(jì)算所有字詞的TF-IDF特征值,然后進(jìn)行排序。此外,從對(duì)詐騙團(tuán)體的分析觀察中發(fā)現(xiàn),詐騙團(tuán)體的目的在于傳播詐騙信息,從而讓更多的人上當(dāng)受騙,其用詞多半強(qiáng)烈且頻繁。因此該研究只取微博中關(guān)于詐騙的訓(xùn)練樣本集中TF-IDF排名前10的詞作為關(guān)鍵詞,即此微博的內(nèi)容特征詞。

        2.4 詐騙團(tuán)體的預(yù)測(cè)和評(píng)估

        該步驟的目的是為了驗(yàn)證上述特征值的確立可否通過對(duì)比挖掘出潛在的詐騙團(tuán)體。主要包括兩步:內(nèi)容特征對(duì)比和社會(huì)網(wǎng)絡(luò)特征對(duì)比。

        2.4.1 內(nèi)容特征對(duì)比

        在進(jìn)行社會(huì)網(wǎng)絡(luò)特征對(duì)比之前,需要先比對(duì)訓(xùn)練集中得到的內(nèi)容特征向量與測(cè)試集中的內(nèi)容特征向量的相關(guān)程度,判斷測(cè)試集中的內(nèi)容特征值與既有的訓(xùn)練集中的內(nèi)容特征之間的相似度(similarity)。通過上述分析,可以得到測(cè)試集中與詐騙內(nèi)容高度相似的族群,并將此族群列為潛在的詐騙團(tuán)體。

        2.4.2 社會(huì)網(wǎng)絡(luò)特征對(duì)比

        對(duì)于上述分析得到的潛在的詐騙團(tuán)體,通過分析比對(duì)這些潛在的詐騙團(tuán)體所構(gòu)成的社會(huì)網(wǎng)絡(luò)特征與訓(xùn)練集中得到的社會(huì)網(wǎng)絡(luò)特征是否存在高度相關(guān)性,判斷該族群是否真的是詐騙團(tuán)體。

        首先對(duì)潛在的詐騙團(tuán)體進(jìn)行社會(huì)網(wǎng)絡(luò)構(gòu)建和分析,建立相同的社會(huì)網(wǎng)絡(luò)特征向量,然后進(jìn)行特征向量之間的相似度對(duì)比,進(jìn)而判斷是否為真的詐騙團(tuán)體。整體社會(huì)網(wǎng)絡(luò)特征向量Gn=[平均連接度,網(wǎng)絡(luò)密度,平均最短路徑],n=1,2,其中1表示訓(xùn)練集中的社會(huì)網(wǎng)絡(luò)特征向量,2表示測(cè)試集中的社會(huì)網(wǎng)絡(luò)特征向量。

        通過對(duì)詐騙團(tuán)體的中心性進(jìn)行分析,可以挖掘出詐騙團(tuán)體內(nèi)部各節(jié)點(diǎn)之間的角色擔(dān)當(dāng)以及詐騙團(tuán)體內(nèi)部各節(jié)點(diǎn)的結(jié)構(gòu),這些角色在網(wǎng)絡(luò)中的特征向量可以表示為:Fi=[網(wǎng)絡(luò)中擔(dān)任領(lǐng)導(dǎo)者角色的比率,網(wǎng)絡(luò)中擔(dān)任中間者角色的比率],i=1,2,其中1表示訓(xùn)練集中的社會(huì)網(wǎng)絡(luò)特征向量,2表示測(cè)試集中的社會(huì)網(wǎng)絡(luò)特征向量。

        用向量空間模型中的余弦相似性(cosine similarity)來(lái)比較特征向量之間的相似度。對(duì)于余弦相似性,可以想象空間中的兩條從原點(diǎn)出發(fā)指向不同方向的線段,形成一個(gè)夾角,如果夾角是0°,這就意味著這兩條線段方向相同,線段完全重合;如果夾角為180°,則說(shuō)明方向完全相反。因此,可以用夾角的大小來(lái)衡量向量的相似性,夾角越小就代表向量越相似。假定A=[A1,A2,…,An]和B=[B1,B2,…,Bn]是兩個(gè)n維向量,則A與B的夾角θ的余弦等于:

        通過這個(gè)公式可以得到社會(huì)網(wǎng)絡(luò)特征向量G1和G2和節(jié)點(diǎn)角色組成的特征向量F1和F2之間的余弦,余弦值越接近1,說(shuō)明夾角越接近0,則這兩個(gè)向量越相似。當(dāng)這幾個(gè)特征向量的相似度都較高時(shí),則可以判定此潛在團(tuán)體為詐騙團(tuán)體。

        3 案例分析

        通過一個(gè)小案例樣本,分析已經(jīng)存在的詐騙團(tuán)體與一般的社會(huì)網(wǎng)絡(luò)團(tuán)體之間在內(nèi)容特征和社會(huì)網(wǎng)絡(luò)特征上的差異性。

        3.1 實(shí)驗(yàn)樣本集

        通過網(wǎng)絡(luò)爬蟲技術(shù)搜集新浪微博平臺(tái)上已經(jīng)存在的詐騙團(tuán)體和討論女排相關(guān)話題的一般社會(huì)網(wǎng)絡(luò)團(tuán)體的信息,其中詐騙團(tuán)體的社會(huì)網(wǎng)絡(luò)包含15個(gè)獨(dú)立節(jié)點(diǎn)和17條連接,而一般社會(huì)網(wǎng)絡(luò)團(tuán)體包含19個(gè)獨(dú)立節(jié)點(diǎn)和21條連接。

        3.2 內(nèi)容特征向量獲取

        通過獲取到的詐騙團(tuán)體和非詐騙團(tuán)體的信息,經(jīng)過上述介紹的數(shù)據(jù)清洗和處理,得到兩個(gè)只包含字和詞的數(shù)據(jù)集,然后分別計(jì)算它們的TF-IDF值;之后再根據(jù)TF-IDF值從大到小排序,各取前10個(gè)關(guān)鍵詞作為代表社會(huì)網(wǎng)絡(luò)的內(nèi)容特征,其結(jié)果如下:

        詐騙團(tuán)體:[騙子、非法、獲利、個(gè)人消息、曝光、詐騙、隱蔽、電話、短信、拉黑]

        一般社會(huì)團(tuán)體:[郎平、中國(guó)、女排、冠軍、鐵榔頭、一米八、夢(mèng)想、奪冠、驕傲、奧運(yùn)會(huì)]

        針對(duì)不同的熱點(diǎn)搜索詞所產(chǎn)生的社群獲取到的內(nèi)容特征詞便有很大的不同,通過這種性質(zhì)便可以作為辨別詐騙團(tuán)體的依據(jù)。

        3.3 社會(huì)網(wǎng)絡(luò)特征獲取

        通過Pajek32軟件對(duì)上面兩種社會(huì)網(wǎng)絡(luò)團(tuán)體進(jìn)行構(gòu)建并計(jì)算各自的社會(huì)網(wǎng)絡(luò)特征,由此來(lái)觀察兩者之間的差別。Pajek是包含上千及至數(shù)百萬(wàn)個(gè)節(jié)點(diǎn)大型網(wǎng)絡(luò)的分析和可視化操作。

        圖2和圖3分別表示詐騙團(tuán)體和一般社會(huì)網(wǎng)絡(luò)團(tuán)體(女排相關(guān))所呈現(xiàn)的網(wǎng)絡(luò)圖(不帶方向)。

        圖3 詐騙團(tuán)體網(wǎng)絡(luò)圖

        從圖3可以看出,詐騙團(tuán)體的網(wǎng)絡(luò)圖擁有兩個(gè)主要的領(lǐng)袖,網(wǎng)絡(luò)圖中其他成員或者節(jié)點(diǎn)之間傳遞信息大多都要經(jīng)過這兩個(gè)領(lǐng)袖進(jìn)行。

        圖4 一般社會(huì)團(tuán)體網(wǎng)絡(luò)圖

        而從一般社會(huì)網(wǎng)絡(luò)團(tuán)體的網(wǎng)絡(luò)圖來(lái)看,角色大多不是很鮮明,各節(jié)點(diǎn)之間大多直接進(jìn)行信息傳遞。

        如表1、表2所示,從這兩個(gè)團(tuán)體的社會(huì)網(wǎng)絡(luò)特征值來(lái)看,這兩個(gè)團(tuán)體在社會(huì)網(wǎng)絡(luò)角色中存在明顯的差異性。詐騙團(tuán)體存在非常明顯的領(lǐng)袖節(jié)點(diǎn),統(tǒng)一社會(huì)網(wǎng)絡(luò)信息的傳播和控制。而一般社會(huì)團(tuán)體(女排相關(guān))各節(jié)點(diǎn)直接比較松散,各節(jié)點(diǎn)內(nèi)部之間大多直接進(jìn)行交流,這與詐騙團(tuán)體的社會(huì)網(wǎng)絡(luò)組成有著顯著的差異。

        表1 詐騙團(tuán)體的社會(huì)網(wǎng)絡(luò)特征值

        表2 一般社會(huì)團(tuán)體的社會(huì)網(wǎng)絡(luò)特征值

        4 結(jié)束語(yǔ)

        文中利用社會(huì)網(wǎng)絡(luò)分析法和數(shù)據(jù)挖掘技術(shù)對(duì)微博中的詐騙團(tuán)體進(jìn)行分析和研究,挖掘出微博平臺(tái)上潛在的詐騙團(tuán)體,從而幫助人們減少受騙的機(jī)會(huì)。雖然對(duì)微博中的詐騙熱點(diǎn)數(shù)據(jù)進(jìn)行了分析和挖掘,但是由于該模型的復(fù)雜性,尚存在一些不足之處:首先,由于

        數(shù)據(jù)的局限性,只研究了微博中的詐騙團(tuán)體,對(duì)于其他平臺(tái)的和溝通工具的詐騙團(tuán)體有待進(jìn)一步挖掘;其次,采用結(jié)巴分詞進(jìn)行斷詞,產(chǎn)生了大量的數(shù)據(jù)集,影響了運(yùn)行效率,因此提高該算法的效率是后續(xù)的研究方向。

        參考文獻(xiàn):

        [1] 孫 孟.微博營(yíng)銷-新媒體時(shí)代的營(yíng)銷寵兒[J].通信企業(yè)管理,2011(7):38-39.

        [2] 吳繼飛,鄧安平.基于互聯(lián)網(wǎng)時(shí)代微博營(yíng)銷的SWOT分析[J].中國(guó)集體經(jīng)濟(jì),2011,21:52-53.

        [3] 王 利.基于數(shù)據(jù)挖掘技術(shù)的微博營(yíng)銷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].武漢:華中科技大學(xué),2013.

        [4] 邵 笑.新媒體詐騙的言語(yǔ)行為研究[D].錦州:渤海大學(xué),2014.

        [5] 張劭捷.基于微博社交網(wǎng)絡(luò)的輿情分析模型及實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2011.

        [6] 繆茹一.基于文本數(shù)據(jù)挖掘的微博情感分析與監(jiān)控系統(tǒng)[D].杭州:浙江工業(yè)大學(xué),2015.

        [7] ZHOU X,CHEN L.Event detection over twitter social media streams[J].VLDB Journal,2014,23(3):381-400.

        [8] 康澤東,余旌胡,丁義明.微博社交網(wǎng)絡(luò)的對(duì)稱程度實(shí)證分析[J].計(jì)算機(jī)應(yīng)用,2014,34(12):3405-3408.

        [9] FARINE D R,WHITEHEAD H.Constructing,conducting and interpreting animal social network analysis[J].Journal of Animal Ecology,2015,84(5):1144-1163.

        [10] 孫怡帆,李 賽.基于相似度的微博社交網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法[J].計(jì)算機(jī)研究與發(fā)展,2014,51(12):2797-2807.

        [11] 范超然,黃曙光,李永成.微博社交網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法研究[J].微型機(jī)與應(yīng)用,2013,31(23):67-70.

        [12] NASON G J,FARDOD O,KELLY M E,et al.The emerging use of Twitter by urological journals[J].Bju International,2015,115(3):486-490.

        [13] CHEN P,FU X,TENG S,et al.Research on micro-blog sentiment polarity classification based on SVM[C]//International conference on human centered computing.[s.l.]:Springer International Publishing,2014:392-404.

        [14] FLEUREN WW M,ALKEMA W.Application of text mining in the biomedical domain[J].Methods,2015,74:97-106.

        [15] IRFAN R,KING C K,GRAGES D,et al.A survey on text mining in social networks[J].Knowledge Engineering Review,2015,30(2):157-170.

        猜你喜歡
        特征文本分析
        隱蔽失效適航要求符合性驗(yàn)證分析
        如何表達(dá)“特征”
        在808DA上文本顯示的改善
        不忠誠(chéng)的四個(gè)特征
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        抓住特征巧觀察
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        如何快速走進(jìn)文本
        熟女体下毛毛黑森林| 免费在线观看草逼视频| 开心五月激情五月五月天| 国产无夜激无码av毛片| 波多野吉衣av无码| 人妻系列影片无码专区| 久久国产热精品波多野结衣av | 日韩有码中文字幕av| 国产一区二区三区在线影院| 欧美又大粗又爽又黄大片视频| 亚洲国产成人久久综合下载| 久久精品无码一区二区三区蜜费| 亚洲av第一区综合激情久久久 | 麻豆资源在线观看视频| 男女裸交无遮挡啪啪激情试看 | 久久免费网站91色网站| 亚洲高清一区二区三区在线播放 | 亚洲 欧美 偷自乱 图片| 人妻夜夜爽天天爽一区| 国产在线观看黄| 高清不卡av在线播放| 伊人大杳焦在线| 青青草国产成人99久久| 加勒比熟女精品一区二区av| 亚洲综合一区二区三区天美传媒 | 伊人亚洲综合影院首页| 三级黄色片免费久久久| 久久夜色精品国产噜噜亚洲av| 日韩精品网| 亚洲天堂av一区二区三区不卡| 亚洲av精品一区二区三区| 5级做人爱c视版免费视频| 日韩精品人妻少妇一区二区| 中文字幕在线乱码一区| 午夜成人精品福利网站在线观看 | 狼人综合干伊人网在线观看| 精品无码国产一区二区三区麻豆| 日本高清色倩视频在线观看| 丰满少妇棚拍无码视频| 亚洲av人片在线观看| 亚洲综合久久精品无码色欲|