鄧丹君 姚莉
摘要:針對(duì)微博短文本特征難以提取的特點(diǎn),結(jié)合微博文本的3種專屬特殊符號(hào):“@”、“//”和“#”分析微博文本的特點(diǎn),從而對(duì)TF-IDF算法進(jìn)行改進(jìn),并且考慮用戶興趣時(shí)間的長(zhǎng)短來(lái)進(jìn)行微博短文本特征詞的選取。實(shí)驗(yàn)結(jié)果表明,相對(duì)于原有算法,該算法能夠有效提高微博短文本特征詞提取的準(zhǔn)確度。
關(guān)鍵詞:TF-IDF;微博短文本;特征詞提取
DOIDOI:10.11907/rjdk.161165
中圖分類號(hào):TP312文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2016)006-0048-02
參考文獻(xiàn):
[1]楊福強(qiáng).基于微博擴(kuò)展的用戶興趣主題挖掘算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(5):1214-1217.
[2]何天翔,張暉,李波,等.一種基于情感分析的網(wǎng)絡(luò)輿情演化分析方法[J].軟件導(dǎo)刊,2015,14(5):131-134.
[3]周磊,覃俊,劉晶. 基于微博交互信息的社交網(wǎng)絡(luò)推薦算法[J].軟件導(dǎo)刊,2015,14 (4):63-66.
[4]陶永才.基于加權(quán)動(dòng)態(tài)興趣度的微博個(gè)性化推薦[J].計(jì)算機(jī)應(yīng)用,2014,34(12):3491-3496.
[5]秦雨.基于特征映射的微博用戶標(biāo)簽興趣聚類算法[J].Journal of Data Acquisition and Processing,2015,30(6): 1246-1252.
[6]趙華.基于話題相關(guān)空間的微博用戶興趣識(shí)別及可視化方法[J].計(jì)算機(jī)科學(xué),2015,42(6A): 500-502.
[7]曾東紅.一種基于指數(shù)遺忘函數(shù)的協(xié)同過(guò)濾推薦算法[J].科技廣場(chǎng),2013(7):10-15.