摘要:分析了文本分類挖掘的一般特點,即數(shù)據(jù)密集、計算密集,討論了網(wǎng)格技術對文本分類的支持c為適應網(wǎng)格環(huán)境,對文本特征向量的權重確定算法作了調(diào)整,提出了基于詞頻、詞語首現(xiàn)位置、詞語長度的單文檔綜合平衡權重算法。最后,構建了一個基于桌面網(wǎng)格的并行文本分類系統(tǒng),并進行了對比實驗。實驗結果表明該系統(tǒng)是可行的、有效的。
關鍵詞:數(shù)據(jù)挖掘;文本分類;網(wǎng)格技術;權重
計算機時代2007年12期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現(xiàn)代工業(yè)經(jīng)濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業(yè)微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業(yè)管理與科技》2024年6期
9《現(xiàn)代食品》2024年4期
10《衛(wèi)生職業(yè)教育》2024年10期
關于參考網(wǎng)