摘 要:Nutch是一個開放源代碼的Web搜索引擎,是以Lucene為基礎實現(xiàn)的搜索引擎應用程序,其工作流程和現(xiàn)代的商業(yè)搜索引擎工作原理一樣,即網(wǎng)頁搜集、預處理(建立索引)和查詢服務。由于不夾雜商業(yè)利益,它對搜索結果的排序算法較為透明公平,我們可以利用Nutch并結合中文分詞技術來構建自己的中文搜索引擎。
關鍵詞:Nutch;Lucene;中文分詞;評分機制
計算機時代2007年1期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現(xiàn)代工業(yè)經(jīng)濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業(yè)微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業(yè)管理與科技》2024年6期
9《現(xiàn)代食品》2024年4期
10《衛(wèi)生職業(yè)教育》2024年10期
關于參考網(wǎng)