亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社會(huì)計(jì)算的科普教育平臺研究*

        2013-07-30 04:07:50,莫倩,王
        電子測試 2013年10期
        關(guān)鍵詞:搜索引擎分類器檢索

        薄 璐 ,莫 倩,王 芳

        (1.陜西職業(yè)技術(shù)學(xué)院,西安 710100 2.北京工商大學(xué),北京 100048 3.北京航空航天大學(xué),北京 100191)

        0 引言

        社會(huì)計(jì)算的交流平臺,開辟了一個(gè)令人振奮的Internet 新局面,它正從根本上改變著人們共享信息和交流的方式,深刻的影響著全球經(jīng)濟(jì)、社會(huì)互動(dòng)和人們生活的各個(gè)方面,教育也必然身置其中。作為提高公眾素質(zhì)的一個(gè)重要因素,科普教育構(gòu)成了現(xiàn)代教育的核心。本文提出了一種基于社會(huì)計(jì)算的科普教育平臺框架,旨在有助于科普知識的普及和全民素質(zhì)的普遍提高。

        1 平臺框架設(shè)計(jì)

        基于社會(huì)計(jì)算的科普教育平臺是一個(gè)集Wiki 和社會(huì)化科普搜索引擎于一體的面向科普領(lǐng)域的開放教育平臺。在此平臺中,科普領(lǐng)域的專家、教師、學(xué)生、甚至對科普感興趣的任何人都可以添加科普領(lǐng)域的術(shù)語詞條,日積月累逐漸形成一個(gè)科普完整的、嚴(yán)密的和相對權(quán)威的專業(yè)知識系統(tǒng)——科普Wiki。圖1 描述了基于社會(huì)計(jì)算的科普教育平臺框架。

        社會(huì)計(jì)算是同互聯(lián)網(wǎng)密切相連的,是一門現(xiàn)代計(jì)算技術(shù)與社會(huì)科學(xué)之間的交叉學(xué)科,分為微觀技術(shù)和宏觀社會(huì)兩個(gè)層面。由于Web2.0 文化是一種平等、開放、自由的網(wǎng)絡(luò)社區(qū)文化,所以在這個(gè)背景下的用戶對搜索引擎提出了更高的要求。融入了社會(huì)計(jì)算概念的科普搜索引擎更加社會(huì)化,通過用戶通過對搜索結(jié)果進(jìn)行評分能夠影響科普搜索引擎對結(jié)果的排序,搜索Wiki 元數(shù)據(jù)包括詞條編輯時(shí)間、編輯次數(shù)、點(diǎn)擊率等人文因素,在檢索時(shí)的分檔評分中這些社會(huì)因素乘以一定的閾值也將影響到結(jié)果排序,對搜索結(jié)果排序更加人性化,使用戶享受到更為透明的搜索服務(wù)。其主要由科普主題分類機(jī)器人、索引器、查詢器和查詢接口組成。

        2 關(guān)鍵技術(shù)

        2.1 社會(huì)化科普搜索引擎設(shè)計(jì)

        2.1.1 主題分類機(jī)器人架構(gòu)設(shè)計(jì)

        主題分類機(jī)器人主要完成從Web 中采集科普領(lǐng)域信息并入庫的工作。機(jī)器人的制作使用基于工作流/組件技術(shù)的網(wǎng)頁信息抽取系統(tǒng)VWIE 來完成。利用VWIE 的組件可擴(kuò)展性,我們?yōu)槠涮砑恿朔诸惼鹘M件以及域名判斷組件,用以實(shí)現(xiàn)具有頁面過濾和站內(nèi)頁面判斷功能的主題分類機(jī)器人。

        2.1.2 分類器核心算法

        2.1.3 分類器準(zhǔn)確率實(shí)驗(yàn)

        圖1 基于社會(huì)計(jì)算的科普教育平臺框架

        1)分類訓(xùn)練樣本設(shè)置

        SVM 算法分類需要給出訓(xùn)練樣本。本文的實(shí)驗(yàn)訓(xùn)練樣本分為科普和非科普兩類,但由于兩類覆蓋范圍較大,無法用一個(gè)簡單合理的特征集來描述兩個(gè)主題,因此我們對這兩類進(jìn)行了細(xì)分,盡可能多的將其劃分為小類,若網(wǎng)頁屬于小類,則其必屬于此小類所屬的大類。我們的子類別劃分及各個(gè)類別訓(xùn)練樣本如表1 所示:

        2)實(shí)驗(yàn)結(jié)果

        我們從搜狗互聯(lián)網(wǎng)分類語料庫中依照非科普類子類目錄,共選出5000 篇語料作為非科普測試集,從百度百科開放分類中的自然、地理和歷史三個(gè)大類中抽取每個(gè)子類的前20~30個(gè)詞條,共抽取5000 篇文章作為科普測試集,兩者合計(jì)共10000 篇用作實(shí)驗(yàn)的開放測試數(shù)據(jù)集。測試結(jié)果如表2 所示:

        衡量分類器的重要指標(biāo)是召回率和準(zhǔn)確率。召回率(Recall)是檢索出的相關(guān)文檔數(shù)和文檔庫中所有的相關(guān)文檔數(shù)的比率,準(zhǔn)確率(Precision)是檢索出的相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率。本文分類器召回率和準(zhǔn)確率如下所示:

        實(shí)驗(yàn)結(jié)果表明:本文基于SVM 算法的科普主題分類器具有較高的分類準(zhǔn)確率和召回率,能提供專業(yè)的科普知識搜索功能。

        2.1.4 基于Lucene 的檢索機(jī)制

        科普社會(huì)化搜索引擎在信息檢索部分使用Lucene 實(shí)現(xiàn)索引器和查詢器功能,Lucene 具有索引文件格式獨(dú)立于應(yīng)用平臺、優(yōu)秀的面向?qū)ο蠹軜?gòu)、分塊索引、語言和文件格式易于擴(kuò)展等諸多優(yōu)點(diǎn),并且已經(jīng)默認(rèn)實(shí)現(xiàn)了一套強(qiáng)大的查詢引擎,我們無需自己編寫代碼即使系統(tǒng)可獲得強(qiáng)大的查詢能力,但Lucene 中文分詞并不十分理想,因此利用Lucene 的可擴(kuò)展性我們使用現(xiàn)較為流行的開源中文分詞庖丁解牛技術(shù)代替原有的分詞。實(shí)踐證明,替換后效果非常明顯,很大程度上優(yōu)化了索引質(zhì)量和查詢效果。

        2.2 科普Wiki 的實(shí)現(xiàn)

        隨著Wiki 技術(shù)的發(fā)展,出現(xiàn)了種類繁多的Wiki 引擎,使用較為廣泛的有JSPWiki、WikiMedia、WakkaWiki 、CooCooWakka 等。本系統(tǒng)采用JSPWiki 引擎,JSPWiki 引擎是一個(gè)基于文本文件的簡易Wiki 系統(tǒng),包括了版本控制、身份認(rèn)證等基本功能。JSPWiki引擎中的用戶只分為注冊用戶和非注冊用戶,用戶信息在XML 文件中存儲,為了便于用戶權(quán)限管理,本文采用MySQL 數(shù)據(jù)庫來存放用戶信息。

        3 小結(jié)

        本文綜合運(yùn)用主題搜索引擎技術(shù)和Wiki 等技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于社會(huì)計(jì)算的科普教育平臺。該平臺中科普搜索引擎部分針對科普領(lǐng)域信息的特點(diǎn),采用人工干預(yù)與先采集后過濾相結(jié)合的主題搜索引擎信息采集策略,應(yīng)用基于SVM 分類器的主題分類機(jī)器人進(jìn)行數(shù)據(jù)采集,在檢索部分引入社會(huì)因子并且允許用戶對搜索結(jié)果評分使得此平臺能夠?yàn)橛脩籼峁└訉I(yè)準(zhǔn)確的搜索服務(wù)?;谏鐣?huì)計(jì)算的科普教育平臺對普及科普知識,提高全民素質(zhì),推進(jìn)素質(zhì)教育具有重要意義。

        [1]劉潤英;胡航;任友群.社會(huì)計(jì)算視野下的教與學(xué)[J].現(xiàn)代教育技術(shù),2008,18(13):10-14.

        [2]M Parameswaran,AB Whinston.Whinstone Social computing:an overview.Communications of the Association for Information Systems Volume 19,2007,P762-780.

        [3]Yutaka M.Junichiro M.Masahiro H.An Advanced Social Search Engine System from the web.In Proceedings of the 15th International Conference on World Wide Web,May,2006,Edinburgh,Scotland:397-406.

        [4]Jo T,Japkow Icz N,Stephens.The Class Imbalance Problem:A Systematic Study[J].Intelligent Data Al1alysis,2002,6(5):203-231.

        [5]李東方.Web2.0 環(huán)境下互聯(lián)網(wǎng)信息過濾理論與方法研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2009.

        [6]Mo Qian,Du Junping.The Design of a News Knowledge Portal System with Topic Tracking Technology.Proceedings of the 2006 International Symposium on Artificial Intelligence,Beijing,China,2006.8:258-262.

        猜你喜歡
        搜索引擎分類器檢索
        2019年第4-6期便捷檢索目錄
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
        廣告主與搜索引擎的雙向博弈分析
        國際標(biāo)準(zhǔn)檢索
        日韩av一区二区观看| 亚洲动漫成人一区二区| 国产剧情无码中文字幕在线观看不卡视频 | 精彩视频在线观看一区二区三区| 中文字幕亚洲欧美在线不卡| 久热综合在线亚洲精品| 中文字幕乱偷乱码亚洲| 色综合中文字幕综合网| 十八禁视频在线观看免费无码无遮挡骂过 | 国产高清av首播原创麻豆| 欧美日韩人妻| 丰满人妻无奈张开双腿av| 久久99热只有频精品8国语| 久久久久久亚洲av无码蜜芽| 亚洲福利视频一区| 亚洲国产精品夜男人天堂| 男女交射视频免费观看网站| 亚洲裸男gv网站| 日韩高清无码中文字幕综合一二三区 | 日本一区二区不卡超清在线播放 | 伊人久久五月丁香综合中文亚洲| 久久国产国内精品对话对白| 亚州中文字幕乱码中文字幕 | 91久久国产香蕉熟女线看| 欧美成人猛交69| 国产精品无需播放器| 久久国产精品av在线观看| 人妻久久久一区二区三区蜜臀| 性一交一乱一伧国产女士spa| 香蕉视频免费在线| av人妻在线一区二区三区| 国产后入清纯学生妹| 精品一区二区三区在线观看视频 | 国产av无码专区亚洲av| 国产精品国产三级国产三不| 户外精品一区二区三区| 少妇丰满大乳被男人揉捏视频| 连续高潮喷水无码| 色噜噜亚洲精品中文字幕| 曰本女人与公拘交酡| 日韩在线免费|