亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對(duì)網(wǎng)絡(luò)信息計(jì)量的幾點(diǎn)研究

        2009-07-31 06:59:04高青青
        關(guān)鍵詞:影響因子搜索引擎

        高青青

        摘要:本文試圖從一些特定的領(lǐng)域來闡述網(wǎng)絡(luò)信息計(jì)量學(xué)的發(fā)展成果和可供發(fā)展的方向,主要包括了搜索引擎、網(wǎng)頁分布以及網(wǎng)絡(luò)信息的計(jì)量(即影響因子)等方面。筆者認(rèn)為在目前的網(wǎng)絡(luò)環(huán)境和技術(shù)條件下,對(duì)網(wǎng)絡(luò)信息的計(jì)量顯得困難重重,但隨著研究的不斷深入和研究工作者的不懈努力,網(wǎng)絡(luò)信息計(jì)量學(xué)仍然可以取得長(zhǎng)足發(fā)展并付之實(shí)踐。筆者同時(shí)認(rèn)為網(wǎng)絡(luò)信息計(jì)量的前提是對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)量研究,其中,圖論和拓?fù)浣Y(jié)構(gòu)是很重要的工具。

        關(guān)鍵詞:網(wǎng)絡(luò)信息計(jì)量;搜索引擎;影響因子;圖論分類號(hào):G350

        引言

        自20世紀(jì)90年代中期以來,對(duì)互聯(lián)網(wǎng)的性能方面的研究日益增多,并于初期將其命名為網(wǎng)絡(luò)文本研究,它主要是把現(xiàn)在信息計(jì)量學(xué)運(yùn)用于互聯(lián)網(wǎng)信息的內(nèi)容、鏈接構(gòu)成以及搜索引擎等方面。1997年正式將這一研究領(lǐng)域稱為網(wǎng)絡(luò)信息計(jì)量學(xué),英文名稱為“webometrics”或“cybermetrics”[1] 。本文闡述了最近業(yè)內(nèi)對(duì)網(wǎng)絡(luò)信息搜索的研究,并對(duì)網(wǎng)頁的鏈接和網(wǎng)絡(luò)文獻(xiàn)的影響因子進(jìn)行了研究,而且筆者還簡(jiǎn)述了圖論與拓?fù)鋵W(xué)在網(wǎng)絡(luò)結(jié)構(gòu)研究中的重要作用,希望能從中找出一些具有價(jià)值的研究方向。

        1網(wǎng)絡(luò)搜索引擎的查準(zhǔn)率與查全率的研究

        搜索引擎是網(wǎng)上的導(dǎo)航工具,它是通過采集、標(biāo)引眾多網(wǎng)絡(luò)站點(diǎn)來提供全局性網(wǎng)絡(luò)資源控制與檢索機(jī)制,并對(duì)全球網(wǎng)絡(luò)中所有的信息資源進(jìn)行集合、整理和分配,方便用戶查找所需的信息。雖然搜索引擎越來越多,功能越來越完善,但查全率、查準(zhǔn)率、可到達(dá)性等都不能盡如人意。這些可以通過網(wǎng)絡(luò)信息計(jì)量的研究結(jié)果加以改善。

        1997年12月,AltaVista、HotBot、NorthernLight、Excite、Lycos和 Infoseek六個(gè)商業(yè)網(wǎng)絡(luò)搜索引擎全面運(yùn)行,共索引了32億個(gè)網(wǎng)頁,但這同時(shí)也表明了任何一個(gè)網(wǎng)絡(luò)搜索引擎的檢全率都愛到極大的限制,單個(gè)搜索引擎最多只能檢索網(wǎng)頁總量的1/3[2]。之所以如此,原因很多,例如搜索引擎對(duì)本站服務(wù)器的深入訪問必將受到該網(wǎng)站的結(jié)構(gòu)的限制,不同的檢索策略與不同的檢索詞也會(huì)關(guān)系到搜索引擎的檢全率。目前學(xué)術(shù)界對(duì)搜索引擎的研究和報(bào)道主要集中于網(wǎng)絡(luò)的各個(gè)站點(diǎn)和網(wǎng)頁的鏈接兩個(gè)方面,這很現(xiàn)實(shí)地把研究重點(diǎn)對(duì)準(zhǔn)了搜索引擎的覆蓋面,說明了搜索引擎的在時(shí)間上的序列性與連續(xù)性。例如英國文獻(xiàn)學(xué)家Ingwersen以及Snyder 和 Rosenbaum等人就著重對(duì)AltaVista覆蓋范圍內(nèi)的網(wǎng)頁和站點(diǎn)的鏈接結(jié)構(gòu)進(jìn)行了研究,并提出了搜索引擎應(yīng)該聯(lián)合起來以促進(jìn)信息的共享[3]。筆者亦認(rèn)為這是可行的。搜索引擎的聯(lián)合有利于對(duì)信息的量化,對(duì)信息的規(guī)范起來了保障作用。同時(shí),搜索引擎在信息網(wǎng)站的選擇上也應(yīng)該有選擇地覆蓋,這樣可以很好的避免信息量大但實(shí)用性小的現(xiàn)象,對(duì)搜索引擎的檢準(zhǔn)率是一個(gè)很大的幫助。

        2網(wǎng)頁分布的研究

        計(jì)算機(jī)專家Cronin和McKim提到“網(wǎng)絡(luò)正在改變著學(xué)術(shù)交流,任何新的學(xué)術(shù)理論和著作很快便能在網(wǎng)上共享,我們應(yīng)該感謝計(jì)算機(jī)網(wǎng)絡(luò)”[4]。然而,怎么促進(jìn)網(wǎng)絡(luò)信息的更好交流,則需要對(duì)各網(wǎng)絡(luò)站點(diǎn)結(jié)構(gòu)進(jìn)行量化分析,得出網(wǎng)絡(luò)結(jié)構(gòu)及其迅速增長(zhǎng)的模型,只有如此才能正確地比量出網(wǎng)絡(luò)信息與網(wǎng)絡(luò)高速公路的關(guān)聯(lián)。這些正是網(wǎng)絡(luò)信息計(jì)量研究者們需要做的工作。

        網(wǎng)絡(luò)的結(jié)構(gòu)是各網(wǎng)絡(luò)站點(diǎn)相互鏈接的反映,而網(wǎng)絡(luò)鏈接又使網(wǎng)絡(luò)文獻(xiàn)呈現(xiàn)出各種聚類關(guān)系,促使各網(wǎng)站間存在著復(fù)雜的引用關(guān)系。網(wǎng)絡(luò)信息計(jì)量學(xué)的一個(gè)重要研究?jī)?nèi)容便是網(wǎng)絡(luò)中的Web網(wǎng)頁之間的鏈接引用關(guān)系以及同被引與引文耦關(guān)系,最終用以揭示站點(diǎn)之間的相關(guān)性。互聯(lián)網(wǎng)是一個(gè)由節(jié)點(diǎn)和鏈構(gòu)成的信息資源網(wǎng)絡(luò),是一個(gè)非純屬結(jié)構(gòu)的超文本系統(tǒng),不僅適合表達(dá)多媒體信息資源,還善于構(gòu)造和表示網(wǎng)絡(luò)信息資源之間的多方面、多層次的復(fù)雜關(guān)系。

        有關(guān)網(wǎng)絡(luò)結(jié)構(gòu)的研究,涉及到計(jì)算機(jī)、人工智能、拓?fù)鋵W(xué)、社會(huì)學(xué)、圖論等多種學(xué)科、領(lǐng)域的知識(shí)。一方面各個(gè)領(lǐng)域的研究者不得不吸收其它領(lǐng)域的研究方法,而另一方面又使不同領(lǐng)域的研究者都能找到研究切入點(diǎn)。最后導(dǎo)致的結(jié)果就是這方面的研究者和研究方法的構(gòu)成最大化,也是最容易引起爭(zhēng)議的研究領(lǐng)域,成為各個(gè)相關(guān)學(xué)科的“必爭(zhēng)之地”。

        3網(wǎng)頁影響因子分析

        1997年,Rousseau在他的文章“Stations:An Exploratory Study”中分析了網(wǎng)絡(luò)站點(diǎn)的分布與內(nèi)部鏈接情況。他與后來的Ingwersen一樣使用了舊版本的AltaVista進(jìn)行統(tǒng)計(jì)研究,他利用“信息計(jì)量學(xué)+文獻(xiàn)計(jì)量學(xué)+科學(xué)計(jì)量學(xué)”搜索出了共343個(gè)相關(guān)網(wǎng)頁,通過分析研究,他不僅發(fā)現(xiàn)了網(wǎng)絡(luò)各搜索引擎具有相對(duì)獨(dú)立性,更重要的是他的研究顯示這些網(wǎng)頁的分布都符合洛特卡定律[5]。

        Ingwersen通過對(duì)某一國家網(wǎng)站的研究,試圖從網(wǎng)絡(luò)影響因子(Web Impact Factors,Web-IF)來說明網(wǎng)頁鏈接之間的關(guān)系[6]。他的主要研究成果體現(xiàn)在三個(gè)方面:1)每一個(gè)搜索引擎都不可能全部搜集網(wǎng)站,但很多網(wǎng)站的信息都已經(jīng)被鏈接進(jìn)來,自鏈接不會(huì)影響到總體的影響因子?!?com”域名的網(wǎng)絡(luò)站點(diǎn)的影響因子大約是0.5,但平均影響因子只有0.39;2)某一域名站點(diǎn)的影響因子比其域名網(wǎng)絡(luò)的影響因子更可靠,而且可以從前者推導(dǎo)出后者;3)通過差異計(jì)算可以評(píng)價(jià)一個(gè)搜索引擎的好壞。

        此后還有很多學(xué)者對(duì)網(wǎng)頁影響因子進(jìn)行了大量的研究,但都沒能得出一個(gè)統(tǒng)一而又具體的標(biāo)準(zhǔn)和計(jì)量方法,這也正體現(xiàn)了網(wǎng)絡(luò)信息計(jì)量的復(fù)雜性。

        其實(shí),就目前網(wǎng)絡(luò)的規(guī)范程度,要對(duì)網(wǎng)頁進(jìn)行很實(shí)用的影響因子評(píng)價(jià)還不太具備可操作性。首先,網(wǎng)頁的量太大,網(wǎng)絡(luò)的飛速發(fā)展使得網(wǎng)頁的數(shù)量急劇增長(zhǎng),個(gè)人主頁、主題頁(某一主題的專指網(wǎng)頁)、各機(jī)構(gòu)性主頁、指南頁、資源頁等各種網(wǎng)頁都在不斷地增多,而且新的網(wǎng)頁類型也在產(chǎn)生;然后,網(wǎng)頁的內(nèi)容也多樣化,不僅哪方面的都有,而且形式也很多樣,有視頻的、音頻的、文字的等等,而且這些內(nèi)容的產(chǎn)生程序也各不相同。

        4用圖論來理解網(wǎng)絡(luò)信息計(jì)量學(xué)

        圖論(Graph Theory)是數(shù)學(xué)的一個(gè)分支。它以圖為研究對(duì)象。圖論中的圖是由若干給定的點(diǎn)及連接兩點(diǎn)的線所構(gòu)成的圖形,這種圖形通常用來描述某些事物之間的某種特定關(guān)系,用點(diǎn)代表事物,用連接兩點(diǎn)的線表示相應(yīng)兩個(gè)事物間具有這種關(guān)系。圖論多用于描述社會(huì)關(guān)系、生態(tài)鏈以及Internet網(wǎng)絡(luò)等關(guān)系網(wǎng)絡(luò),在信息計(jì)量學(xué)中,圖論也發(fā)揮了重要作用,例如在引文關(guān)系和概念分類系統(tǒng)等方面。理所當(dāng)然,圖論也能在網(wǎng)絡(luò)信息計(jì)量中發(fā)揮重要角色,一般的,我們可以用點(diǎn)來表示網(wǎng)頁或網(wǎng)絡(luò)文獻(xiàn),用線來描繪鏈接關(guān)系。

        利用圖論可以很好地對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析。2000年,布羅德(Broder)等人首先利用圖論得出了一個(gè)針對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)模型[7]。并且他們利用該模型建立了一個(gè)包含2億網(wǎng)頁和15億鏈接的數(shù)據(jù)庫,通過研究分析,他們把這些網(wǎng)頁分成了五個(gè)完全不同的類型:外鏈性網(wǎng)頁,內(nèi)鏈性網(wǎng)頁,內(nèi)外鏈綜合性網(wǎng)頁,零鏈接的網(wǎng)頁與指示性網(wǎng)頁。他們所建立的模型與數(shù)據(jù)庫在網(wǎng)絡(luò)結(jié)構(gòu)的研究方面價(jià)值很大,為人們弄清網(wǎng)絡(luò)復(fù)雜的鏈接關(guān)系提供了很好的基礎(chǔ)。

        圖論的發(fā)展過程中,衍生出了一種專門用于計(jì)算機(jī)領(lǐng)域的學(xué)科即拓?fù)鋵W(xué)。在網(wǎng)絡(luò)領(lǐng)域里,拓?fù)浣Y(jié)構(gòu)得到完美的運(yùn)用,我們完全也可以把它當(dāng)成是網(wǎng)絡(luò)信息計(jì)量的一種運(yùn)用。目前網(wǎng)絡(luò)信息的計(jì)量問題主要還是集中在網(wǎng)絡(luò)文獻(xiàn)(或網(wǎng)頁)的分布研究上,從上文中可以看出,網(wǎng)頁的影響因子的研究還很粗淺,筆者認(rèn)為,在弄清網(wǎng)頁的結(jié)構(gòu)并對(duì)其結(jié)構(gòu)有一定的理論基礎(chǔ)之前,網(wǎng)絡(luò)信息的計(jì)量問題很難取得實(shí)質(zhì)性的進(jìn)展。因此,利用圖論的拓?fù)鋵W(xué)的相關(guān)方法和理論來加強(qiáng)對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)研究將會(huì)是奠基性工作,這也會(huì)是一大難點(diǎn)。

        筆者之所以認(rèn)為對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的研究才是當(dāng)前最重要的網(wǎng)絡(luò)信息計(jì)量工作主要是因?yàn)楫?dāng)前學(xué)術(shù)界所持的網(wǎng)絡(luò)信息計(jì)量研究的幾個(gè)重點(diǎn)都寓于其中。網(wǎng)絡(luò)媒體信息本身的計(jì)量研究的實(shí)質(zhì)就是對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的具體研究,各種媒體信息的具體分布,各數(shù)據(jù)庫的組織結(jié)構(gòu)等都和網(wǎng)絡(luò)結(jié)構(gòu)息息相關(guān);網(wǎng)上文獻(xiàn)信息的計(jì)量分析主要是考慮著者與文獻(xiàn)的分布、文獻(xiàn)的增長(zhǎng)與老化規(guī)律以及引文分析,在這幾個(gè)因素中,網(wǎng)絡(luò)結(jié)構(gòu)都起到了支配作用;網(wǎng)頁影響因子與數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)的進(jìn)行也很顯然是網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上的研究工作。因此,加強(qiáng)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的研究將是網(wǎng)絡(luò)信息計(jì)量的突破口。

        5結(jié)語

        顯然,本文所闡述很多都是學(xué)術(shù)界一致的成果表達(dá),但就筆者看來,當(dāng)今的網(wǎng)絡(luò)信息是屬于“失控”局面,即不能有一種完善的辦法對(duì)其進(jìn)行計(jì)量統(tǒng)計(jì)。要用一種模式把網(wǎng)絡(luò)上全部形式的信息都聯(lián)系在一起不僅技術(shù)和理論上都還沒達(dá)到這個(gè)水平,而且基礎(chǔ)設(shè)施方面也很欠缺;但筆者相信,只要從根本著手,能夠?qū)W(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行量化統(tǒng)計(jì)表述,網(wǎng)絡(luò)信息的計(jì)量問題也就迎刃而解了,為此,筆者認(rèn)為圖論與拓?fù)浣Y(jié)構(gòu)是很好的研究工具。

        參考文獻(xiàn):

        [1]邱均平,張洋.網(wǎng)絡(luò)信息計(jì)量學(xué)綜述[J].高校圖書館工作,2005(1):1-12.

        [2]LAWRENCE, C L GILES.Searching the World Wide Web[J]. Science, 280:98-100.

        [3]Ingwersen P. The Calculation of Web Impact Factors[J].Journal of Documentation, 1998, 54 (2):236-243.

        [4]Cronin, G. Mckim.Science and scholarship on the World Wide Web:A North American Perspective[J].Journal of Documentation,1996,(52):163-172

        [5]R Rousseau.Sitations:An Exploratory Study[J].Cybermetrics,1997,(1):175-181.

        [6]Ingwersen P. The Calculation of Web Impact Factors[J].Journal of Documentation, 1998, 54(2):236-243.

        [7]BRODER. Graph structure in the Web[J]. WWW9 Conference.2000.http://www.almaden.ibm.com/cs/k53/www9.final;visited08.11.2000.

        猜你喜歡
        影響因子搜索引擎
        基于個(gè)性化的協(xié)同過濾圖書推薦算法研究
        農(nóng)作物病蟲害氣象環(huán)境影響因子分析
        手機(jī)閱讀平臺(tái)用戶體驗(yàn)影響因子分析
        目的論視角下旅游英語的語言特色對(duì)漢譯旅游文本的啟示
        科技視界(2016年23期)2016-11-04 13:29:09
        云霧物理生長(zhǎng)過程及其影響因子的虛擬仿真實(shí)驗(yàn)
        考試周刊(2016年50期)2016-07-12 23:09:38
        “影響因子”是用來賺大錢的
        讀書(2016年5期)2016-05-21 22:36:29
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        亚洲六月丁香色婷婷综合久久| 成人无码a级毛片免费| 大量老肥熟女老女人自拍| 中文字幕乱码日本亚洲一区二区| 国产不卡视频一区二区三区 | 网友自拍人妻一区二区三区三州| 精品人妻码一区二区三区红楼视频| 蜜臀av在线播放一区二区三区| 亚州少妇无套内射激情视频| 亚洲九九夜夜| 成人激情视频在线手机观看| 国产乱妇无乱码大黄aa片| 亚洲av有码在线天堂| 天天澡天天揉揉AV无码人妻斩| 亚洲熟少妇一区二区三区| 久久精品国产精品亚洲| 亚洲综合无码一区二区三区| 亚洲最大av免费观看| 久久精品国产亚洲av成人文字| 国产av一区二区三区传媒| 欧美色五月| 美女被搞在线观看一区二区三区 | 四房播播在线电影| 亚洲精品无码久久久久秋霞| AV无码一区二区三区国产| 美女把内衣内裤脱了给男人舔| 五月色丁香婷婷网蜜臀av| 性欧美大战久久久久久久久| 亚欧同人精品天堂| 91精品国产91综合久久蜜臀| 免费无码a片一区二三区| 麻豆精品网站国产乱子伦| 国产精品日本中文在线| 欧美性猛交99久久久久99按摩| 国产成人麻豆精品午夜福利在线| 亚欧同人精品天堂| 偷拍视频网址一区二区| 在线高清理伦片a| 日本a在线免费观看| 亚洲国产日韩一区二区三区四区| 亚洲一区二区三区av无码|