亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于python技術(shù)面向校園網(wǎng)原型搜索引擎設(shè)計

        2017-06-06 20:51:59焦萍萍
        電腦知識與技術(shù) 2017年9期
        關(guān)鍵詞:設(shè)計

        焦萍萍

        摘要:隨著學校數(shù)字化建設(shè)的加快,校園的各種信息也不斷增加,對信息進行查找和定位也逐漸變得的困難。大多學校還是使用一般搜索引擎進行站內(nèi)信息的搜索,利用這樣的搜索引擎一般不能及時地得到新消息。而且如果一些學校使用的二級域名或是用,P地址直接作為網(wǎng)站,那么很難被通用的搜索引擎給搜索到。所以本文將基于Python技術(shù)對校園的搜索引擎進行分析,提供一些設(shè)計方案僅供參考。

        關(guān)鍵詞:校園搜索引擎;python技術(shù);設(shè)計

        當今時代是一個信息化的社會,人們通過互聯(lián)網(wǎng)可以看到各種信息,隨著互聯(lián)網(wǎng)的普遍使用,網(wǎng)絡(luò)信息也不斷地增長。想要提高信息搜索的效率,主要的就是對搜索引擎進行改進。而隨著校園的信息化建設(shè),建立一個高效搜索引擎變得非常重要。所以,本文將結(jié)合python語言對搜索引擎的設(shè)計進行分析,探討一下該語言在校園網(wǎng)中的建設(shè)。

        1.搜索引擎建立的流程分析

        1.1框架的分析

        建立校園搜索引擎首先就是要進行設(shè)計流程的分析;其次就是分析Python語言中Scrapy相關(guān)的開源爬蟲結(jié)構(gòu)設(shè)計,其中在Scrapy爬蟲框架中有關(guān)URL的去重功能的分析;再則就是基于Python語言中關(guān)于Whoosh索引檢索庫的分析;最后就是對建立的系統(tǒng)進行測試。

        根據(jù)多種的搜索引擎設(shè)計案例,總結(jié)出設(shè)計搜索引擎的基本流程:首先就是建立一個文件集合(collection),之后利用索引器(indexer)對這些文件進行索引建設(shè)。接著用戶就可以進行關(guān)鍵詞(query)的輸入,這樣系統(tǒng)就可以利用索引進行檢索。而且索引模塊可以對查詢的結(jié)果進行分析排序,最后將搜索結(jié)果按照用戶的要求進行排列呈現(xiàn)出來。在這之前要通過網(wǎng)絡(luò)爬蟲程序?qū)⑦@些集合文件下載好。因此,建立搜索引擎需要完成這幾個模塊:首先就是網(wǎng)絡(luò)爬蟲系統(tǒng)的建立,其次就是索引查詢系統(tǒng)的建立,最后就是顯示答案的模塊。

        1.2網(wǎng)絡(luò)爬蟲

        在1993年,“互聯(lián)網(wǎng)漫游者”誕生,它是世界上首個網(wǎng)路爬蟲程序,也被稱為是網(wǎng)絡(luò)機器人。網(wǎng)絡(luò)爬蟲通過利用圖論中的遍歷算法對互聯(lián)網(wǎng)中的大量信息進行下載,在建立搜索引擎時,是不可缺少圖論的遍歷算法的。該方法是將互聯(lián)網(wǎng)比作一個大圖,將每個網(wǎng)頁作為一個點,通過每個網(wǎng)頁中的超鏈接,就可以將它們相互連接起來了。

        寬度優(yōu)先搜索(BFS),也可以稱為是廣度的優(yōu)先搜索,它也是屬于通圖中的一種遍歷對策。首先建立一張圖對該算法進行分析。如圖1所示。

        如果想要得到V0到V6之間最短的路徑,那么就是分析與V0各個連接的節(jié)點,分別是V1、V2、V3,之后分析和三者相連的節(jié)點有:{V0、V4},{V0、V1、V6},{V0、V1、V5},將我們已經(jīng)分析過的節(jié)點V1、V2、V3進行排除,那么就剩下V4、V6、V5,之后通過找出與V2的連接點V6,就可以得出一條路徑:VO-V2-V6,然后再尋找V5的連接點,就可以得到另外一個路徑:VO-V3-V5-V6,但是這條路徑不是所要的最短路徑。這些就是寬度搜索的基本邏輯,但是該訪問方式比較消耗內(nèi)存。

        深度優(yōu)先搜索(DFS)方式,它是和廣度搜索相反,它是“一條道走到黑”的邏輯。詳細來說就是當訪問走到頭,就去訪問其他相鄰的節(jié)點,假如有很多節(jié)點,那么訪問左邊的節(jié)點,直到?jīng)]有別的節(jié)點,然后在進行其他節(jié)點的訪問。這種搜索選擇邏輯效率比較慢,但是它可以和廣度有限搜索相結(jié)合,如此可以實現(xiàn)優(yōu)勢互補的效果。

        非完全的PageRank邏輯選擇:它是屬于連接分析算法,主要是分析網(wǎng)頁重要性的。所以,在進行網(wǎng)頁優(yōu)先等級選擇時可以利用PageRank邏輯進行分析:將下載好的網(wǎng)頁,和需要獲取的網(wǎng)頁組成一個集合,之后在利用PageRank邏輯進行計算。計算完之后,將獲取的URL根據(jù)PageRank計算出的得分高低進行排列,然后爬蟲就在這些排列中進行URL列表的搜索。

        1.3搜索引擎的索引

        索引的核心部分就是進行布爾集合運算,不管搜索引擎多么的智能,它的基礎(chǔ)都是運用布爾運算。在布爾運算中主要使用0個1兩個值,具有三種邏輯:OR、AND、NOT。

        猜你喜歡
        設(shè)計
        二十四節(jié)氣在平面廣告設(shè)計中的應(yīng)用
        河北畫報(2020年8期)2020-10-27 02:54:06
        何為設(shè)計的守護之道?
        《豐收的喜悅展示設(shè)計》
        流行色(2020年1期)2020-04-28 11:16:38
        基于PWM的伺服控制系統(tǒng)設(shè)計
        電子制作(2019年19期)2019-11-23 08:41:36
        基于89C52的32只三色LED搖搖棒設(shè)計
        電子制作(2019年15期)2019-08-27 01:11:50
        基于ICL8038的波形發(fā)生器仿真設(shè)計
        電子制作(2019年7期)2019-04-25 13:18:16
        瞞天過?!律O(shè)計萌到家
        設(shè)計秀
        海峽姐妹(2017年7期)2017-07-31 19:08:17
        有種設(shè)計叫而專
        Coco薇(2017年5期)2017-06-05 08:53:16
        從平面設(shè)計到“設(shè)計健康”
        商周刊(2017年26期)2017-04-25 08:13:04
        少妇被又大又粗又爽毛片| 亚洲精品视频免费在线| 亚洲女同一区二区三区| 人人超碰人人爱超碰国产| 精品国产人妻一区二区三区 | 久久精品国产亚洲黑森林| 中文字幕视频一区二区| 亚洲av无码乱码国产麻豆| 在线不卡av片免费观看| 亚洲制服无码一区二区三区| 国产精品亚洲在钱视频| 人妖av手机在线观看| 久久精品成人无码观看不卡| 毛片毛片免费看| 亚洲av男人免费久久| 妺妺窝人体色www在线| 人妻无码aⅴ不卡中文字幕| 亚洲综合五月天欧美| 中文字幕中文字幕三区| 性做久久久久久免费观看| 亚洲色欲色欲www在线播放| 美女视频很黄很a免费国产| 国产女人精品一区二区三区 | 91福利国产在线观一区二区| 亚洲av成人波多野一区二区| 小说区激情另类春色| 窝窝影院午夜看片| 中文字幕精品亚洲二区| 亚洲视频免费一区二区| 国产农村妇女毛片精品久久 | 亚洲性69影视| 亚洲国产国语对白在线观看| 精品亚洲国产成人| 欧美激情在线不卡视频网站| 最新国产主播一区二区| 久久综合九色欧美综合狠狠| 国产成人综合在线视频| 特级毛片全部免费播放a一级| 色综合悠悠88久久久亚洲| 久久久www成人免费精品| 粉嫩极品国产在线观看|