摘要:從知識(shí)量浩如煙海的互聯(lián)網(wǎng)上獲取信息資源是必須依靠搜索引擎的幫助的。但是現(xiàn)在的搜索引擎主要針對(duì)的是文本的搜索,對(duì)于通過各種專有工具而設(shè)計(jì)出來的各種硬件格式的文件的搜索卻顯得愛莫能助。因此為了能在互聯(lián)網(wǎng)上通過搜索引擎對(duì)這些硬件部件的設(shè)計(jì)進(jìn)行搜索,我們就需要進(jìn)行有針對(duì)性的搜索引擎開發(fā)設(shè)計(jì)。這種搜索引擎應(yīng)該在互聯(lián)網(wǎng)上基于硬件部件行設(shè)計(jì),通過硬件本身所帶有的設(shè)計(jì)特性信息源,搜索帶硬件本身的文件,從而能夠幫助硬件開發(fā)者縮短開發(fā)的周期,使得硬件資源更好地被分享。
關(guān)鍵詞:硬件部件;設(shè)計(jì);專用;搜索引擎
中圖分類號(hào):TP391.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 23-0000-02
對(duì)于現(xiàn)在的硬件開發(fā)者來說,進(jìn)行設(shè)計(jì)的時(shí)候都是由最開始的“與”“非”邏輯關(guān)系開始對(duì)電路進(jìn)行整體設(shè)計(jì),把電路系統(tǒng)組成一個(gè)個(gè)的模塊,然后再用全部的模塊進(jìn)行拼裝,組成一個(gè)相應(yīng)的硬件部件結(jié)構(gòu)。這樣的直接結(jié)果就是使得硬件被開發(fā)的周期大大延長。如果我們?cè)谶M(jìn)行研制和開發(fā)的時(shí)候可以把一些資源進(jìn)行重復(fù)利用(例如數(shù)據(jù)通路模塊、計(jì)算器模塊、浮點(diǎn)運(yùn)算部件、門禁控制電路、電梯控制電路、交通信號(hào)燈控制電路等硬件部件設(shè)計(jì))并用這些被重復(fù)利用的資源進(jìn)行對(duì)于規(guī)模較大的硬件模塊或者是部件進(jìn)行合理利用以及重組,將能使得整個(gè)硬件資源的開發(fā)周期被大大縮短,節(jié)約大量的人力物力。在當(dāng)前計(jì)算機(jī)網(wǎng)絡(luò)高度發(fā)展的今天,高速傳遞信息的互聯(lián)網(wǎng)為這個(gè)想象奠定了合適的基礎(chǔ)?;ヂ?lián)網(wǎng)也使得對(duì)這些硬件代碼進(jìn)行重復(fù)利用以及開發(fā)提供了相應(yīng)的平臺(tái)。因此有許多科研工作者希望能夠仿造網(wǎng)上的搜索引擎的形式,從浩瀚的硬件代碼程序當(dāng)中迅速定位自己的需求。但是至少在現(xiàn)在,這個(gè)構(gòu)想還不能夠?qū)崿F(xiàn),因?yàn)楝F(xiàn)在的搜索引擎很難通過硬件系統(tǒng)本身的特征碼進(jìn)行定位和識(shí)別。但是經(jīng)過廣大人員的不懈努力,一種新的專業(yè)搜索硬件部件的搜索引擎已經(jīng)被開發(fā)了出來,下面本文將會(huì)簡(jiǎn)單介紹一下這個(gè)搜索引擎。
1 通用搜索引擎在進(jìn)行對(duì)硬件部件進(jìn)行搜索的時(shí)候所產(chǎn)生的問題
現(xiàn)有的通用搜索引擎主要是建立在web搜索的基礎(chǔ)之上的,能夠很好地幫助用戶對(duì)互聯(lián)網(wǎng)當(dāng)中的各種文檔資源進(jìn)行搜索,比如說html、word、ppt、excel等文件。但是對(duì)于其他的文件來說,建立在web基礎(chǔ)之上的搜索引擎就出現(xiàn)了搜索不利的情況。對(duì)于比如百度谷歌之類的搜索引擎來說,其主要的工作流程是這樣的:首先使用爬蟲程序?qū)φ麄€(gè)互聯(lián)網(wǎng)當(dāng)中的網(wǎng)頁資源進(jìn)行篩選,然后對(duì)這些文件資源以及網(wǎng)頁進(jìn)行全面的分析,從里面提取出相應(yīng)的關(guān)鍵字,并把這些關(guān)鍵字做成索引的形式進(jìn)行排列。然后,搜索引擎利用這些自己被建立起來的索引,對(duì)廣大使用互聯(lián)網(wǎng)的人員進(jìn)行網(wǎng)頁以及文檔資源搜索的服務(wù)。但是,這種搜索的方式對(duì)于硬件系統(tǒng)來說并不能起到多大的作用。硬件部件的設(shè)計(jì)和網(wǎng)頁文檔設(shè)計(jì)的方式是有一定區(qū)別的,其主要的構(gòu)成成分是二進(jìn)制代碼或者是字節(jié)代碼,后綴的設(shè)計(jì)和文檔以及網(wǎng)頁有著本質(zhì)的區(qū)別。因此,現(xiàn)有的通用搜索引擎很難對(duì)硬件搜索產(chǎn)生多么大的作用。
2 針對(duì)硬件部件設(shè)計(jì)的專用搜索引擎設(shè)計(jì)描述
根據(jù)這種無法被普通搜索引擎檢查出的窘?jīng)r,世界上已經(jīng)設(shè)計(jì)出了幾種專業(yè)對(duì)硬件進(jìn)行搜索的引擎,比如Agora或者alpha Beans以及我國自主研發(fā)的SE4SC等。這些搜索引擎在進(jìn)行開發(fā)的時(shí)候都要求發(fā)布資源的人對(duì)自己的資源進(jìn)行詳細(xì)的信息描述,一時(shí)的軟件被相應(yīng)的工具所支持。同時(shí),在資源發(fā)布的時(shí)候,硬件開發(fā)者也有相應(yīng)的要求:除了對(duì)資源進(jìn)行共享之外,還要把硬件本身的信息,即分類信息和描述信息,也同時(shí)發(fā)到互聯(lián)網(wǎng)上,使得檢索者能夠更加方便地對(duì)硬件本身的設(shè)計(jì)資料進(jìn)行歸類和下載。另一方面,從這個(gè)搜索引擎的實(shí)用性上來說,搜索引擎也應(yīng)當(dāng)為查詢者服務(wù),使得對(duì)于硬件資源重新利用的研究者獲得相應(yīng)的足夠信息,并對(duì)查詢活動(dòng)進(jìn)行高效的回復(fù)。為了確保其實(shí)用性,搜索引擎一般來說在進(jìn)行大規(guī)模的查找的同時(shí),一般來說只進(jìn)行相應(yīng)范圍之內(nèi)的粗略查找。也就是說,搜索引擎在全部的資源當(dāng)中按照條件對(duì)一組最符合要求的資源進(jìn)行定位。由于硬件資源本身設(shè)計(jì)的特殊性,相對(duì)于網(wǎng)頁以及文檔等大量搜索,對(duì)于硬件的搜索則要精確的多。用戶可以在搜索的結(jié)果基礎(chǔ)上,利用其他的方式對(duì)自己的結(jié)果進(jìn)行細(xì)化分類,進(jìn)一步獲得自己所需要的設(shè)計(jì)。
3 專業(yè)搜索引擎的工作流程——以SEHD1為例
首先是對(duì)互聯(lián)網(wǎng)當(dāng)中的硬件部件設(shè)計(jì)資源進(jìn)行精準(zhǔn)的定位。利用爬蟲程序從互聯(lián)網(wǎng)當(dāng)中找到具有硬件特性的相應(yīng)資源,比如sch.abl.vhd.pcb等后綴的文件以及帶有以上鮮明特征的網(wǎng)頁信息和網(wǎng)站信息,并對(duì)HCD-S的信息描述進(jìn)行準(zhǔn)確定位和抓取,如果沒有這個(gè)信息的時(shí)候則在只需要抓取文件名即可。
其次是對(duì)索引的建立。其分類方式主要是看HCD-S心息描述體當(dāng)中的設(shè)計(jì)進(jìn)行詳細(xì)大分類,然后再按照工具子類的方式進(jìn)行第二級(jí)的分類,然后就會(huì)按照詳細(xì)信息進(jìn)行入表設(shè)計(jì)。首先是按照標(biāo)題的名稱和整個(gè)標(biāo)題的索引進(jìn)行對(duì)比,根據(jù)比較的結(jié)果來進(jìn)行下一步行動(dòng)的執(zhí)行方案。根據(jù)不同的標(biāo)題名稱再對(duì)每一個(gè)標(biāo)題名稱的屬性表進(jìn)行獲取,在整個(gè)屬性表當(dāng)中存入這個(gè)文件的具體信息,這些具體信息主要包括網(wǎng)頁的地址、站點(diǎn)名稱、標(biāo)題本身的權(quán)重值以及所發(fā)布的描述信息詳情等等。如果發(fā)布資源的人沒有遵守HCD-S的方式對(duì)資源進(jìn)行充分的描述,就可以把標(biāo)題當(dāng)成關(guān)鍵字,按照關(guān)鍵字的方式進(jìn)行檢索列表的抓取以及獲得。
第三點(diǎn)就是搜索引擎為進(jìn)行資源搜索的用戶提供資源搜索的服務(wù)。SEHD1為整個(gè)搜索引擎的使用者提供了兩種方式進(jìn)行搜索。首先是關(guān)鍵字搜索的方式。使用者在搜索引擎的輸入框架當(dāng)中對(duì)關(guān)鍵字進(jìn)行輸入以獲得和網(wǎng)站本身的交換請(qǐng)求。關(guān)鍵字檢索器按照索引表中的排序結(jié)果進(jìn)行排序,通過搜索者對(duì)每一項(xiàng)硬件的檢測(cè)結(jié)果進(jìn)行比對(duì),在通過相應(yīng)的鏈接觀察其對(duì)應(yīng)硬件的相應(yīng)詳細(xì)描述,這種搜索方式的特點(diǎn)就是算法簡(jiǎn)單,但是在匹配的精度上顯得不夠準(zhǔn)確。這樣可能會(huì)導(dǎo)致獲得的結(jié)果出現(xiàn)既多又雜的情況;第二個(gè)方法就是基于分類目錄的方式進(jìn)行搜索。查找資源的人通過對(duì)整個(gè)體系進(jìn)行分類,來對(duì)整個(gè)硬件進(jìn)行充分設(shè)計(jì),檢索器對(duì)這個(gè)條件進(jìn)行篩選之后,對(duì)其中最合適的硬件進(jìn)行充分篩選,并把其相應(yīng)的詳細(xì)描述進(jìn)行反饋,使得使用者能夠充分查找到所需要的配件。基于整個(gè)分類體系的目錄搜索方式最大的特點(diǎn)就是把工作重點(diǎn)放到了使用者所關(guān)心的基本信息之上,使得搜索者能夠用最短的時(shí)間理解其最重要的信息,使用起來極其方便,對(duì)于搜索的準(zhǔn)確率也大大提高了。并且在相應(yīng)的范圍上能夠?qū)溥x的資料進(jìn)行初步的篩選,縮小搜索的空間。
4 結(jié)論
由于對(duì)于硬件的搜索程度遠(yuǎn)遠(yuǎn)不如對(duì)于軟件搜索的程度,現(xiàn)在的搜索引擎還遠(yuǎn)遠(yuǎn)不能滿足當(dāng)前的查找需求;當(dāng)查找的規(guī)模逐漸擴(kuò)大之后,這種算法將會(huì)造成引擎服務(wù)器的運(yùn)算負(fù)擔(dān)過重,造成搜索不暢。因此,科研人員應(yīng)該充分開發(fā)搜索引擎資源,提高算法質(zhì)量,提高效率。
參考資料:
[1]Lin Shian-Hua;Chen Meng Chang;Ho Jan-Ming ACIRD:Intelligent internet document organization andretrieval[J],2002(03).
[2]李愛紅.網(wǎng)絡(luò)搜索引擎的比較研究[J].中國信息導(dǎo)報(bào),1999.
[3]沈美娥,應(yīng)時(shí).一種專用的軟件組件搜索引擎[J].計(jì)算機(jī)工程與應(yīng)用,2005(21).
[4]林小茶,王鐵峰,應(yīng)時(shí).硬件設(shè)計(jì)搜索引擎的信息描述體設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用與軟件,2006(01).
計(jì)算機(jī)光盤軟件與應(yīng)用2012年23期