劉強 鄧曉衡
【摘 要】文章分析了高校當(dāng)前本科畢業(yè)設(shè)計管理的現(xiàn)狀,基于畢業(yè)設(shè)計的動態(tài)管理過程,將原本復(fù)雜繁瑣的過程進(jìn)行優(yōu)化,通過互聯(lián)網(wǎng)技術(shù)實現(xiàn)使其簡單化、智能化。文章對畢業(yè)設(shè)計管理平臺相關(guān)功能進(jìn)行了分析,并對核心功能選題模塊中用到的Gale-Shapley婚姻匹配算法、相似度檢測模塊中涉及的網(wǎng)絡(luò)爬蟲、正文提取算法、分詞算法、相似度檢測算法進(jìn)行了論述。系統(tǒng)基于B/S模式架構(gòu),并通過設(shè)計移動APP,使用戶可以通過各類終端提交畢業(yè)設(shè)計過程資料,極大地方便了畢業(yè)設(shè)計管理工作。
【關(guān)鍵詞】畢業(yè)設(shè)計管理;婚姻匹配;網(wǎng)絡(luò)爬蟲;相似度檢測
【中圖分類號】TP311.52 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1674-0688(2016)11-0037-03
0 引言
進(jìn)入21世紀(jì)以來,互聯(lián)網(wǎng)技術(shù)迅速發(fā)展,給各類產(chǎn)業(yè)實現(xiàn)信息化提供了必要條件。作為走在時代前沿的高等學(xué)校,信息化建設(shè)步伐也相對較快,寬帶校園、數(shù)字化校園、移動校園、智慧校園等信息化建設(shè)項目應(yīng)運而生[1]。
畢業(yè)設(shè)計作為高校必備的教學(xué)環(huán)節(jié)之一,如何實現(xiàn)信息化已經(jīng)受到各高校的重視。由于畢業(yè)設(shè)計持續(xù)周期較長,中間環(huán)節(jié)多而雜;再者,在當(dāng)前就業(yè)形式下,學(xué)生在畢業(yè)設(shè)計期間基本要在參加招聘會和畢業(yè)設(shè)計之間來回奔波,由于學(xué)生所在地的不確定,加上當(dāng)前互聯(lián)網(wǎng)技術(shù)日益發(fā)達(dá),采用B/S結(jié)構(gòu)的軟件實現(xiàn)畢業(yè)設(shè)計全過程的監(jiān)控管理,有著迫切的需求和較好的實用價值[2-3]。
同時,由于互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)共享資源日益豐富,學(xué)生接觸的信息面越來越廣,網(wǎng)絡(luò)文檔對畢業(yè)設(shè)計各環(huán)節(jié)的影響也越來越大,甚至有學(xué)生直接下載論文應(yīng)付了事。面對這些學(xué)術(shù)不端行為,如何進(jìn)行管控,也需要信息化手段進(jìn)行輔助[4]。
設(shè)計實現(xiàn)一個畢業(yè)設(shè)計管理平臺,并引入移動互聯(lián)網(wǎng)應(yīng)用,使教師、學(xué)生、管理員通過系統(tǒng)完成畢業(yè)設(shè)計全階段的工作,對畢業(yè)設(shè)計監(jiān)控管理有著現(xiàn)實的意義,對提高高校教學(xué)水平、提高畢業(yè)生質(zhì)量有著重要的意義[5]。
1 系統(tǒng)分析
1.1 系統(tǒng)總體架構(gòu)
畢業(yè)設(shè)計管理系統(tǒng)主要是針對畢業(yè)設(shè)計全過程的監(jiān)控,并且設(shè)置不同的角色來進(jìn)行分類管理。系統(tǒng)充分利用互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的優(yōu)勢,使管理過程實現(xiàn)網(wǎng)絡(luò)化、智能化。
平臺主要使用PHP完成服務(wù)器端腳本的編寫,使用MYSQL數(shù)據(jù)庫對畢業(yè)設(shè)計期間產(chǎn)生的各種數(shù)據(jù)進(jìn)行分析和管理??紤]到當(dāng)前移動互聯(lián)網(wǎng)的發(fā)展?fàn)顩r,以及畢業(yè)設(shè)計期間學(xué)生找工作對畢業(yè)設(shè)計工作的影響,平臺設(shè)計實現(xiàn)了一個基于android平臺的移動APP,方便學(xué)生和教師隨時隨地了解畢業(yè)設(shè)計信息。移動APP由JAVA開發(fā),而為了實現(xiàn)數(shù)據(jù)的統(tǒng)一性,移動APP對系統(tǒng)數(shù)據(jù)訪問仍舊采用PHP編寫的API完成。利用PHP編寫API也為后期實現(xiàn)IOS應(yīng)用提供了方便[5]。
1.2 功能需求分析
畢業(yè)設(shè)計網(wǎng)絡(luò)化管理平臺設(shè)計是面向全校的一個開放式畢業(yè)設(shè)計管理,因此畢業(yè)設(shè)計平臺包含的角色有學(xué)生、教師、系部管理員、院管理員、超級管理員。因為平臺是基于Web模式的,所以學(xué)生和老師在具備Internet訪問條件的任何地點都可以訪問系統(tǒng)。
1.3 業(yè)務(wù)流程分析
系統(tǒng)是根據(jù)教師和學(xué)生在整個畢業(yè)設(shè)計過程中所經(jīng)歷的階段和各階段工作任務(wù)的特點而開發(fā)的,并根據(jù)信息系統(tǒng)特點,對部分流程進(jìn)行了優(yōu)化。優(yōu)化后畢業(yè)設(shè)計流程如圖1所示。
畢業(yè)設(shè)計工作的14個環(huán)節(jié)首先從發(fā)布畢業(yè)設(shè)計通知、啟動畢業(yè)設(shè)計系統(tǒng)開始,按照執(zhí)行的先后次序,依次被分為選題階段的教師資格申報、課題申報、選題、下達(dá)任務(wù)、開題報告;其次是整個畢業(yè)設(shè)計中間環(huán)節(jié)的檢查,包括前期、中期、提交、檢測、評閱等;最后階段則是論文答辯、論文修改和各類材料的歸檔。當(dāng)學(xué)生完成開題,畢業(yè)設(shè)計課題即成為貫穿畢業(yè)設(shè)計過程的主線[6]。
2 系統(tǒng)設(shè)計與實現(xiàn)
2.1 系統(tǒng)功能設(shè)計
根據(jù)對畢業(yè)設(shè)計的總體調(diào)研及分析,將畢業(yè)設(shè)計系統(tǒng)分為基礎(chǔ)信息管理、參數(shù)設(shè)置、教師信息管理、學(xué)生信息管理、課題信息管理、分組信息管理、文檔管理、數(shù)據(jù)管理、相似度檢測、評閱管理、新聞管理11個功能模塊[6],畢業(yè)設(shè)計系統(tǒng)總體功能模塊圖如圖2所示。
畢業(yè)設(shè)計管理平臺采取分角色的權(quán)限控制,對不同的功能模塊,不同的用戶進(jìn)入之后,將具有不同的訪問權(quán)限和不同的結(jié)果顯示。
2.2 系統(tǒng)實現(xiàn)相關(guān)算法
2.2.1 自動分組
指導(dǎo)教師通過導(dǎo)師資格審核、完成課題申報,且經(jīng)過系管理員審核通過后,學(xué)生即可進(jìn)行課題的選擇。在課題選擇和分組時,考慮到大多數(shù)高校都要求一人一題,因此我們優(yōu)先采用了一對一匹配算法,也就是一個學(xué)生可以選擇一位最滿意的教師,而教師也可以選擇自己心儀的學(xué)生,有人把這種算法稱之為Gale-Shapley算法,也稱之為婚姻匹配算法[7]。
婚姻匹配算法并不能直接應(yīng)用于畢業(yè)設(shè)計系統(tǒng),必須進(jìn)行相應(yīng)的改進(jìn)。這是因為在選題和分組時,假設(shè)把學(xué)生看成“男方”N,課題看成“女方”M,通過選題過程后,會出現(xiàn)N對M有滿意度,但是M對N卻沒有滿意度,因此無法直接進(jìn)行婚姻匹配。這就需要考慮只利用N對M的滿意度程度對課題志愿進(jìn)行排序,然后完成課題的自動分配[7]。
課題選擇時,每個學(xué)生最多可以選擇3個課題,學(xué)生可以根據(jù)自己的意愿對課題進(jìn)行排序,分別設(shè)置為第一、二、三志愿,當(dāng)進(jìn)行課題分組時,首先依據(jù)課題,得到課題選擇的滿意度序列,以滿意度序列作為分組順序。當(dāng)出現(xiàn)多個學(xué)生都很中意某個課題時,而引入第二個排序種子——選題時間,如果選題時間排序也無法區(qū)分,則系統(tǒng)產(chǎn)生“隨機數(shù)”種子,輔助排序來完成課題的分配。如果自動分組完成,仍有學(xué)生沒有分配到課題,則由管理員手動調(diào)劑志愿,保證每個學(xué)生都能夠選擇到課題。
2.2.2 網(wǎng)絡(luò)爬蟲的設(shè)計
在畢業(yè)設(shè)計系統(tǒng)中引入網(wǎng)絡(luò)爬蟲是基于相似度檢測的需要。同時,因為本系統(tǒng)設(shè)計的服務(wù)對象是高校內(nèi)部師生,所以不需要高強度的網(wǎng)絡(luò)爬取。當(dāng)指導(dǎo)老師申報完成課題之后,系統(tǒng)設(shè)計的分詞算法對畢業(yè)設(shè)計課題進(jìn)行分詞,提取其中的關(guān)鍵字。通過這些關(guān)鍵字把與課題相關(guān)的資源都爬取下來。爬蟲在爬取網(wǎng)頁時,找到最匹配的網(wǎng)頁,比如直接有對課題相關(guān)描述的網(wǎng)頁,然后依此網(wǎng)頁為種子,只要是跟該網(wǎng)頁URL地址有聯(lián)系(超級鏈接)的網(wǎng)頁都一一收集過來,再以收集到的網(wǎng)頁為種子,收集其他網(wǎng)頁,周而復(fù)始,把所有的網(wǎng)頁都收入庫中。
2.2.3 構(gòu)建論文檢測庫
(1)構(gòu)建網(wǎng)頁庫。畢業(yè)設(shè)計系統(tǒng)中的爬蟲程序有專門的線程負(fù)責(zé)將網(wǎng)頁存取到磁盤,而且會對每一個抓取的網(wǎng)頁給予一個計算出的簽名,該簽名是唯一的。爬蟲網(wǎng)頁存入磁盤,構(gòu)建一個網(wǎng)頁庫WEBpages,而且把系統(tǒng)所用的URL地址、網(wǎng)頁相關(guān)參數(shù)等保存進(jìn)數(shù)據(jù)庫。
(2)歷年論文入庫。本系統(tǒng)在設(shè)計過程中,除了對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行收集入庫外,還把近年所有學(xué)生的畢業(yè)設(shè)計論文、開題報告等文檔資料入庫。學(xué)生通過本系統(tǒng)提交論文時,將進(jìn)行一次內(nèi)部檢測,避免學(xué)生出現(xiàn)交叉抄襲的情況出現(xiàn)。
2.2.4 正文提取
在相似度檢測時,WORD文檔、PDF文檔、網(wǎng)頁中的有些標(biāo)記是不被識別的,或者說沒有存在的實際意義。因此,在進(jìn)行檢測時要把腳本程序、樣式表等去掉,例如把網(wǎng)頁中的HEAD、div等使用正則表達(dá)式去掉,同時替換些標(biāo)記,從而取得網(wǎng)頁的正文,這樣可以很方便地進(jìn)行分詞,進(jìn)而完成相似度對比。
2.2.5 分詞的功能的設(shè)計與實現(xiàn)
畢業(yè)設(shè)計系統(tǒng)中的相似度檢測主要是對中文進(jìn)行比對,因此側(cè)重點也是中文分詞。中文分詞則是指按照一定的規(guī)則將一個中文語句串分割成若干個關(guān)鍵詞的過程。關(guān)于分詞技術(shù),算法眾多,在畢業(yè)設(shè)計管理平臺中我們選取了基于字典的分詞技術(shù),就是獲取一段文字后先進(jìn)行分割,分成N個小段,比如以“,”或者“?!弊鳛榉指顥l件,然后再對每一段進(jìn)行處理。處理的過程比較簡單,使用正向匹配,從第一個字開始,然后查字典,如果字典存在這個字,就表示分詞成功;如果不存在,則指針向后一位再查字典,直到整句話分詞完成。
2.2.6 相似度識別功能的設(shè)計與實現(xiàn)
中文字符串分詞及相似度匹配的算法形式有很多。在畢業(yè)設(shè)計系統(tǒng)的相似度識別中,為了得到2個字符串的相似程度,我們采用二元變量來判斷與比較。首先對學(xué)生提交的論文進(jìn)行分詞處理,然后把處理完成的數(shù)據(jù)與論文檢測庫的分詞結(jié)果集進(jìn)行匹配,最后得到相似的程度。
3 結(jié)論
在系統(tǒng)設(shè)計過程中,我們參考了各類畢業(yè)設(shè)計的通用流程,最后結(jié)合湖南工業(yè)大學(xué)對畢業(yè)設(shè)計過程的全部需求定制開發(fā)而成,同時對部分流程根據(jù)信息化的需求進(jìn)行了優(yōu)化,并且已經(jīng)在實際的操作中運行了4年,在這4年中,根據(jù)技術(shù)的進(jìn)步和管理需要,我們對系統(tǒng)進(jìn)行了部分優(yōu)化。系統(tǒng)目前已經(jīng)基本滿足了高校畢業(yè)設(shè)計管理的全過程需求,對畢業(yè)設(shè)計管理工作起到了很好的規(guī)范作用。
參 考 文 獻(xiàn)
[1]徐莉.信息化已經(jīng)上升為國家戰(zhàn)略[J].中國教育信息化,2013(7):6-10.
[2]梁金明.基于WEB的畢業(yè)設(shè)計管理與監(jiān)控系統(tǒng)設(shè)計[J].四川理工學(xué)院學(xué)報(自然科學(xué)版),2011(5):537-540.
[3]初作瑋.畢業(yè)設(shè)計選題系統(tǒng)[D].長春:吉林大學(xué),2010.
[4]龔云飛.本科畢業(yè)設(shè)計學(xué)術(shù)不端防治體系的構(gòu)建[J].黑龍江教育(高教研究與評估),2014(10):79-80.
[5]王爽.高校網(wǎng)站站群管理系統(tǒng)的設(shè)計[J].西安文理學(xué)院學(xué)報(自然科學(xué)版):2011(4):77-79.
[6]廖成香.基于Web的畢業(yè)設(shè)計信息管理系統(tǒng)設(shè)計開發(fā)[D].廣州:廣東工業(yè)大學(xué),2005.
[7]鄧蔚之,劉強,等.優(yōu)化的Gale-Shapley算法在學(xué)生選課問題中的應(yīng)用[J].湖南工業(yè)大學(xué)學(xué)報,2013(1):22-24.
[責(zé)任編輯:鐘聲賢]