李博涵 王紅蕾 青島黃海學(xué)院
據(jù)最新統(tǒng)計(jì),2019年研究生招生考試考生已達(dá)285萬(wàn)人,比去年增加47萬(wàn)人。但是,考研時(shí)對(duì)報(bào)考學(xué)校的選擇成為很多應(yīng)屆生面臨的首要問(wèn)題。有些同學(xué)因?yàn)椴涣私鈭?bào)考的相關(guān)知識(shí)而達(dá)不到預(yù)期的報(bào)考效果,甚至有些同學(xué)因此錯(cuò)過(guò)了深造的機(jī)會(huì)。
對(duì)于此類問(wèn)題我們首先考慮的是歸并算法,于是我們?cè)谝延械臍w并算法基礎(chǔ)上做出了改進(jìn)。首先我們先向內(nèi)存申請(qǐng)空間,該空間存儲(chǔ)排序序列之和。然后設(shè)置狀態(tài)指針,賦予指針初始值進(jìn)行合并空間操作,這一步的目的是進(jìn)行目標(biāo)院校的聚類操作,設(shè)置目標(biāo)狀態(tài)量作為指針改進(jìn)原有的歸并算法,將目標(biāo)院校,目標(biāo)專業(yè),師資力量,科研狀況,生活環(huán)境,學(xué)習(xí)氛圍以及綜合排名等作為序列。同時(shí)設(shè)置新的目標(biāo)狀態(tài)量作為新的指針,用來(lái)合并分?jǐn)?shù)、興趣、排名等序列與前序列進(jìn)行擬合,執(zhí)行歸并操作。
本文在數(shù)據(jù)結(jié)構(gòu)上基于歸并技術(shù),但在歸并技術(shù)上,我們改進(jìn)的算法復(fù)雜度低,結(jié)構(gòu)相對(duì)簡(jiǎn)單,實(shí)現(xiàn)相對(duì)容易,更實(shí)用,更適合數(shù)據(jù)聚類分析。擇校系統(tǒng)有大量的數(shù)據(jù),它可以被視為采樣點(diǎn),每個(gè)采樣點(diǎn)都有不同的屬性,輸出的結(jié)果是根據(jù)候選人的需要。根據(jù)不同屬性進(jìn)行數(shù)據(jù)分類,從而找到最合適的學(xué)校類型信息。
面對(duì)龐大的數(shù)據(jù)量與篩選數(shù)值,歸并算法執(zhí)行起來(lái)顯然力不從心,所以我們想到使用仿真技術(shù)的加持進(jìn)行分治,兩者配合使用有效的縮短了查詢所用時(shí)間亦提高效率。
首先,輸入算法的初始值,包括人工魚(yú)的范圍、位置坐標(biāo)、魚(yú)群的擁擠因子等等。將初始迭代次數(shù)設(shè)為0,然后在范圍內(nèi)生成n個(gè)隨機(jī)人工魚(yú)個(gè)體并計(jì)算隨機(jī)初始魚(yú)群中個(gè)體的食物濃度,并在公告欄中篩選出最大值。人工魚(yú)群個(gè)體通過(guò)模擬魚(yú)群的聚集和覓食行為,不斷地改變其狀態(tài),經(jīng)過(guò)一定時(shí)間后產(chǎn)生新的魚(yú)群。每只人工魚(yú)移動(dòng)一次后,它會(huì)檢查自己的狀態(tài),并將其與公告板上的狀態(tài)進(jìn)行比較。如果它比公告板更好,它會(huì)將其當(dāng)前狀態(tài)更新到公告板。最后確定迭代次數(shù)是否達(dá)到最大值,如果達(dá)到最大值,則將結(jié)果輸出到公告板上,否則,將從改變狀態(tài)產(chǎn)生新的魚(yú)群開(kāi)始繼續(xù)執(zhí)行。
根據(jù)人工魚(yú)群的行為描述可以得到每條人工魚(yú)個(gè)體都是依據(jù)其視線范圍搜尋其目前所處的境以及伙伴的狀況,由此達(dá)到幾個(gè)局部極值附近聚集人工魚(yú)的效果。通過(guò)這個(gè)方法我們不難發(fā)現(xiàn)目標(biāo)函數(shù)值較大的人工魚(yú)聚集在較大的值域附近,從而得到全局極值域。
本文將人工魚(yú)群算法運(yùn)用到擇校最優(yōu)解中,首先選取目標(biāo)函數(shù)為考生的擇校信息與某學(xué)校的相似度最高,數(shù)學(xué)模型如下:
由以上步驟可知,人工魚(yú)算法可以在較短時(shí)間內(nèi)將某個(gè)數(shù)據(jù)最近距離的極值點(diǎn)匯聚在一起,但是考慮到考生在檢索過(guò)程中可能不會(huì)將所有元素都輸入或者一些用戶的檢索歷史比較少或者比較多,都會(huì)造成一定的誤差,因此本文又采用了稀疏矩陣的方法將該系統(tǒng)進(jìn)行進(jìn)一步完善。
因?yàn)榭忌鷮?duì)學(xué)校的要求比較繁多,本文將這些檢索的信息進(jìn)行融合,形成一種屬性,根據(jù)屬性相似來(lái)為數(shù)據(jù)稀疏的同學(xué)推薦一些學(xué)校。
通過(guò)計(jì)算考生檢索的相似度較高的信息,將它們列成一個(gè)集合{Uk},記錄為稀疏矩陣,通過(guò)定義函數(shù)f(x,y,z)表示考生x與考生y關(guān)于某個(gè)要求的相似度。假設(shè)考生x與考生y都喜歡學(xué)術(shù)類比賽較多的學(xué)校,則 f(x,y,z)=1,否則 f(x,y,z)=0??梢酝ㄟ^(guò)以下算法進(jìn)行描述:用 表示對(duì)學(xué)術(shù)類比賽的要求所占的比重,
之后設(shè)置一個(gè)閾值w,如果考生所輸入的對(duì)學(xué)術(shù)類比賽的數(shù)據(jù)量低于w,則引入考生的屬性,融合考生屬性后,預(yù)測(cè)評(píng)分計(jì)算公式為:
其中N(x)表示所有與用戶屬性x相似的用戶集合,rxi表示用戶x對(duì)科技類比賽興趣i預(yù)測(cè)值。
通過(guò)以上三種方法的結(jié)合,既可以將系統(tǒng)內(nèi)所含院校進(jìn)行一個(gè)高效的分類,又可以更智能的為用戶匹配出適合自己的學(xué)校。
本文采用計(jì)算機(jī)算法并進(jìn)行初步模擬,驗(yàn)證了算法的可行性,但是只有算法是遠(yuǎn)遠(yuǎn)不夠,我們還需要大量的數(shù)據(jù)來(lái)進(jìn)行模擬,以此達(dá)到最優(yōu)的效果。從國(guó)內(nèi)研究現(xiàn)狀來(lái)看,大多數(shù)學(xué)者只分析了考研擇校的現(xiàn)狀及影響因素,并沒(méi)有建立考研擇校指南平臺(tái),沒(méi)有真正為考研學(xué)生提供便利。本項(xiàng)目結(jié)合軟件建模和計(jì)算機(jī)算法,創(chuàng)建指南系統(tǒng),為考研學(xué)生提供真正的便利。