趙 楊 姜 穎 金英蘭
(沈陽大學(xué) 遼寧 沈陽 110044)
高考對于每個學(xué)生而言都十分重要,它不僅決定一個人的命運,更甚至決定一個家庭、一個家族的命運,如果說高考是一個人邁向新階段的起點,那么高考后的志愿填報就是決定我們能否進入這個新階段的關(guān)鍵。基于大數(shù)據(jù)的高考志愿輔助填報系統(tǒng),通過大數(shù)據(jù)分析與數(shù)據(jù)挖掘,可為廣大考生提供海量真實、有價值的高考志愿填報信息,并提供院校/專業(yè)查詢,該系統(tǒng)具有數(shù)據(jù)分析、投檔分析、模擬填報等功能,幫助廣大考生報考理想學(xué)校,提高錄取機率。
高考志愿輔助填報系統(tǒng)是針對考生需求而設(shè)計的,因而首先綜合分析了考生在填報志愿過程中存在的問題,并歸納總結(jié)如下:(1)面對互聯(lián)網(wǎng)海量的高校宣傳信息,考生缺乏快速、準(zhǔn)確辨識有用信息的甄別能力;(2)考生對自身的職業(yè)傾向不明確,對高校的專業(yè)設(shè)置、專業(yè)發(fā)展前景、就業(yè)方向缺乏明確認識;在此基礎(chǔ)上,本文設(shè)計開發(fā)了高考志愿輔助填報系統(tǒng),以考生為主體,通過采集考生的成績排名和考生志愿填報的主要意向(專業(yè)和城市)信息,基于大數(shù)據(jù)的計算得到適合考生意向的院校、專業(yè)等信息;通過成績排名和歷年專業(yè)分數(shù)線排名得到錄取概率。
本文設(shè)計的高考志愿輔助填報系統(tǒng)由院校/專業(yè)咨詢、數(shù)據(jù)分析、測評中心等功能模塊組成。系統(tǒng)功能模塊如圖 1所示。
圖1 系統(tǒng)功能模塊
(1)院校/專業(yè)咨詢模塊。本模塊分為院校信息庫和專業(yè)信息庫兩個子功能模塊。其中院校信息庫子功能模塊設(shè)置了區(qū)域、院校類別、985/211、大學(xué)名稱等查詢條件,系統(tǒng)可根據(jù)用戶設(shè)置的查詢條件自動甄選目標(biāo)院校,并提供目標(biāo)院校的學(xué)校類型、學(xué)歷層次、院校介紹、重點學(xué)科、特色專業(yè)、學(xué)科評估等信息,幫助考生快速了解目標(biāo)院校的相關(guān)信息。專業(yè)信息庫子功能模塊主要包括專業(yè)介紹的查詢功能。專業(yè)介紹查詢功能可根據(jù)用戶選擇的目標(biāo)專業(yè)向用戶展示該專業(yè)的科目設(shè)置、發(fā)展前景和就業(yè)方向,幫助考生根據(jù)個人興趣遴選目標(biāo)專業(yè)。(2)數(shù)據(jù)分析模塊。本模塊中院校數(shù)據(jù)分析模塊可根據(jù)用戶設(shè)置的院校名稱、所在區(qū)域等查詢條件,從高考志愿填報數(shù)據(jù)庫中查詢該校往年的投檔分數(shù)、計劃招生人數(shù)、錄取最低分、錄取最高分、批次分數(shù)線等信息為考生提供參考。(3)測評中心模塊。本模塊是針對部分考生在填報志愿時由于自身的職業(yè)傾向不明確而導(dǎo)致專業(yè)選擇迷茫的情況而設(shè)計的,本模塊提供的測評有助于考生更加清晰地認識自我,明確職業(yè)方向,確定報考學(xué)校、專業(yè)。(4)本系統(tǒng)構(gòu)建的高考志愿填報信息庫以全國各高校官方數(shù)據(jù)信息的為依托,通過高校招生信息數(shù)據(jù)挖掘系統(tǒng)獲取院校、專業(yè)的最新招生信息。(5)高校招生信息數(shù)據(jù)挖掘系統(tǒng)設(shè)計。高校招生信息數(shù)據(jù)挖掘系統(tǒng)采用分布式體系結(jié)構(gòu),以高考志愿填報數(shù)據(jù)庫、普招電子數(shù)據(jù)、應(yīng)用編程接口、部分高校網(wǎng)絡(luò)應(yīng)用提供的大型數(shù)據(jù)文件為數(shù)據(jù)依托,采用分析、預(yù)測、關(guān)聯(lián)規(guī)則、聚類等挖掘方法,從大量的、不完全的、模糊的實際應(yīng)用數(shù)據(jù)中,發(fā)現(xiàn)隱含在其中的院校、專業(yè)之間的關(guān)系,通過對考生成績、院校關(guān)系、歷史錄取分數(shù)、招生計劃等有效信息進行分析、統(tǒng)計、推理,為考生填報志愿提供預(yù)測建議。
我們通過網(wǎng)頁設(shè)計、編寫算法、建立數(shù)據(jù)庫來實現(xiàn)高考志愿填報系統(tǒng)的運行。
我們利用Dreamweaver CS以及騰訊云軟件進行了多級頁面設(shè)計。例如院校庫、志愿選擇、專業(yè)解讀、咨詢等功能二級頁面的設(shè)計,“高校圈”中也嵌入了部分高校首頁的網(wǎng)頁鏈接。還使用騰訊云平臺制作了多個靜態(tài)頁面,以增加app的豐富度。
我們采用改進的K-Means算法,對本項目進行了整體的架構(gòu)設(shè)計,并寫出了算法文檔。我們從對考生志愿分析這一角度考慮并根據(jù)平行志愿方式的實際,考生填報志愿時要遵循一定的策略:如采取“沖A、穩(wěn)B、守C、保D”的方法。最終的聚類結(jié)果除了希望滿足均方誤差和較小這一目標(biāo)函數(shù)以外,還希望使得各個聚類中心之間的距離能盡量遠一些,從而實現(xiàn)我們想要得到的大數(shù)據(jù)智能篩選出我們推薦的學(xué)校專業(yè)等。
通過書籍、網(wǎng)絡(luò)等途徑已獲取部分高校及專業(yè)近年來的高考數(shù)據(jù),我們利用Mysql將獲取的這些數(shù)據(jù)進行整合,得到一個數(shù)據(jù)庫,從而支持算法的運行。
高考志愿的填報對考生能否被理想大學(xué)錄取起著關(guān)鍵性作用。本文介紹的“高考志愿輔助填報系統(tǒng)”綜合分析了考生在填報志愿過程中的各方面需求,應(yīng)用 K-Means算法、MySQL、大數(shù)據(jù)分析等技術(shù),為考生高考志愿填報提供信息查詢、投檔分析、模擬填報、報考預(yù)測等,具有較高的應(yīng)用價值。