亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數據技術在高校學生助學金評比中的應用

        2017-05-31 13:48:24李豐
        計算機教育 2017年5期
        關鍵詞:助學金大數據

        李豐

        摘 要:高校助學金評比主要依據為學生家庭經濟情況,如何通過學生檔案數據、校內外兼職數據和校內一卡通使用相關數據真實反映學生經濟狀況是關鍵。文章針對這一問題提出使用PostgreSQL作為非關系型數據庫,使用可編程統計分析軟件R對存儲流進行分析和建模后數據挖掘,通過對上述數據進行采集、數據提取和存儲、數據計算和分析等過程,產生學生消費數據分析匯總表,作為學生助學金評比的重要依據。

        關鍵詞:大數據;助學金;PostgreSQL;統計分析軟件R

        文章編號:1672-5913(2017)05-0154-04

        中圖分類號:G642

        1 大數據技術和高校學生行為活動中大數據的產生

        1.1 大數據的產生

        隨著計算機相關信息技術和互聯網技術的推廣與發(fā)展,互聯網根據應用協議在信息傳輸中大規(guī)模運用“請求”+“響應”模式。所有接入互聯網的設備、軟件等客戶端通過發(fā)送數據主動提出服務請求,服務器端會根據指令發(fā)送相應的請求數據,用戶在客戶端上的每一次訪問請求其實就是一次鼠標點擊或鍵盤輸入數據的操作,在服務器的操作日志中,會忠實地記錄下每個人“訪問的時間、請求的命令、訪問的網址”[1]等數據。用戶在網絡上或各種應用系統操作中產生的各種數據就像生活中不經意間留下的各種各樣痕跡一樣,這些痕跡串連到一起,交織成了網民們在互聯網上的各種行為軌跡。這些貌似雜亂無章的各種龐大數據,經過量的積累完成了質的飛躍,數據中蘊含著巨大的價值。

        類似的數據之間“具有非關系型、無序”,被稱為非結構化大數據,包含文字、圖片、視頻、音頻等[2],過去幾十年中已經積累了好多,未來還會有更多的數據呈幾何級數增長,而云計算的產生和云技術的不斷成熟,為大數據的存在提供了巨大的存儲空間和合理的訪問技術,為數據分類、查詢和透視分析帶來了可能,從而使得大數據技術成為信息技術發(fā)展到一定階段后再次產生質的飛躍的必然產物。

        1.2 高校學生活動中的大數據

        高等學校是一個人員非常密集的生活教育場所,校內學生是信息技術的天然受眾,學生的出行、購物、飲食起居、生活娛樂、接受教育等過程中,各種數據終端的使用和各種系統的應用,會在無形中產生巨大的數據量。如果對這些數據加以運用,可以更好地改善學生生活服務質量,提升服務水平。

        (1)高校原始基本數據的產生。主要是指學生和學校原始基本數據的錄入,如每年的“高等學校數據平臺”和“高等學?;鶎咏y計報表”中學校相關數據的全方位輸入、學校固定資產管理系統中資產增加或淘汰后的信息更新、高校實驗室信息管理系統中實驗實訓設備數據的更新以及每年新生入學后所有新生基本數據的導入。

        (2)應用系統中數據的產生。目前學校使用的各種信息化系統主要有進出校門的門禁系統、平時服務的校園一卡通系統、教學管理方面的教務管理系統和學工管理系統、學生學費管理方面的財務管理系統、圖書借閱方面的圖書管理系統、行政辦公方面的OA辦公系統、學生聯系方面的校迅通、固定資產管理方面的資產設備管理系統,另外還有校園BBS和百度貼吧中的各種文本內容和視頻監(jiān)控系統中的各種數據。以上一系列信息設備的使用,不僅僅方便了高校管理,而且在系統使用過程中產生出大量的中間數據,這些來源廣泛的數據,其類型呈現多樣化的形式,有結構化數據、半結構化數據和視頻、音頻、圖形等非結構化的數據。這些中間數據和互聯網上相關的學生活動數據整合起來,和基礎數據一起進行過濾、清洗與整合,共同組成能反映學生各方面生活學習細節(jié)的原始大數據。

        2 學生助學金評比中涉及的相關數據

        通過與學生資助管理部門工作人員、高校中各系分管學生工作人員和輔導員溝通交流,他們一致認為學生助學金和學生獎學金是有很大區(qū)別的,它存在的目的為資助家庭經濟困難學生完成學業(yè),因此評比標準中最重要的一條就是學生家庭經濟情況。大數據技術使用的最終目的是如何真實反映學生家庭經濟情況,數據的采集和整理可從以下幾方面考慮。

        (1)學生學籍檔案中體現出的各種數據,如家庭年收入情況、父母居住地為農村或城市、是否為單親或離異家庭、父母工作單位、主要社會關系、學生健康狀況等各種數據,這些信息可以作為評定學生助學金的一個重要參考,但由于助學金評定范圍廣、參與學生多,對一些家庭經濟情況不太明顯的學生,參考價值就不是太大。

        (2)學生校內外兼職數據。這個數據主要涉及兩方面,一方面是兼職遲早問題,也就是大一就開始兼職,還是大二或大三才開始兼職,兼職越早從理論上來說,家庭經濟情況可能更差;另一方面是兼職時間問題,每周多少小時,時間越長、權重越高,有的學生可能有幾份兼職;最后是兼職地點問題,校外兼職還是校內兼職。

        (3)學生在校內餐廳、小賣部等處刷卡消費數據。這個是學生助學金發(fā)放依據的主要數據,最能說明問題,由以下幾點組成:①刷卡頻次問題,因為學校餐廳的就餐費用相對來說比較低,所以頻次太低的同學雖然每月刷卡金額總數少,但不能說明家庭經濟情況差,頻次太高的同學說明家庭經濟情況相對較好,所以經過認真核對之后,把每月刷卡頻次大于平均頻次1/3的同學數據提取,其他淘汰;②刷卡金額問題,家庭經濟情況不好的同學刷卡頻次一般,就餐時可能以主食為主,中高價菜肴和小賣部較貴物品購買較少,每月平均單次刷卡金額一定不會太高;③刷卡時間問題,因涉及學生服務和利益因素,學生食堂開放時段很長,對單個學生來說如果長期刷卡時間和正常上課時間重復,說明該生學習態(tài)度和學習積極性有問題。

        3 大數據技術的使用和解決方案

        3.1 技術分析和工具的使用

        由上文的大數據技術應用和學生助學金評定中大數據的產生可以看出,技術上問題的解決實際就是對產生的大數據進行恰當的采集、合理的分類存儲并最終正確計算分析的過程[3]。這個過程中涉及兩個技術問題:一個是數據的分類存儲過程中需要將原來的數據導入能夠進行大數據技術應用的相關數據庫中,如Hadoop++、HBase、HadoopDB、Hive等;另一個是導入過程和計算分析過程需要用到的工具,如OCTAVE、SCILAB、R軟件等[4]。經過對數據庫規(guī)模、計算速度、適用性、使用熟練程度等綜合分析,我們決定在數據庫方面使用PostgreSQL,在對存儲流進行分析和建模后的數據挖掘過程中使用可編程統計分析軟件R,理由有以下幾點:①這兩款軟件都是開源的免費軟件,從技術方面看成本特別低,有利于高校的開發(fā)和使用;②PostgreSQL 是一個對象—關系數據庫服務器,涵蓋極其豐富的數據類型支持和十幾種平臺支持,具備多版本并行控制系統(MVCC)、子查詢、數據完整性檢查等多種特性,雖然在數據庫集群方面有所欠缺,但是正好適用于本系統的數據存??;③R軟件能夠進行制圖、計算和數據處理,具備簡潔高效的編程語言、完整的統計分析、強大的數組運算工具等功能。endprint

        3.2 技術實現的解決方案

        1)相關數據的采集。

        (1)學生檔案中涉及的相關信息在學生入學時提供的電子檔案基礎上,由學生工作人員在每年的新生開學前采集并上傳至學工管理信息系統,在需要時首先由系統操作人員根據關鍵字對信息進行查詢,將符合要求的相關信息篩選到助學金評定人員手中,作為評定最先需要依據的數據,一些特殊情況如單親、低保等情況可以不考慮后面數據直接評定助學金。

        (2)學生校外兼職數據可以作為一個重要的參考,由各班班主任和輔導員負責采集、匯總并上報相關部門,兼職時間的長短和兼職地點在校內或校外這兩大因素對學生校內刷卡頻次和消費金額有直接而深遠的影響。

        (3)刷卡消費相關數據量大、結構復雜、技術要求高,是本次大數據技術應用中分析的數據,相關數據內容存儲于校內一卡通服務器上,存儲方式單一,有利用提取和分析。

        2)學生刷卡消費相關數據的提取和存儲。

        在一個時間節(jié)點上如一學年結束后進行數據采集,用R軟件對數據進行流分析,把處理完成的數據流用關系型數據庫的方法以JSON格式讀入PostgreSQL數據庫中。具體的操作過程為:第1步,把R軟件和PostgreSQL數據庫以開放數據庫連接方式進行連接;第2步,在數據結構現有狀態(tài)不變的情況下,通過數據框添加,插入PostgreSQL數據庫內臨時表中;第3步,根據要求創(chuàng)建一個新的數據庫,通過一個新編寫的SQL腳本把上一步中臨時表內的數據以一定的頻率寫入新的數據庫中,最后將臨時表刪除。數據采集工作結束以后,前2個步驟根據程序設定自動執(zhí)行,步驟3中的SQL腳本一般不定時,根據數據量手動運行。

        3)學生刷卡消費數據的計算分析過程。

        導入PostgreSQL數據庫后就要進行數據分析,此處主要是指對數據進行挖掘和統計。一開始的數據分析因為數據總量相對比較少,我們應用硬盤緩存技術緩解由于內存容量低產生的卡和慢問題,將R軟件采用開放數據庫連接方式連接到PostgreSQL數據庫中,把數據移動到R軟件進行分析。在以后的操作過程中,如果數據量特別大,因為數據分析的需求通常情況下比較固定,為了降低數據遷移的成本,就必須將R軟件代碼用自定義函數的形式插入PostgreSQL數據庫的存儲過程中,在PostgreSQL數據庫內部對數據進行統計分析和數據挖掘。

        經過數據統計分析和挖掘后,綜合刷卡頻次、刷卡金額和刷卡時間對數據進行計算,取一個值α。α計算方法為每月刷卡總金額/(每月刷卡總次數-規(guī)定時間外刷卡次數),然后排除每月刷卡頻次小于平均頻次1/3的同學,最后把每月的α加起來,以班級為單位由低到高排名。

        4 結果呈現

        經過大數據提取分析后,最終提交給班主任和學校資助管理人員3張表,優(yōu)先級別分別為表1、表2和表3。

        (1)表1是學生家庭情況表,分為三星、二星、一星3種情況:三星為嚴重情況,如家庭為單親或離異家庭、家中直接親屬有重大疾病、家住農村為低保戶等,可以不考慮后2張表優(yōu)先評定;二星為一般情況,如家庭經濟收入較低等,在參考表3的情況下做到優(yōu)先評定;一星為普通情況,也有可能家庭收入較低但在表上沒有體現出來。

        (2)表2是學生兼職情況表,以班為單位,有本班學生姓名、兼職地點、兼職開始時間、每月兼職時長等相關信息,評定人員根據相關信息進行評定。

        (3)表3是學生消費數據統計匯總表,由于表中涉及的數據龐雜,呈現給學生助學金評定人員的有兩部分內容:一部分是每月刷卡頻次大于等于平均頻次1/3的同學,把每月的α加起來,每名學生一個數值,由低到高排名;另一部分是每月刷卡頻次小于平均頻次1/3的同學,也把每月的α加起來并排名。

        各班班主任(輔導員)和學生資助管理人員根據3張表的優(yōu)先級和表的內容,將其作為評定助學金時一個重要依據。另外一個值得注意的重要問題就是表中內容涉及學生個人隱私,根據相關法律不能在公開場合泄露,希望相關人員高度重視。

        5 結 語

        學生助學金的評比是一個多維度、復雜的過程,除了家庭經濟情況外,還要參考學生學習狀況、遵守校規(guī)校紀情況等。大數據技術的應用可以給評定過程提供一些重要依據和有意義的參考,但技術的發(fā)展和完善是一個長期的過程,文中提到的技術有局限性,整合的數據也有片面性,希望高校的教育工作者能夠不忘初心,秉持崇高理想,充分運用自己的管理技巧使學生助學金評定更加客觀、公正、合理。

        參考文獻:

        [1] 趙國棟, 易歡歡, 糜萬軍, 等. 大數據時代的歷史機遇[M]. 北京: 清華大學出版社, 2013: 13.

        [2] 黃恒軍, 漆威. 海量半結構化數據采集存儲及分析[J]. 統計研究, 2014(5): 10-16.

        [3] 陳吉榮, 樂嘉錦. 基于Hadoop生態(tài)系統的大數據解決方案綜述 [J]. 計算機工程與科學, 2013(10): 25-34.

        [4] 張德剛, 張德海, 吳毅, 等. 面向大數據分析的企業(yè)信息化解決方案研究[J]. 電力信息通信技術, 2014(9): 11-14.

        (編輯:宋文婷)endprint

        猜你喜歡
        助學金大數據
        濟源市關工委舉行“關愛助學金”發(fā)放儀式
        下一代英才(2023年3期)2023-04-18 01:05:50
        郁南縣
        源流(2016年10期)2016-12-10 05:49:18
        懷集縣
        源流(2016年10期)2016-12-10 05:43:59
        大數據環(huán)境下基于移動客戶端的傳統媒體轉型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數據背景下的智慧城市建設研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數據+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
        中國記者(2016年6期)2016-08-26 12:36:20
        助學金發(fā)放不能成黑箱
        對中職學生國家助學金發(fā)放的思考
        河南科技(2014年23期)2014-02-27 14:19:16
        The Value of a University Education
        激情综合欧美| www插插插无码视频网站| 国产毛片视频一区二区三区在线| 国产精品国产三级国产剧情| 国产av天堂亚洲av刚刚碰| 国产在线播放一区二区不卡| 免费无码又爽又刺激网站直播| 亚洲av日韩aⅴ无码色老头| 中文亚洲欧美日韩无线码| 久久精品国产亚洲精品| 亚洲自拍另类制服在线| 免费二级毛片在线播放| 国内精品九九久久精品小草| 成人av在线免费播放| 69精品国产乱码久久久| 久久午夜av一区二区三区| 欧美人妻aⅴ中文字幕| 免费少妇a级毛片人成网| 精品亚洲日韩国产一二三区亚洲| 欧美日韩国产高清| 精品国产亚洲人成在线观看| 国产无卡视频在线观看| 国产69久久精品成人看| 久久av无码精品人妻出轨| 免费毛片性天堂| 亚洲免费无毛av一区二区三区 | 妓院一钑片免看黄大片| 欧美成人一级视频| 亚洲人成影院在线高清| 日韩精品有码中文字幕| 亚洲不卡免费观看av一区二区| 色欲综合一区二区三区| 国产精品久久久| 久久夜色撩人精品国产小说| 中文字幕成人精品久久不卡| 久久这黄色精品免费久| 97久久婷婷五月综合色d啪蜜芽| 亚洲精品美女久久久久久久| 精品乱码久久久久久中文字幕| 国产精品天天看大片特色视频 | 91av精品视频|