亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)背景下高校貧困生類別的判定
        ——以安徽師范大學(xué)為例

        2016-12-03 03:34:16齊懷峰
        高校輔導(dǎo)員學(xué)刊 2016年5期
        關(guān)鍵詞:分類大學(xué)生

        齊懷峰

        (安徽師范大學(xué) 學(xué)生工作處,安徽 蕪湖 241000)

        ?

        大數(shù)據(jù)背景下高校貧困生類別的判定
        ——以安徽師范大學(xué)為例

        齊懷峰

        (安徽師范大學(xué) 學(xué)生工作處,安徽 蕪湖 241000)

        目前高校貧困生的精準認定是一個公開的難題。本文以某高校連續(xù)60天的校園卡消費記錄為依據(jù),利用Python語言和K-Means聚類算法,依據(jù)15545名大學(xué)生個人消費金額,而將他們分5個“最優(yōu)群體”。從最低消費群體中挖掘應(yīng)該被認定為貧困生而沒有被認定為貧困生的群體,從最高消費群體中挖掘不應(yīng)該被認定為貧困生而被認定為貧困生的群體。本文以客觀的消費記錄為標準,利用大數(shù)據(jù)挖掘技術(shù),為科學(xué)資助和精準資助提供了決策支持。關(guān)鍵詞: 大學(xué)生;貧困生;K-Means;分類;判定

        目前高校貧困生的精準認定是一個公開的難題,其認定難點主要在于界定標準的確定和認定成本方面(學(xué)校無法走訪每一位大學(xué)生的家庭情況、貧困生個人情況也無法公示接受師生監(jiān)督,只能依靠認定者的觀察和判定,以致于主觀因素影響較大),再加上假貧困生爭奪濟困資源的行為客觀上又加大了認定難度。本文以某高校連續(xù)60天校園卡消費記錄(2016年2月22日-4月21日,共8616889條消費記錄)為依據(jù),采用K-Means聚類算法,將15545名(大一至大三本科生,其中貧困生4189人,占總?cè)藬?shù)的26.95%)大學(xué)生個人消費總金額分5個“最優(yōu)群體”(群體內(nèi)消費相似而群體間差異較大)。從最低消費群體中挖掘應(yīng)該被認定為貧困生而沒有被認定為貧困生的群體,從最高消費群體中挖掘不應(yīng)該被認定為貧困生而被認定為貧困生的群體。本文以客觀的消費記錄為標準,利用大數(shù)據(jù)挖掘技術(shù),為科學(xué)資助和精準資助提供了決策支持。

        一、 數(shù)據(jù)處理及一般性統(tǒng)計分析

        (一) 三餐消費的定義

        為保持數(shù)據(jù)的連貫性,早餐時段定義為:00:00:00 - 09:59:59;午餐時段定義為:10:00:00-15:59:59;晚餐時段定義為:16:00:00-23:59:59。凡是在此三個時間段內(nèi)發(fā)生的消費(含用校園卡購買其它物品,也就是說是廣義的三餐消費),均被統(tǒng)計為早中晚三餐的消費金額;每位學(xué)生在某一時段可能消費多次,但都合并為某一餐的消費總金額。

        (二)單次異常消費數(shù)據(jù)的處理

        不失一般性,結(jié)合目前的消費水平,將三餐消費上限定義為:早餐15元、午餐25元、晚餐25元。若某單次消費超過限定額度,則被視為異常消費,并按消費上限記錄為此次消費金額(例如:若某一次晚餐消費100元,則按25元的上限記錄為此次消費金額)。

        (三)缺失消費數(shù)據(jù)的處理

        理論上,三餐消費總次數(shù)應(yīng)該為2798100次(15545人*3次/人*60天),然而并不是每個大學(xué)生在60天中,每天都在食堂消費3次,實際上其缺失數(shù)據(jù)相當多(詳見圖表2-4)。本文對缺失數(shù)據(jù)采用兩種處理方法:第一種是忽略缺失數(shù)據(jù)(如果某日某餐未用校園卡消費,則記錄為0元);第二種是如果某日某餐未用校園卡消費,則此次消費被統(tǒng)計為該類型消費平均值(早餐:3.89元;午餐:8.18元;晚餐7.26元)。

        (四) 消費群體的基本分析

        表1 性別餐飲情況統(tǒng)計表

        表1顯示:男生的三餐金額均超過女生,平均每天消費超過女生3.86元,這與實際情況基本吻合。 表2顯示:目前大學(xué)生早餐就餐率尚不足50%,這是一個很嚴重的問題(午餐、晚餐可以選擇校外就餐,而早餐一般只在校內(nèi)就餐或不吃),需要加大此方面的宣傳教育,并采取相應(yīng)措施;中餐和午餐的就餐率也只有70%,這說明因為學(xué)校食堂提供的飯菜不合口味,而導(dǎo)致約30%的學(xué)生選擇外賣或校外就餐,因此食堂飯菜水平應(yīng)考慮提升;從標準偏差來看,早餐2.39,晚餐也只有5.47,這說明學(xué)生在食堂消費金額比較穩(wěn)定,也就是說食堂提供的飯菜數(shù)量和款式比較單一。

        表2 整體餐飲情況統(tǒng)計表

        表3 非貧困生餐飲情況統(tǒng)計表

        表4 貧困生餐飲情況統(tǒng)計表

        從表2-表4,可以看出非貧困生和貧困生的消費狀況是有差異的,具體比較見表5。

        表5 非貧困生和貧困生消費數(shù)據(jù)比較

        表5顯示:(1)非貧困生每天消費19.64元,而貧困生每天消費17.81元,非貧困生確實比貧困生在消費上有明顯差別;(2)非貧困生在校內(nèi)就餐頻率為61.71%,貧困生在校內(nèi)就餐頻率為67.49%,這說明由于經(jīng)濟條件的限制,貧困生更多選擇在便宜的校內(nèi)就餐;(3)非貧困生的標準偏差是5.47,貧困生的消費偏差是5.05,這說明貧困生的消費種類和價格的變化程度比非貧困生小或者說可選擇消費的余地比較小。

        二、 基于K-Means聚類算法的群體分組

        對15545條消費記錄(每人60天的消費記錄之和為一條記錄)的分類標準是一個需要研究的問題。本文采用無監(jiān)督學(xué)習(xí)的K-Means聚類算法,將消費記錄分為5組,以便研究最低和最高的消費群體的消費情況。群體分組的標準采用輪廓系數(shù)(Silhouette Coefficient,是聚類效果好壞的一種評價方式。它結(jié)合內(nèi)聚度和分離度兩種因素,可以用來在相同原始數(shù)據(jù)的基礎(chǔ)上用來評價聚合效果,取值范圍是(0,1))進行評價,該值越高則說明分組效果越好,即群體內(nèi)部數(shù)據(jù)越接近而群體之間數(shù)據(jù)差異越大。

        在實際的聚類中,當分為3類時,SC最大為0.57,從聚類算法理論上說是最佳分類,但在實際應(yīng)用中并不是最佳選擇。但為了研究兩極群體,本文選擇5個分類,以便研究兩極群體。因為貧困生占總?cè)藬?shù)的26.95%,因此若消費最少的A類群體人數(shù)比例小于26.95%,理論上都應(yīng)該被認定為貧困生。但實際情況并非如此,詳見表6-7。

        表6 未補充缺失數(shù)據(jù)消費統(tǒng)計表(SC=0.54)

        表6顯示:因此A類(消費最少群體)有1158人應(yīng)該被認定為貧困生,但聚類結(jié)果顯示,其中有934人不在貧困生庫中;E類(消費最多群體)有332人,但聚類結(jié)果顯示,其中有67人在貧困生數(shù)據(jù)庫中。

        表7 已補充缺失數(shù)據(jù)消費統(tǒng)計表(SC=0.51)

        表7顯示:A類(消費最少群體)有613人,但聚類結(jié)果顯示,其中有309人不在貧困生庫中;E類(消費最多群體)有236人,但聚類結(jié)果顯示,其中有31人在貧困生數(shù)據(jù)庫中。

        三、 數(shù)據(jù)挖掘結(jié)果分析

        表8顯示“未補充缺失數(shù)據(jù)”方法和“已補充缺失數(shù)據(jù)”方法中:A類相同人數(shù)有241人(交集)、最大可疑人數(shù)1002人(并集);E類相同人數(shù)有25人(交集)、最大可疑人數(shù)73人(并集)。在A類消費群體中,雖然消費金額較低,但并不意味著他的真實消費額就低(學(xué)生消費是多元化的,比如外賣、校外就餐等);在E類消費群體中,消費金額是最高的,若沒有特殊情況,一般不應(yīng)再認定為貧困生。

        表8 兩種缺失數(shù)據(jù)處理方法的對比分析

        在此基礎(chǔ)上,還可繼續(xù)做以下兩個方面的工作:一是對可疑的“貧困生”或“非貧困生”依據(jù)其60天的消費記錄和平時的消費表現(xiàn)進行觀察和分析,以便確定是其真正貧困或是其非貧困,實事求是的判定某一名大學(xué)生的貧困情況;二是在第一步的基礎(chǔ)上,判定采用哪種缺失數(shù)據(jù)處理方法(或二者結(jié)合)更為接近客觀事實,以便更有效的應(yīng)用在實際工作中。

        采用對消費記錄挖掘的方法,大大縮小了調(diào)查范圍、維護了貧困生的“忌貧心理”,能有效挖掘出“雖然貧困但不愿意申請”或“不貧困但申請貧困”的群體,節(jié)約了大量的人力資源成本。此外,利用大數(shù)據(jù)技術(shù)還可以為貧困生精準分類、“學(xué)霸”和“消費習(xí)慣”關(guān)聯(lián)等方面提供數(shù)據(jù)支持。

        [1] Mastering Machine Learning with scikit-learn[M].UK:Packt Publishing,2014

        [2] Python Data Visualization Cookbook[M].UK:Packt Publishing,2013

        [3] 司維.Python基礎(chǔ)教程(第二版)[M].北京:人民郵電出版社,2014

        [4] 楊知玲.數(shù)據(jù)挖掘在高校貧困生評價中的應(yīng)用[J].軟件導(dǎo)刊,2016,(6)

        [5] 吳文輝.高校經(jīng)濟困難學(xué)生識別認定研究[J].辦公自動化,2016,(17)

        [6] 畢鶴霞.大數(shù)據(jù)下高校貧困生確認模型構(gòu)建——基于“模糊綜合評判法”與“模糊層次分析法”集成的實證研究[J].高教探索,2016,(8)

        (責任編輯:樂程 )

        How to Identify the Needy College Students against the Background of Big Data

        Qi Huaifeng

        (StudentAffairsDepartment,AnhuiNormalUniversity,Wuhu,Anhui, 241000,China)

        This article bases itself on the campus card consumption of 15545 students from a certain university for 35 consecutive days. It uses Python language and K-Means clustering algorithm to categorize these students into 5 optimal groups according to the total amount of their personal consumption, picking out the ones from the group that consumed least who should have been identified as needy and the ones from the group that consumed most who should not have been identified as needy. The paper attempts to provide some decision support for financially aiding students in a scientific and precise way.

        college student; needy student; K-Means; classification; identification

        齊懷峰(1979-),男,安徽師范大學(xué)學(xué)生工作處講師。

        10.13585/j.cnki.gxfdyxk.2016.05.017

        G641

        A

        1674-5337(2016)05-0074-04

        猜你喜歡
        分類大學(xué)生
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        分類討論求坐標
        帶父求學(xué)的大學(xué)生
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        大學(xué)生之歌
        黃河之聲(2017年14期)2017-10-11 09:03:59
        新大學(xué)生之歌
        北方音樂(2017年7期)2017-05-16 00:32:46
        給塑料分分類吧
        大學(xué)生實習(xí)如何落到“實處”
        精品黑人一区二区三区久久hd| 首页动漫亚洲欧美日韩| 日本不卡一区二区高清中文| 三级日本午夜在线观看| 久久精品亚洲熟女av蜜謦| 一区二区三区乱码在线 | 欧洲| 亚洲中文字幕无码中字| 亚洲人成在线播放a偷伦| 国产一区二区三区成人 | 日韩精品久久无码中文字幕 | 一区二区视频资源在线观看| 日韩中文字幕有码午夜美女| 久久久久久久久蜜桃| 中字无码av电影在线观看网站 | 久久青青草原一区网站| 无码人妻精品中文字幕| 97精品人妻一区二区三区香蕉| 国产在线精品福利大全| 日韩亚洲在线观看视频| 男女性杂交内射妇女bbwxz| 激情97综合亚洲色婷婷五| 国产一级做a爱视频在线| 91偷拍与自偷拍亚洲精品86 | 蜜桃视频第一区免费观看| 国产熟女内射oooo| 99国产精品99久久久久久| 国产美女高潮流白浆免费观看| 日本不卡在线视频二区三区| 精精国产xxxx视频在线播放| 久久综合亚洲色社区| 日韩在线精品免费观看| 国产果冻豆传媒麻婆精东| a一区二区三区乱码在线 | 欧洲| 国产三级在线看完整版| 国产一区二区三区激情视频 | 俺来也俺去啦最新在线| 99福利影院| 国产亚洲成人精品久久久| 日韩人妻无码精品久久久不卡| 91天堂素人精品系列全集亚洲| 国产精品久久国产精麻豆|