亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多源數(shù)據(jù)的智慧資助方法研究

        2024-12-31 00:00:00張波
        電腦知識與技術 2024年33期

        關鍵詞: 智慧資助;資助對象識別;支持向量機;多源數(shù)據(jù)融合

        0 引言

        學生資助工作是學生工作的重要組成部分,準確地識別資助對象是實現(xiàn)“精準資助”的前提和基礎,也是資助工作的重點和難點。現(xiàn)實資助工作中,由于學生數(shù)量眾多且情況各不相同,常出現(xiàn)資助對象識別不準確的情況。

        目前,學生資助普遍采用是學生先申請再進行人工審核的傳統(tǒng)模式。具體操作辦法是讓學生填寫申請表格,輔導員及學校資助工作人員再通過佐證核實、個體訪談、數(shù)據(jù)比對、民主評議、名單公示等方式進行資助對象的確定以及后續(xù)的資助工作[1]。傳統(tǒng)資助模式高度依賴學生申請和人工審核,存在流程煩瑣、耗時長、資助對象識別準確率難以保證的缺點。隨著信息技術的發(fā)展,各學校陸續(xù)建設了包含資助信息管理功能的學工系統(tǒng)。資助工作由過去的線下申請審核逐漸轉向線上辦理,但辦理流程和資助對象識別方式并未發(fā)生實質變化?!半[性貧困”和“虛假貧困”一直是資助對象識別過程中需要克服的難題,嚴重影響了資助工作的質量[2]?!半[性貧困”指的是應當獲取資助的困難學生在實際資助工作中未獲取資助?!半[性貧困”主要是由于學生對資助政策不了解或心理因素等原因導致未主動申請或申請后在資助審核過程中未被認定為資助對象?!疤摷儇毨А敝傅氖遣粦邮苜Y助的普通學生在實際工作中被錯誤認定為資助對象?!疤摷儇毨А敝饕怯捎趯W生提供的佐證信息不實或資助工作人員工作經(jīng)驗不足等原因導致的。為了避免“隱形貧困”和“虛假貧困”,傳統(tǒng)資助模式下需要多次宣傳動員,讓學生根據(jù)實際情況積極申請,同時也需要經(jīng)驗豐富的資助工作人員多角度仔細審核,需要耗費大量的時間及人力資源才能保證資助對象識別的準確率。

        近年來,包括智慧資助在內的智慧校園建設工作不斷推進,部分學校開始將大數(shù)據(jù)、人工智能等技術應用到學生資助工作上,提出了多種利用學生一卡通消費記錄、校園活動記錄等校園動態(tài)數(shù)據(jù)識別資助對象的方法[3]。這類方法不依賴學生的主動申請和資助工作人員的逐層審核,簡化了資助工作流程,保護了學生的隱私,提高了資助工作的效率。但隨著外賣就餐、網(wǎng)絡購物越來越高,支付寶、微信等第三方支付平臺使用率越來越頻繁,當下相當比例的學生會進行網(wǎng)絡消費,校內消費也有部分通過微信、支付寶等第三方支付平臺實現(xiàn)。相較于過去學生的消費行為主要依賴校園一卡通在校內產(chǎn)生,這些網(wǎng)絡消費及第三方支付平臺難以在一卡通數(shù)據(jù)上體現(xiàn)。缺少了這些數(shù)據(jù)統(tǒng)計,單從校園一卡通數(shù)據(jù)來看,這部分學生容易被誤判為需要資助的困難學生,導致“虛假貧困”現(xiàn)象的產(chǎn)生。依靠校園一卡通及校內活動記錄的智慧資助方法為了保證資助對象檢測的準確性,往往需要獲取學生的網(wǎng)絡購物、外賣就餐、第三方支付等動態(tài)信息作為輔助?,F(xiàn)實工作中及時準確獲取這些校外動態(tài)信息的難度較大,對于學校的校外動態(tài)信息獲取能力提出了較高要求。

        1 理論基礎與特征選擇

        本文提出了一種不依賴學生申請和人工審核的智慧資助方法,利用學生基礎信息、國家資助系統(tǒng)推送、歷史資助、勤工助學等容易獲取的數(shù)據(jù)實現(xiàn)資助對象的識別。在這些數(shù)據(jù)中選擇與學生家庭經(jīng)濟情況相關性較高的特征設計支持向量機分類器,再利用設計的分類器將學生分為“資助對象”和“普通學生”兩類人群,實現(xiàn)資助對象的識別。

        1.1 支持向量機

        支持向量機(support vector machine,SVM) 是基于統(tǒng)計學習理論和結構風險最小化原理的監(jiān)督式機器學習方法,主要用于分類和回歸分析。如圖1所示其基本原理是通過構造一個最優(yōu)的超平面來將兩類數(shù)據(jù)分開。其核心問題是獲取便于實現(xiàn)分類的超平面,實現(xiàn)正例與負例之間的隔離邊緣最大化,從而有助于實現(xiàn)更好地識別與分類。

        對于實際應用過程中更常見的非線性可分的問題,SVM一般通過將多類問題轉換成便于分類的二分類的方式來實現(xiàn)求解。在這個過程中不需要進行復雜的運算,而是利用如線性核、高斯函數(shù)核、多項式核等核函數(shù)將輸入數(shù)據(jù)從原始空間映射到更高維度的特征空間,從而尋找一個線性可分的超平面,可以實現(xiàn)復雜計算過程有效的簡化,因此具備較強的解決復雜模式的能力,使用較多的幾種核函數(shù)如下列公式所示[4]:

        SVM訓練過程中不直接擬合所有數(shù)據(jù)點,而是主要關注對決策邊界影響大的支持向量。這一特點使SVM模型對于噪聲和異常值相對魯棒。實際工程應用中SVM在小樣本、非線性、高維模式識別的諸多問題上效果出眾,已被廣泛應用于智慧資助等各類分類應用中。相較于其他模式識別算法,支持向量機由于結構簡單,也具有運算速度較快的優(yōu)點?;谥С窒蛄繖C的這些優(yōu)點和校內資助數(shù)據(jù)特點,本文選擇支持向量機分類器用于資助對象的識別和分類工作。

        1.2 數(shù)據(jù)源及分類特征選擇

        本文在選擇數(shù)據(jù)源時主要考慮數(shù)據(jù)準確及數(shù)據(jù)易獲取兩個要素。數(shù)據(jù)準確可以減少后續(xù)算法的誤差,保證資助對象檢測的準確性。數(shù)據(jù)易獲取則有利于算法在實際工作中的應用和推廣,各個學校的資助發(fā)展水平并不一致,很多學校暫不具備及時準確獲取學生的網(wǎng)絡購物、外賣就餐、第三方支付等校外動態(tài)信息的能力。恰當?shù)姆诸愄卣鬟x擇在支持向量機中起著至關重要的作用,可以提高模型分類性能同時減少噪聲影響。本文在基于源數(shù)據(jù)的分類特征選擇時主要考慮與家庭情況的相關性,并盡可能地減少數(shù)據(jù)冗余、減少數(shù)據(jù)的維度。本著以上原則,主要的數(shù)據(jù)來源及特征選擇如下:

        1) 學生基礎信息

        各學校在學生錄取及入學時都會進行學生基礎信息的統(tǒng)計,該信息在校期間也會進行及時的更新及維護。基礎信息中學生父母的職業(yè)、家庭條件等信息與學生是否需要資助有較高的相關性。同時,由于基礎數(shù)據(jù)涉及多部門使用,該項數(shù)據(jù)各學校都較容易獲取且數(shù)據(jù)準確。鑒于此,本文選擇學生基礎信息中的“家庭背景”作為分類器訓練的特征之一,“家庭背景”根據(jù)父母職業(yè)及困難信息登記分為“困難”和“普通”兩類。

        2) 全國學生資助管理信息系統(tǒng)

        全國學生資助管理信息系統(tǒng)是由國家資助中心建立的一個覆蓋全學段的資助管理系統(tǒng),該系統(tǒng)實現(xiàn)了與國務院建檔立卡系統(tǒng)、民政部低保系統(tǒng)、中國殘聯(lián)殘疾人信息管理系統(tǒng)的信息共享。該系統(tǒng)會定期給各學校推送國務院建檔立卡系統(tǒng)、民政部低保系統(tǒng)、中國殘聯(lián)殘疾人信息管理系統(tǒng)共享的信息供學校資助工作人員參考。在實際工作中發(fā)現(xiàn)國家資助系統(tǒng)推送的學生,除學籍異動等個別情況,經(jīng)核實后絕大部分都是需要資助的。國家系統(tǒng)是否推送與學生是否需要資助有較高的相關性。實際接受資助的學生中有部分并不是國家資助系統(tǒng)推送的學生,但國家資助系統(tǒng)推送的學生絕大部分都是最終接受資助的學生,同時該項信息是由國家資助系統(tǒng)推送,數(shù)據(jù)準確且獲取容易。鑒于此,本文選擇全國學生資助管理信息系統(tǒng)中的“國家資助系統(tǒng)推送”作為分類器訓練的特征之一。

        3) 歷史資助數(shù)據(jù)

        在國家資助中心的指導下各學校都根據(jù)實際情況建立了符合政策要求的“獎、助、貸、減、補、勤”學生資助體系。實際資助工作中,各學校大多會以學年或學期進行家庭情況的評定,即每學年或每學期重新評定困難學生并在評定基礎上給予資助。由于家庭情況變化等原因,會出現(xiàn)上個資助周期是資助對象的學生因家庭條件好轉導致在新周期不再是資助對象,也會出現(xiàn)原本不是資助對象的學生在新周期因為家庭突發(fā)變故而變?yōu)橘Y助對象。同一學生在校期間的家庭經(jīng)濟情況會發(fā)生變化,但實際工作中發(fā)現(xiàn)這種變化占學生總人數(shù)的比例不大。上個資助周期是否接受資助,特別是助學金、學費減免這類金額較大的資助與新的資助周期是否為資助對象有較高的相關性。資助工作由于涉及資金發(fā)放,各學校都會對實際發(fā)生的資助數(shù)據(jù)做好記錄并存檔,這項數(shù)據(jù)準確同時獲取容易??紤]到“獎、助、貸、減、補、勤”中的獎學金與學生家庭情況相關性不大,勤工助學由于情況特殊單獨作為一個特征統(tǒng)計。鑒于此,本文對“獎、助、貸、減、補、勤”中除去獎學金及勤工助學部分的資助金額進行求和來計算“歷史受助金額”,并作為分類器訓練的特征之一。

        4) 勤工助學數(shù)據(jù)

        勤工助學作為高?!蔼?、助、貸、減、補、勤”資助體系的重要部分,具有將扶貧與扶志相結合的特點,區(qū)別于其他直接發(fā)放或減免資金的資助項目,勤工助學需要學生付出相應勞動才能拿到報酬[5]。每月最多480 元的勞動報酬對于在校學生來說能在一定程度上解決基本生活問題。原先不是資助對象的學生在突發(fā)家庭困難后往往會通過申請勤工助學崗位等手段解決生活問題。由于需要付出相應勞動才能獲取報酬,部分家庭條件好轉的學生如無自我鍛煉的需求往往不會再選擇勤工助學崗位。實際資助工作中發(fā)現(xiàn)勤工助學崗位的申請變動及工作時長與是否需要資助具有較大的相關性,同時學生處的這項數(shù)據(jù)準確且獲取容易。鑒于此,本文選擇勤工助學數(shù)據(jù)中的“勤工助學申請變動及工作時長”作為分類器訓練的特征之一。

        2 算法設計與實驗分析

        2.1 數(shù)據(jù)獲取與預處理

        本著準確易獲取的原則,從國家資助平臺、校內學工平臺獲取原始數(shù)據(jù)。在原始數(shù)據(jù)中選擇家庭背景、國家資助系統(tǒng)推送、歷史受助金額、勤工助學變動及金額作為特征進行分類。這些不同來源的數(shù)據(jù)格式不同,為了提高數(shù)據(jù)的質量和可用性在數(shù)據(jù)分析使用前需要進行預處理,預處理的質量直接影響到后續(xù)分析的準確性和可靠性。

        原始數(shù)據(jù)需要進行數(shù)據(jù)清洗和填充并將異構數(shù)據(jù)轉換為統(tǒng)一格式的數(shù)據(jù)。去除數(shù)據(jù)中如姓名、學號、身份證號等重復記錄的冗余數(shù)據(jù),便于將維度較高的特征數(shù)據(jù)轉換為低維度的特征數(shù)據(jù)。在基礎信息統(tǒng)計及錄入時會有少量信息缺失值以及異常值的出現(xiàn),可根據(jù)數(shù)據(jù)情況采取刪除、插補等方法進行處理。為了避免某些特征因為數(shù)值過大或過小而在模型中占據(jù)主導地位,將不同量綱的數(shù)據(jù)轉化到同一尺度進行歸一化處理,并按實際資助工作經(jīng)驗設計特征權重。

        2.2 支持向量機分類器訓練

        支持向量機的訓練集主要用于支持向量機分類器的訓練,測試集是未參與過訓練的部分數(shù)據(jù),用來測試評估分類器的性能。選擇安徽工業(yè)經(jīng)濟職業(yè)技術學院2022級共4 000名學生的數(shù)據(jù)進行實驗,通過數(shù)據(jù)清洗等預處理后刪除了221例數(shù)據(jù),選擇3 779例數(shù)據(jù)進行實驗。按照數(shù)據(jù)集和測試集約占總數(shù)80% 和20%的比例進行劃分,從實驗數(shù)據(jù)中選擇2 979例數(shù)據(jù)用于產(chǎn)生支持向量機分類器的訓練樣本集,剩下800例數(shù)據(jù)用來測試算法的整體性能。

        以2023年學校審核通過并已完成資助的結果為標準,將訓練數(shù)據(jù)集的數(shù)據(jù)標記生成“普通學生”和“資助對象”兩個訓練樣本集,提取預處理過的數(shù)據(jù)的家庭背景、國家資助系統(tǒng)推送、歷史受助金額、勤工助學變動及金額作為特征進行訓練,生成支持向量機分類器。

        2.3 實現(xiàn)分類與結果分析

        將測試數(shù)據(jù)分成四組,每組200例數(shù)據(jù),進行算法的分類性能測試。以2023年學校審核通過并已完成資助的信息作為準確結果,統(tǒng)計本文所提資助算法的檢測效果。采用召回率(Recall) 、虛警率(False Alarm) 、準確率(Accuracy) 來衡量智慧資助算法的性能。其中召回率的定義為檢測學生中被正確識別為需資助的學生占真實需要資助學生的比例,取值范圍在0到1之間,比例越高說明“隱形貧困”的學生占學生總數(shù)比例越少,算法性能越好。虛警率的定義為被識別為需資助的學生中不是真實需要資助的學生的比例,取值范圍在0到1之間,比例越低說明“虛假貧困”的學生占學生總數(shù)比例越少,算法性能越好。準確率表明算法正確識別的學生占學生總數(shù)的比例,體現(xiàn)算法的總體檢測能力,取值范圍在0到1之間,越高說明算法整體性能越好。召回率、虛警率、準確率的計算公式如下[6]:

        式中:TP為智慧資助算法正確識別的需資助學生的數(shù)量,F(xiàn)N為被智慧資助算法誤判的需資助學生的數(shù)量,F(xiàn)P為被智慧資助算法誤判為需資助學生的普通學生數(shù)量,TN為智慧資助檢測算法正確識別的普通學生的數(shù)量,N為學生總數(shù)。表1為算法的測試結果。

        由表1可見,對于四組測試數(shù)據(jù),本文提出的基于支持向量機的智慧資助算法均能實現(xiàn)有效檢測。平均召回率為94.5%, 即被算法正確識別為需資助的學生占真實困難學生的比例較高,接近最大值1,證明能夠有效避免“隱形貧困”。平均虛警率為7.8%,即被算法錯誤識別為困難學生中的普通學生的比例較低,接近最小值0,證明算法能夠有效避免“虛假貧困”現(xiàn)象。平均檢測準確率為96.4%,接近最大值1,證明算法整體檢測準確率較高。

        3 結論

        本文設計的智慧資助方法利用“資助對象”與“普通學生”在基礎信息、國家資助系統(tǒng)推送、歷史資助、勤工助學方面的特征差異,采取支持向量機實現(xiàn)資助對象的分類。實驗結果表明,方法具有較高的檢測準確率,能夠在一定程度上減少“隱性貧困”與“虛假貧困”現(xiàn)象,從而助力實現(xiàn)“精準資助”。相較于傳統(tǒng)的學生資助方法,在不依賴學生申請和人工審核的條件下能夠實現(xiàn)有效的資助對象檢測,在實現(xiàn)較高檢測準確率的同時簡化了資助對象的識別流程,提升了識別效率。相較于利用學生一卡通消費記錄、校園活動記錄等校園動態(tài)數(shù)據(jù)的智慧資助方法,本文方法使用的源數(shù)據(jù)更容易獲取,不涉及校外動態(tài)信息,適應性更強。本文算法在對資助對象的進一步細化分類上并沒有涉及,同時檢測準確率方面也還有進一步提升空間,后續(xù)研究將重點針對這兩點不足進行完善。

        国产午夜福利不卡在线观看视频| 亚洲人成网77777色在线播放| 艳妇臀荡乳欲伦69调教视频| 失禁大喷潮在线播放| 亚洲视频高清| 女同性恋看女女av吗| 久久久精品午夜免费不卡| 在线不卡av片免费观看| 亚洲av日韩av综合aⅴxxx| 俺来也三区四区高清视频在线观看| av在线免费观看网站免费| 51国产黑色丝袜高跟鞋| 手机看片1024精品国产| 中文天堂一区二区三区| 国产禁区一区二区三区| 色老板精品视频在线观看| 国内精品人妻无码久久久影院94 | 女同舌吻互慰一区二区| 大地资源网在线观看免费官网 | 娇柔白嫩呻吟人妻尤物| 精品国产日韩亚洲一区在线| 免费网站内射红桃视频| 中文字幕无码不卡免费视频 | 老师开裆丝袜喷水视频| a级国产乱理论片在线观看| 国产av色| 日韩免费小视频| 亚洲一区二区三区av色婷婷| 高级会所技师自拍视频在线| 伊人久久大香线蕉av一区| 国产精品自产拍在线观看中文| 不卡av一区二区在线| 中国午夜伦理片| 亚洲一区中文字幕在线电影网 | 久久狠狠第一麻豆婷婷天天| 日本成年少妇人妻中文字幕| 亚洲 日韩 激情 无码 中出| 久久人人爽人人爽人人片亞洲| 久久99国产亚洲高清观看首页| 久久亚洲中文字幕乱码| 99国产精品无码|