亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高校學生信用評分系統(tǒng)關(guān)鍵技術(shù)研究

        2019-01-09 03:12:36段光強楊春明張暉
        中國教育網(wǎng)絡(luò) 2018年11期
        關(guān)鍵詞:類別高校學生信用

        文/段光強 楊春明 張暉

        隨著人民生活水平不斷提高,社會生活方式呈現(xiàn)多樣化,人們的價值觀受到了嚴重的沖擊,社會上制假販假現(xiàn)象日益突出,出現(xiàn)了一定程度上的信用危機。這種現(xiàn)象逐漸蔓延到社會的各個角落,其中信用危機在高校也有不同程度的反映,使得我國高校大學生誠信教育遭到嚴峻挑戰(zhàn)。因此,深入研究高校學生的信用評價體系,建立科學的高校學生信用評分系統(tǒng)也愈顯其重要性,對于學校的發(fā)展、學生個人的成長乃至對整個社會的推動和促進都有著重要的意義。

        目前,個人信用評分模型主要是運用在放貸機構(gòu)評估貸款人是否違約,為是否貸款提供預測,減少放貸機構(gòu)的不良貸款帶來的損失,增加正確放貸帶來的利益。經(jīng)過幾十年的發(fā)展,從最早的Fisher(1936)提出將總體按照不同的特征成分劃分成不同的組的方法,到20世紀60年代信用卡的出現(xiàn)和快速發(fā)展,也影響個人信用評分模型的快速發(fā)展[1]?,F(xiàn)在大多數(shù)學者使用基于統(tǒng)計和機器學習的方法構(gòu)建信用評分模型,20世紀90年代以來,常見的模型有線性判別分析、邏輯斯蒂回歸、決策樹、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林、提升樹等[2]。近幾年信用評分模型發(fā)展趨勢和熱點是組合型信用評分模型,將多種信用評價模型串行組合、并行組合或者通過bagging或者boosting等算法產(chǎn)生多個訓練集,使用不穩(wěn)定分類算法在數(shù)據(jù)集上建立模型,最終將結(jié)果適當?shù)慕M合在一起。實驗結(jié)果表明,組合模型能夠有效的提高信用評分模型的精確性和穩(wěn)定性[3]。

        在個人信用評分中少有把高校學生當作受評價人群,王勤[4]提出了一套基于遺傳算法和神經(jīng)網(wǎng)絡(luò)的高校大學生個人信用評價模型,通過調(diào)查表方式收集到的數(shù)據(jù),數(shù)據(jù)的準確性和完整性有待提高和完善。為收集到高校學生真實、多方位、全面的信用數(shù)據(jù),通過和西南科技大學信推辦合作,收集到了近四年學生的基本信息、在校信息、繳納學費、成績、獎學金、勤工助學、繳納貸款、違紀情況、一卡通消費記錄、圖書館借閱和進出等多方面信息,同時采集集學生在貼吧微博等發(fā)表的言論信息作為補充。力爭收集到學生的全面信用數(shù)據(jù),使信用評分模型更加準確。

        系統(tǒng)架構(gòu)

        高校信用評分系統(tǒng)的主要由三部分組成,數(shù)據(jù)采集與融合系統(tǒng)、信用評分系統(tǒng)、信用業(yè)務(wù)系統(tǒng)。

        數(shù)據(jù)采集與融合系統(tǒng)主要完成信用數(shù)據(jù)的采集、存儲、實體鏈接、沖突解決、深度知識發(fā)現(xiàn)。整體流程為:(1)從不同數(shù)據(jù)源(教務(wù)處、學工部、財務(wù)處、圖書館、一卡通、公寓中心、貼吧和微博等)采集到不同格式的數(shù)據(jù);(2)將采集到的數(shù)據(jù)以Key-value鍵值對形式存儲在分布式MongoDB數(shù)據(jù)庫;(3)以學號作為學生實體唯一標識符,將同一學號的所有數(shù)據(jù)鏈接在一起,并刪除重復的屬性值;(4)解決第三步中存在同一屬性具有多種不同的值或者多種名稱的沖突問題;(5)結(jié)合先驗知識,通過推演、關(guān)聯(lián)分析等方法發(fā)現(xiàn)隱藏的深度知識。

        信用評分系統(tǒng)主要將數(shù)據(jù)采集與融合系統(tǒng)得到的數(shù)據(jù)通過信用評分模型計算出每個學生的信用評分,并將評分結(jié)果存儲在MySQL數(shù)據(jù)庫中。

        信用業(yè)務(wù)系統(tǒng)主要提供信用評分的展示和可視化功能。對學生用戶主要提供登錄、信用自查、守信記錄和失信記錄的展示、信用報告生成、提交信用佐證、信用問卷調(diào)查、信用小測試等功能。對輔導員等學生管理者提供信用查詢、信用預警(通過設(shè)置閾值,信用評分低于閾值的學生將高亮顯示)、信用佐證審核、信用調(diào)查問卷添加等。

        高校信用評分系統(tǒng)的系統(tǒng)架構(gòu)如圖1所示,系統(tǒng)會隨新數(shù)據(jù)的到來或者設(shè)置的固定時間節(jié)點,實時更新信用評分,保證信用頻分的準確性和實時性。

        圖1 系統(tǒng)架構(gòu)圖

        信用評分系統(tǒng)關(guān)鍵技術(shù)解決方案

        基于D-S證據(jù)理論的數(shù)據(jù)融合與沖突

        數(shù)據(jù)沖突是在多源數(shù)據(jù)融合過程中,不同數(shù)據(jù)源對同一屬性具有多種不同值的情況。“數(shù)據(jù)融合”最早出現(xiàn)在軍事上,將戰(zhàn)場上的多種傳感器采集到的數(shù)據(jù)處理、融合,得到有用的戰(zhàn)場信息。隨著工業(yè)的飛速發(fā)展,工業(yè)系統(tǒng)的復雜化和智能化,數(shù)據(jù)融合得到飛速發(fā)展[5]。數(shù)據(jù)融合根據(jù)融合層次分數(shù)據(jù)層、特征層和決策層[6]。為實現(xiàn)大數(shù)據(jù)融合,各領(lǐng)域出現(xiàn)了多種融合方法,但普遍采用3V(海量、高速、類型多樣)特征下的集成方式,其需要的關(guān)鍵技術(shù)包括本體對齊技術(shù)、實體鏈接技術(shù)、沖突解決和關(guān)系推演等[7][8]。在高校信用數(shù)據(jù)融合過程中主要問題就是沖突解決。

        在現(xiàn)有的沖突解決研究中,傳統(tǒng)方法有基于貝葉斯模型、D-S證據(jù)理論和模糊集理論,近幾年提出了基于圖模型的方法[9]。雖然這些方法都在一定程度上增加了知識的確定性,減少了錯誤知識,提升了知識的置信度和可靠性,但很多數(shù)據(jù)或知識是隨時間變化而變化,由于更新時間不一致、人為因素或者非人為因素,從不同的部門獲取到的數(shù)據(jù)可能存在沖突和不一致的情況,上一個時間段正確的數(shù)據(jù),下一個時刻就可能變成錯誤的[10]。例如在高校學生信用數(shù)據(jù)中,學生S從專業(yè)a轉(zhuǎn)到專業(yè)b,教務(wù)處系統(tǒng)的信息已更新學生S的專業(yè)為b,但學工等其他系統(tǒng)學生S的專業(yè)信息仍然為a?,F(xiàn)有的知識沖突解決方法缺乏對時間維度的考慮,無法適應(yīng)隨時間動態(tài)變化的知識沖突問題。因此提出一種添加了時間信任函數(shù)mt()的D-S證據(jù)模型。

        D-S證據(jù)理論的基本原理:

        設(shè)Θ是一個識別框架,基本概率分配:Basic Probability Assignment,簡稱BPA。在識別框架Θ上的BPA是一個2Θ→[0,1]的函數(shù)m,稱為mass函數(shù)。并且滿足:

        其中,使得m(A)>0的A稱為焦元(Focal elements)。信任函數(shù)Bel(A)定義為:

        故Bel(A)為A的信任程度,Pl(A)表示對A的非假的信任度[9],對于? A ?Θ,識別框架Θ上的有限個mass函數(shù)m1, m2, ..., mn的Dempster合成規(guī)則為:

        其中K為歸一化常數(shù):

        令tA為焦元A在一個數(shù)據(jù)源當前最近一次的更新時間節(jié)點,由于不同的數(shù)據(jù)源可能產(chǎn)生多個tA,選取其中離當前時間最近的tA1作為TA2,令時間信任函數(shù)mt()滿足,當TA1≥TA2:

        故改進后的合成規(guī)則為:

        其中Kt仍然為歸一化常數(shù):

        其實合成規(guī)則的本質(zhì)并沒有變化,修改后的合成規(guī)則相當于添加了一個時間數(shù)據(jù)源,把時間這一因素加入到合成規(guī)則中,以適應(yīng)隨時間變化而變化的數(shù)據(jù)。以學生S轉(zhuǎn)專業(yè)為例,如表1所示,其中Belt()為添加了時間信任函數(shù)的信任度。

        表1 證據(jù)結(jié)果

        由表1 可知兩次得到的結(jié)果完全相反,傳統(tǒng)DS推斷出來學生S專業(yè)為a,添加時間因素的DS推斷出學生S的專業(yè)為b,故增加時間信任函數(shù)mt()后,提升了對隨時間變化的數(shù)據(jù)融合的準確率。

        基于層次分析與最近有效原則的信用評分模型

        近兩年信用評分的研究熱點是針對信用評分原始數(shù)據(jù)的類別不平衡問題,即由于前期的篩選導致“好”客戶的數(shù)量多于“壞”客戶的數(shù)量,收集到的信用數(shù)據(jù)中“好”客戶和“壞”客戶分布就與原始數(shù)據(jù)空間分布不一致。陳啟偉[2]等人提出從“好”客戶(大類)中隨機采樣多份與全部“壞”客戶(小類)等量的樣本,分別與全部小類構(gòu)成訓練子集,然后用提升樹模型訓練,再把不同的數(shù)據(jù)集產(chǎn)生結(jié)果的均值作為最終結(jié)果。邵良杉[12]等人提出一種改進過采樣算法解決類別不平衡問題。然而高校信用數(shù)據(jù)其不存在收集到的數(shù)據(jù)類別不平衡問題,因為能收集到所有學生的信用原始數(shù)據(jù),所以這些模型具有的參考價值并不大。

        1.模型選擇

        雖然在個人貸款方面的信用評估算法模型已經(jīng)很多,然而針對大學生這一特殊群體的評價模型寥寥無幾。經(jīng)調(diào)研發(fā)現(xiàn),信用評分模型頂層都是按比例分配不同權(quán)重到受評人的各個方面,以收集到芝麻信用、卡友、FICO(美國個人消費信用評估公司)的信用評分占比為例,如表2所示。

        參考上面三種評分比例,以及信用也是動態(tài)變化和高校學生學期學年等特性,提出層次分析模型+“最近最有效”[4]原則的綜合評價方法。

        2.層次分析模型

        表2 信用評分結(jié)構(gòu)

        圖2 評分維度及影響因素

        層次分析法(The analytic hierarchy process)簡稱AHP,是上世紀70年代由美國運籌學家托馬斯·塞蒂(T.L.satty)正式提出。它是一種定性和定量相結(jié)合的、系統(tǒng)化、層次化的分析方法[13]。根據(jù)遞階層次結(jié)構(gòu)定義,本文建立了一種高校學生信用評分模型為3層:最高層目標層O,中間層是維度層D(含五個維度,分別為信用歷史、行為偏好、學習狀況、身份特征、社交信息),最下層是影響因素F(含26種影響因素)。圖2 是信用評分的五個維度,以及其下層影響因素。

        令學生當前學年信用評分為T,行為偏好T1、社交信息T2、學習狀況T3、身份特征T4、信用歷史T5。綜合芝麻信用、卡友、FICO的信用評分占比,以及高校學生特點,五個維度的占比如下:

        評分過程主要分3個步驟:(1)對每一個維度的所有影響因素的重要性兩兩比較,構(gòu)造兩兩比較判別矩陣;(2)計算被比較的因素在對于該維度的相對權(quán)重;(3)對矩陣進行一致性證明,如果不符合,則重新構(gòu)造判別矩陣[13]。最終根據(jù)每個影響因素的相對權(quán)重和每個維度的權(quán)重,計算出學生當前學年的信用評分。

        3.最近最有效原則

        “最近最有效”是指在信用評價中,不能完全忽略一個人的過去,也不能將其過去表現(xiàn)與現(xiàn)在表現(xiàn)等同視之[14],故當前學年信用評分所占權(quán)重應(yīng)該更大。令i為學生的年級,為學生第i學年的信用評分(若不滿一學年,仍然看做一學年),學生信用最終評為為S。當i=1時,即大學學生S=N1,當i>1時:

        當前學年的評分占總評分的60%,前一年的總評分占40%。這樣既重視學生當前信用狀況,也考慮了學生以前的信用情況,實現(xiàn)更全面的評估學生的信用狀況。

        評估結(jié)果分析

        由于收集到的數(shù)據(jù)都是未標注數(shù)據(jù),且評分系統(tǒng)才開始運行,也無法通過時間檢驗,得到評分模型準確率[15]。為了檢驗信用評分模型的準確率,將有違紀作弊、未按時繳納學費、貸款等嚴重失信記錄的同學標記為類別a;將未違紀且獲得學業(yè)獎學金、國家勵志獎學金等較權(quán)威的正面評價記錄標記為類別c,按時繳納學費、助學貸款、按時歸還圖書等守信記錄超過30條的也標記為類別c。其余同學則標記為類別b。由統(tǒng)計結(jié)果發(fā)現(xiàn),在收集到的3萬多學生中,屬于類別a的只有276例,屬于類別c的共有1438例,其余均為類別b。本系統(tǒng)的信用評分所屬區(qū)間如表3所示。

        表3 信用評分區(qū)間

        信用評分小于550的為類別a,評分屬于550到699區(qū)間的為類別b,評分大于或等于700的為類別c。通過標記類別與評分模型得到的類別比較結(jié)果如表4所示。

        表4 評估結(jié)果

        結(jié)果表明評分模型對類別a效果最差,其次是類別b。經(jīng)過查看原始數(shù)據(jù)發(fā)現(xiàn),在類別a錯誤判斷的63個人中,多數(shù)為是大三大四學生,其中多數(shù)人是在大一的時候未及時繳納學費等原因,導致被標記為類別a,由于模型最近最有效原則,導致其評分并不屬于a類。在b類判斷錯誤的人群中,大部分是誤判斷為類別c,雖然判斷錯誤,主要原因是未獲得學業(yè)獎、國家勵志獎等并不能判定其信用不是極好的,也可能是30條守信記錄設(shè)置太高,學費和助學貸款正常情況下一年才一至兩條記錄,基本要到圖書館按時歸還圖書20多次,有一部分同學喜歡在自習室和寢室學習,并不喜歡在圖書館學習和借書。綜上,由于標記的準則上存在一定的問題,按實際情況準確率應(yīng)該高于87.51%。

        本文研究并實現(xiàn)了高校學生信用評分系統(tǒng),解決了高校學生信用評分系統(tǒng)基本空白的現(xiàn)狀。針對高校信用數(shù)據(jù)融合中,數(shù)據(jù)沖突問題提出了增加時間信任函數(shù)的DS證據(jù)理論,根據(jù)高校學生這特定群體提出了“最近最有效原則”+層次分析的評分模型。為大學生的誠信教育、助學貸款和獎學金評定等提供了重要的參考價值。

        猜你喜歡
        類別高校學生信用
        高校學生黨支部建設(shè)及作用發(fā)揮探索
        為食品安全加把“信用鎖”
        高校學生意外傷害事件應(yīng)對與處理
        活力(2019年19期)2020-01-06 07:37:16
        信用收縮是否結(jié)束
        中國外匯(2019年9期)2019-07-13 05:46:30
        信用中國網(wǎng)
        信用消費有多爽?
        小議高校學生違紀處分制度
        學周刊(2016年23期)2016-09-08 08:57:48
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        關(guān)于高校學生工作的思考
        學習月刊(2015年24期)2015-07-09 03:42:00
        論類別股東會
        商事法論集(2014年1期)2014-06-27 01:20:42
        国产真实夫妇视频| 欧美多人片高潮野外做片黑人| 久久久久久国产精品免费免费男同| 国产精品视频牛仔裤一区| 久久精品国产成人午夜福利| 国产一品二品三区在线观看| 国产精品久久久久一区二区三区 | 久久av不卡人妻出轨一区二区| 欧美人与禽2o2o性论交| 欧美成人精品第一区二区三区| 亚洲国产字幕| 亚洲天堂av在线免费观看| 美女露内裤扒开腿让男人桶无遮挡| 亚洲精品毛片一区二区三区| 亚洲精品综合色区二区| 精品人妻少妇丰满久久久免| 日韩av无码中文无码电影| 欧美日韩久久久精品a片| 国产香蕉尹人在线视频你懂的| 日本午夜精品一区二区三区| 国产日产欧洲系列| 日本成人久久| 色哟哟精品中文字幕乱码| 成人影院在线视频免费观看| 人妻无码αv中文字幕久久琪琪布| 久久九九青青国产精品| 国产精品一品二区三区| 国产猛男猛女超爽免费视频| 国产成a人亚洲精v品无码性色| 国产9 9在线 | 免费| 一区二区三区av在线| 国产精品理论片| 国产精品入口牛牛影视| 中文字幕人妻乱码在线| 无遮挡1000部拍拍拍免费| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 亚洲中文字幕无码不卡电影| 天堂蜜桃视频在线观看| 欧美黑人xxxx又粗又长| 精品亚洲欧美高清不卡高清| 女主播国产专区在线观看|