亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Hadoop的高校學(xué)生行為預(yù)警決策系統(tǒng)研究

        2021-01-15 08:21:40葛蘇慧白成杰
        關(guān)鍵詞:中心點(diǎn)軌跡標(biāo)簽

        葛蘇慧 萬(wàn) 泉 白成杰

        1(青島工學(xué)院信息工程學(xué)院 山東 青島 266300) 2(山東師范大學(xué)信息科學(xué)與工程學(xué)院 山東 濟(jì)南 250358)

        0 引 言

        大數(shù)據(jù)帶來(lái)的信息風(fēng)暴正在改變著人們的日常生活、工作模式和思維方式,但目前很多高校教育管理手段存在諸多弊端,管理方式大多停留在宣傳教育、定期檢查階段,管理模式多數(shù)是事后分析,管理手段既落后又被動(dòng),很難適應(yīng)大數(shù)據(jù)時(shí)代智慧校園智能管控的要求。學(xué)業(yè)危機(jī)、安全危機(jī)、心理危機(jī)、就業(yè)危機(jī)、輿情危機(jī)等成為高校學(xué)生管理亟須解決的問(wèn)題。因此,大數(shù)據(jù)背景下,要求高校管理者轉(zhuǎn)變思維,運(yùn)用大數(shù)據(jù)分析技術(shù),開(kāi)展多維、動(dòng)態(tài)、全面、智能的教育管理新模式,建立動(dòng)態(tài)的預(yù)警決策機(jī)制,主動(dòng)掌握學(xué)生生活、學(xué)習(xí)、行為規(guī)律,對(duì)不良思想行為做到事先警示教育、事后跟蹤管理,從而實(shí)現(xiàn)個(gè)性化的管理新模式,探索實(shí)效性的管理新路徑。

        本文主要利用Hadoop大數(shù)據(jù)框架及HDFS、Map-Reduce、Spark、Kafka、Flume大數(shù)據(jù)技術(shù)研發(fā)智慧校園預(yù)警決策系統(tǒng),使用Kafka、Flume進(jìn)行日志采集,HDFS為海量學(xué)生校內(nèi)軌跡數(shù)據(jù)提供存儲(chǔ),MapReduce提供并行運(yùn)算,從而提供動(dòng)態(tài)的學(xué)生校內(nèi)行為軌跡地圖和查詢(xún)功能。利用基于距離的聚類(lèi)方法,對(duì)經(jīng)過(guò)降維后的學(xué)生特征數(shù)據(jù)進(jìn)行分類(lèi),分離出偏離中心點(diǎn)的狀態(tài)異常的學(xué)生;使用Echart、D3.js可視化呈現(xiàn),采用SaaS形式交付,生成“學(xué)生畫(huà)像”對(duì)學(xué)生行為進(jìn)行監(jiān)控、預(yù)警、根源分析的閉環(huán)管理,并通過(guò)網(wǎng)頁(yè)版和手機(jī)版html5技術(shù)以微信、短信的方式主動(dòng)推送預(yù)警,實(shí)現(xiàn)異常事件的閉環(huán)管理,為智慧校園的學(xué)生行為管理提供智能的手段,實(shí)現(xiàn)一種全新的智能管控新思路。

        1 Hadoop大數(shù)據(jù)技術(shù)

        Hadoop是一個(gè)開(kāi)源的海量數(shù)據(jù)處理框架,最核心的設(shè)計(jì)是HDFS和MapReduce,HDFS為海量數(shù)據(jù)提供存儲(chǔ)和管理功能,處理非結(jié)構(gòu)化的數(shù)據(jù),MapReduce自動(dòng)實(shí)現(xiàn)分布式并行計(jì)算,二者的巧妙結(jié)合使Hadoop擁有了高效的存儲(chǔ)和計(jì)算能力[1]。Hadoop可利用集群實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的高效專(zhuān)業(yè)化處理,是一個(gè)對(duì)大規(guī)模數(shù)據(jù)存儲(chǔ)、計(jì)算、分析、挖掘的軟件平臺(tái),具有低成本、高效率等優(yōu)點(diǎn),能可靠地存儲(chǔ)和處理PB級(jí)的數(shù)據(jù)[2-3]。

        本文利用Hadoop框架的分布式文件系統(tǒng)HDFS和MapReduce對(duì)智慧校園多維學(xué)生軌跡數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、建模、計(jì)算、分析與可視化呈現(xiàn),HDFS負(fù)責(zé)學(xué)生多維校內(nèi)行為軌跡的存儲(chǔ)和管理[4],MapReduce負(fù)責(zé)對(duì)大規(guī)模數(shù)據(jù)集的并行處理。Hadoop能將一臺(tái)機(jī)器的計(jì)算能力無(wú)限次、高速地復(fù)制到集群機(jī)上,使集群具有超強(qiáng)的計(jì)算能力,不斷擴(kuò)充處理速度與運(yùn)算能力[5-7]。

        2 預(yù)警決策系統(tǒng)整體結(jié)構(gòu)

        基于Hadoop的高校學(xué)生行為預(yù)警決策系統(tǒng)分為權(quán)限管理、安全認(rèn)證、技術(shù)支撐四層模型、預(yù)警決策可視化呈現(xiàn)[8-9]四大部分。其中技術(shù)支撐四層模型分為數(shù)據(jù)采集層、運(yùn)行數(shù)據(jù)層、核心能力層、場(chǎng)景應(yīng)用層。數(shù)據(jù)采集層對(duì)學(xué)生的歷史數(shù)據(jù)、點(diǎn)擊流、實(shí)時(shí)日志等數(shù)據(jù)市場(chǎng)的數(shù)據(jù)進(jìn)行采集;運(yùn)行數(shù)據(jù)層利用Hadoop集群、云存儲(chǔ)、云數(shù)據(jù)庫(kù)等對(duì)多維數(shù)據(jù)進(jìn)行計(jì)算;核心能力層是對(duì)計(jì)算之后的數(shù)據(jù)進(jìn)行清洗、建模、分析,實(shí)現(xiàn)即時(shí)查詢(xún);場(chǎng)景應(yīng)用層對(duì)數(shù)據(jù)進(jìn)行可視化呈現(xiàn)[10-11]。權(quán)限管理分用戶(hù)管理、角色管理、用戶(hù)組管理、文件管理。安全認(rèn)證可以分為iPaas、Ldap和Kerberos三類(lèi)。預(yù)警決策系統(tǒng)可實(shí)現(xiàn)校園足跡、行為軌跡實(shí)時(shí)監(jiān)測(cè)、預(yù)警反饋、預(yù)警信息主動(dòng)推送,并利用Echart、D3.js可視化呈現(xiàn),采用SaaS形式交付。該預(yù)警決策系統(tǒng)整體結(jié)構(gòu)如圖1所示。

        圖1 預(yù)警決策系統(tǒng)整體結(jié)構(gòu)圖

        2.1 數(shù)據(jù)采集清洗

        通過(guò)高校智慧校園中的校園信息化基礎(chǔ)設(shè)施以及物聯(lián)網(wǎng)、智能感知、云計(jì)算等技術(shù),利用Kafka、Flume大數(shù)據(jù)采集工具,收集學(xué)生的靜態(tài)和動(dòng)態(tài)特征屬性,靜態(tài)屬性包括姓名、性別、專(zhuān)業(yè)、年級(jí)、宿舍、年齡、籍貫、愛(ài)好等特征;動(dòng)態(tài)屬性包括課堂考勤信息、線(xiàn)上線(xiàn)下學(xué)習(xí)情況、圖書(shū)館借閱情況、宿舍回歸率、門(mén)禁系統(tǒng)、校園一卡通、餐廳就餐情況、校內(nèi)上網(wǎng)情況、洗澡頻率等數(shù)據(jù)。通過(guò)大數(shù)據(jù)采集工具實(shí)現(xiàn)海量學(xué)生校內(nèi)軌跡數(shù)據(jù)的抓取與存儲(chǔ),將多維的學(xué)生活動(dòng)狀態(tài)數(shù)據(jù)進(jìn)行集成分類(lèi)存儲(chǔ),生成學(xué)生在校畫(huà)像屬性值。把軌跡數(shù)據(jù)的屬性值進(jìn)行分類(lèi),將當(dāng)前時(shí)刻數(shù)據(jù)屬性值的樣本,合并上一個(gè)周期采集到的并且已經(jīng)處理完畢的數(shù)據(jù)屬性值的樣本進(jìn)行清洗,采用曼哈頓函數(shù)計(jì)算目標(biāo)區(qū)域?yàn)榘霃街獾臄?shù)據(jù)距離本域中心點(diǎn)的偏離距離。然后計(jì)算某個(gè)屬性的異常度,通過(guò)排序設(shè)定一定的閾值,將所有離群點(diǎn)的偏離程度進(jìn)行比對(duì),判斷該點(diǎn)與本域中心點(diǎn)之間的偏離距離,計(jì)算每個(gè)屬性值的異常情況[12-15]。步驟如下:

        依據(jù)n個(gè)數(shù)據(jù)的屬性值,設(shè)每個(gè)屬性值的數(shù)據(jù)為m維,S(t0)為這次數(shù)據(jù)屬性值的樣本,不同時(shí)刻tk(tk∈[T,t0])采集到的數(shù)據(jù)屬性值的樣本為S(tk),因?yàn)樾?nèi)軌跡數(shù)據(jù)的時(shí)序性,需要把當(dāng)前時(shí)刻屬性值的樣本用式(1)合并上一周期已處理完的“干凈”數(shù)據(jù)進(jìn)行清洗。

        (1)

        式中:Sc(t-1)表示t-1時(shí)刻清洗完畢的軌跡數(shù)據(jù);r(Sc(t-1))表示對(duì)t-1時(shí)刻數(shù)據(jù)采集的結(jié)果;S+(t0)表示當(dāng)前時(shí)刻與上一周期合并之后待處理的數(shù)據(jù)集,為了防止較高密度簇影響異常數(shù)據(jù)的分離需要將冗余刪除。

        設(shè)s為軌跡數(shù)據(jù)屬性值集合S+(t0)中的點(diǎn),區(qū)域半徑RAD(s)表示分析目標(biāo)距離中心點(diǎn)為第k遠(yuǎn)的對(duì)象的曼哈頓長(zhǎng)度:

        d(i,j)=∑|Xik-Xjk|

        (2)

        式中:Xik和Xjk表示第k遠(yuǎn)對(duì)象的坐標(biāo)值。

        把點(diǎn)s作為本域的中心,該區(qū)域包含k個(gè)對(duì)象,這些對(duì)象的集合為Nk(s)。由此可以得出結(jié)論,分布不均勻的、密度較大的區(qū)域RAD(s)較小,反之密度較小的區(qū)域RAD(s)則較大。

        定義點(diǎn)s與點(diǎn)p之間的距離:

        REA(s,p)=max{RAD(Pp),d(s,p)}

        (3)

        利用式(3)可以求出軌跡數(shù)據(jù)集合S+(t0)內(nèi)的第i個(gè)屬性值的異常度LOF(si),對(duì)其排序,然后設(shè)置最大的閾值,從而分離出偏離中心點(diǎn)的異常數(shù)據(jù)。

        (4)

        式中:Lnr(p)和Lnr(s)分別為點(diǎn)p和點(diǎn)s的閾值長(zhǎng)度。

        (5)

        式中:Lrdk(s)為Nk(p)軌跡數(shù)據(jù)集合中平均可達(dá)距離密度的倒數(shù)。

        由式(3)、式(4)、式(5)可知,如果點(diǎn)s偏離中心點(diǎn)的距離較小,那么對(duì)于同一屬性的軌跡數(shù)據(jù)的可達(dá)距離RAD(s)則較大,并且分布較為均勻;反之如果點(diǎn)s是偏離中心距離較遠(yuǎn)的異常點(diǎn),那么可達(dá)密度的方差就較大,證明該點(diǎn)距離所有簇都相對(duì)較遠(yuǎn),通過(guò)設(shè)置閾值計(jì)算偏離中心點(diǎn)的異常數(shù)據(jù)。

        2.2 聚類(lèi)分析

        利用Hadoop框架的HDFS、MapReduce技術(shù),采用分布式文件系統(tǒng)和并行計(jì)算,將學(xué)生的靜態(tài)和動(dòng)態(tài)特征屬性貼上標(biāo)簽,生成協(xié)方差特征矩陣的特征值及特征向量,使用主成分分析法進(jìn)行降維處理,提取關(guān)鍵特征值,利用基于距離的方法進(jìn)行聚類(lèi)分析,將多維數(shù)據(jù)進(jìn)行歸一化處理。把嚴(yán)重偏離中心點(diǎn)的學(xué)生特征異常信息提取出來(lái),從而分離出學(xué)生的異常狀態(tài),對(duì)異常行為作出科學(xué)的預(yù)測(cè)和研判。

        主成分分析法利用降維的思想,使用線(xiàn)性變換的方法,將給定的一組相關(guān)變量轉(zhuǎn)換成另一組不相關(guān)的變量,轉(zhuǎn)換之后的新的變量按照方差依次遞減的順序排列,在數(shù)學(xué)變換中保持變量的總方差不變[16-18]。利用主成分分析法,首先計(jì)算學(xué)生樣本屬性的協(xié)方差矩陣,再求出協(xié)方差矩陣的特征向量,根據(jù)這些特征向量生成變換矩陣的行向量,最后依據(jù)數(shù)據(jù)協(xié)方差矩陣的特征向量構(gòu)成新的坐標(biāo)系的基矢量。根據(jù)學(xué)生不同屬性向量的特征可以得到如下結(jié)論。樣本集在較大特征值對(duì)應(yīng)的特征向量上的投影方差較大,所以該分量對(duì)于區(qū)分樣本的貢獻(xiàn)就較大[19-20]。由此可見(jiàn),通過(guò)主成分分析法可以清晰地找出區(qū)分性大的維和區(qū)分性不大的維。主成分分析法的具體實(shí)現(xiàn)步驟如下:

        (1) 將n個(gè)學(xué)生,每個(gè)學(xué)生的m個(gè)特性屬性數(shù)據(jù),構(gòu)成n行m列的在校畫(huà)像矩陣S:

        (6)

        如果用j來(lái)表示學(xué)生畫(huà)像的某一項(xiàng)屬性,那么所有學(xué)生的這一項(xiàng)屬性xj可表示為:

        (7)

        (8)

        (3) 將學(xué)生畫(huà)像屬性矩陣S進(jìn)行計(jì)算,得出協(xié)方差矩陣R:

        (9)

        為了使統(tǒng)計(jì)分析的結(jié)果達(dá)到更好的處理效果,需要對(duì)學(xué)生特征屬性的多維數(shù)據(jù)進(jìn)行歸一化處理,把經(jīng)過(guò)數(shù)據(jù)清洗、處理之后的特征矩陣代替原來(lái)的矩陣S,式(10)可以計(jì)算特征矩陣S的有關(guān)系數(shù)。

        (10)

        (4) 特征值表示為λ,協(xié)方差矩陣R的特征值λi=(λi1,λi2,…,λim),特征向量ɑi=(ɑi1,ɑi2,…,ɑim),貢獻(xiàn)率w由式(11)計(jì)算,特征值λi的貢獻(xiàn)率為w。

        (11)

        (5) 從標(biāo)準(zhǔn)化處理之后的學(xué)生的特征屬性數(shù)據(jù)中選擇主成分,按照貢獻(xiàn)率w將學(xué)生的特征屬性值由高到低降序排列,根據(jù)統(tǒng)計(jì)的實(shí)際需要提取屬性的前若干行,從而形成降維后的學(xué)生特征矩陣S。

        (6) 采用KHM(K-HarmonicMeans)算法對(duì)特征矩陣S進(jìn)行聚類(lèi)分析,如圖2所示,該算法根據(jù)式(12)最終計(jì)算出每個(gè)學(xué)生的特征屬性數(shù)據(jù)到各聚類(lèi)中心的調(diào)和平均值的和。

        圖2 學(xué)業(yè)成績(jī)分析

        (12)

        式中:第i個(gè)學(xué)生的m個(gè)特征表示為Si={Si1,Si2,…,Sim},第l個(gè)聚類(lèi)中心表示為Cl=[Cl1,Cl2,…,Clm],第i個(gè)學(xué)生到中心點(diǎn)l的距離為d(Si,Cl)。利用初始值通過(guò)公式不斷迭代,最終使得各類(lèi)趨于穩(wěn)定,從而分離出狀態(tài)異常的學(xué)生[21]。

        2.3 預(yù)警決策

        最終該預(yù)警決策系統(tǒng)使用Echart、D3.js可視化輸出,采用SaaS形式交付,生成學(xué)生在校畫(huà)像,并提供學(xué)生校內(nèi)行為軌跡和查詢(xún)功能。學(xué)校管理人員可以實(shí)時(shí)感知學(xué)生生活、學(xué)習(xí)及活動(dòng)狀態(tài),從而動(dòng)態(tài)監(jiān)測(cè)學(xué)生異常,對(duì)于可能會(huì)發(fā)生的異常問(wèn)題或已經(jīng)出現(xiàn)危機(jī)前兆的問(wèn)題,通過(guò)網(wǎng)頁(yè)版和手機(jī)版html5技術(shù)以微信、短信的方式主動(dòng)推送預(yù)警,實(shí)現(xiàn)學(xué)生異常事件的閉環(huán)管理,對(duì)異常事件真正做到可查、可管、可追溯。

        3 算例分析

        實(shí)驗(yàn)在真實(shí)環(huán)境下進(jìn)行,采用基于Hadoop框架搭建的HDFS、MapReduce技術(shù),HDFS提供存儲(chǔ)和管理,MapReduce實(shí)現(xiàn)分布式計(jì)算。集群相關(guān)配置情況如表1所示。

        表1 集群配置參數(shù)

        3.1 軌跡數(shù)據(jù)分析

        為驗(yàn)證Hadoop架構(gòu)和MapReduce算法的性能,實(shí)驗(yàn)樣本集為某高校數(shù)據(jù)采集系統(tǒng)10個(gè)月的學(xué)生校內(nèi)軌跡數(shù)據(jù),學(xué)生軌跡數(shù)據(jù)每天采集量為120個(gè)點(diǎn),將原數(shù)據(jù)集橫向表示為10個(gè)不同大小的樣本集[22]。前 5 個(gè)軌跡數(shù)據(jù)樣本的差異性較小,在處理少量文件時(shí)Hadoop無(wú)法體現(xiàn)它的優(yōu)勢(shì),但當(dāng)樣本集數(shù)據(jù)量日志增大時(shí),Hadoop便能對(duì)大規(guī)模的學(xué)生軌跡數(shù)據(jù)集進(jìn)行分布式并行處理,清洗速度與清洗量近似正相關(guān)[23]。算例中采集了學(xué)生10個(gè)月的校內(nèi)軌跡數(shù)據(jù),最大樣本集中有5萬(wàn)個(gè)監(jiān)測(cè)點(diǎn),100萬(wàn)條數(shù)據(jù),數(shù)據(jù)清洗時(shí)間大約為10 s,其速度和處理能力完全滿(mǎn)足目前乃至今后一段時(shí)間內(nèi)的校內(nèi)軌跡數(shù)據(jù)采集量的要求。

        圖3所示是某天15 870個(gè)軌跡數(shù)據(jù)采集點(diǎn)的日清洗情況,其中折線(xiàn)為平均斜率,表示平均變化趨勢(shì)。因?yàn)樾?nèi)軌跡數(shù)據(jù)采集所需的時(shí)間與學(xué)生異常數(shù)據(jù)的規(guī)模無(wú)關(guān),且Hadoop能夠處理大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù),并將原數(shù)據(jù)分類(lèi)進(jìn)行差異化處理、添加時(shí)間戳,所以數(shù)據(jù)的質(zhì)量不會(huì)影響軌跡數(shù)據(jù)的清洗效率。為驗(yàn)證算法的高效性,在樣本數(shù)據(jù)的24個(gè)時(shí)間段中隨機(jī)生成大規(guī)模異常數(shù)據(jù)。通過(guò)實(shí)驗(yàn)驗(yàn)證得出,Hadoop具有強(qiáng)大的快速處理能力,10萬(wàn)條數(shù)據(jù)的清洗時(shí)間大約是5 636~6 340 ms,而且不同規(guī)模的異常數(shù)據(jù)量的清洗時(shí)間變化較為穩(wěn)定。

        圖3 軌跡數(shù)據(jù)日清洗狀況

        通過(guò)此預(yù)警決策系統(tǒng)對(duì)全校30多個(gè)專(zhuān)業(yè),10 000多名學(xué)生進(jìn)行了校內(nèi)活動(dòng)軌跡數(shù)據(jù)的采集、清洗、處理和聚類(lèi)分析,讀取歷史數(shù)據(jù),形成時(shí)間節(jié)點(diǎn)的數(shù)據(jù)集合,并合并上一次采集周期的數(shù)據(jù)進(jìn)行清洗,設(shè)置目標(biāo)區(qū)域半徑。通過(guò)曼哈頓長(zhǎng)度計(jì)算異常數(shù)據(jù)距離中心點(diǎn)的離群程度,利用主成分分析法進(jìn)行降維處理,生成學(xué)生靜態(tài)和動(dòng)態(tài)屬性的特征矩陣,使用基于距離的方法進(jìn)行聚類(lèi)分析,并通過(guò)此預(yù)警決策系統(tǒng)最終可視化呈現(xiàn),將嚴(yán)重偏離中心點(diǎn)的學(xué)生異常提取出來(lái)。圖4為學(xué)生校內(nèi)軌跡數(shù)據(jù)聚類(lèi)圖,通過(guò)采集10個(gè)月期間的大規(guī)模學(xué)生校內(nèi)軌跡數(shù)據(jù),進(jìn)行清洗以及聚類(lèi)分析,然后將此預(yù)警決策系統(tǒng)測(cè)試的結(jié)果與學(xué)生的實(shí)際狀態(tài)進(jìn)行比對(duì),得出的結(jié)論如表2所示。可以看出此預(yù)警決策系統(tǒng)分析的結(jié)果與這些學(xué)生在校內(nèi)的實(shí)際狀態(tài)基本一致,數(shù)據(jù)預(yù)測(cè)成功率接近95%,誤差率可以控制在6.5%之內(nèi)。

        圖4 校內(nèi)軌跡數(shù)據(jù)聚類(lèi)圖

        表2 系統(tǒng)預(yù)警與實(shí)際狀態(tài)結(jié)果比對(duì)

        續(xù)表2

        3.2 學(xué)生畫(huà)像規(guī)則

        學(xué)生畫(huà)像標(biāo)簽分為內(nèi)容和權(quán)重。標(biāo)簽是可變的,權(quán)重也是實(shí)時(shí)變化的,隨時(shí)間延長(zhǎng)而衰減。以學(xué)生成績(jī)記錄為例:張三,數(shù)學(xué)成績(jī)90,為學(xué)生打上某一學(xué)科成績(jī)的標(biāo)簽。通過(guò)編寫(xiě)學(xué)生畫(huà)像規(guī)則,來(lái)計(jì)算標(biāo)簽權(quán)重,基本權(quán)重=90/100=0.9。時(shí)間衰減因子為R,隨著時(shí)間D(天數(shù))的延長(zhǎng),R會(huì)線(xiàn)性減少,R=1-0.05×D。標(biāo)簽權(quán)重=基本權(quán)重×衰減因子。 由此計(jì)算出張三的數(shù)學(xué)成績(jī)標(biāo)簽權(quán)重為0.9,標(biāo)簽內(nèi)容為科目名稱(chēng)“數(shù)學(xué)”,因此該學(xué)生的一個(gè)標(biāo)簽為:數(shù)學(xué),0.9。一周之后如果衰減因子變?yōu)?.7,標(biāo)簽權(quán)重變?yōu)?.63,那么該生的標(biāo)簽為:數(shù)學(xué),0.63。當(dāng)標(biāo)簽權(quán)重不斷減小到某個(gè)值,如0.5時(shí),就要為該生“撕下”數(shù)學(xué)的標(biāo)簽,從而更好地體現(xiàn)標(biāo)簽的實(shí)時(shí)性,因此將0.5記為閾值。再使用Hive規(guī)則生成學(xué)生標(biāo)簽,存入標(biāo)簽庫(kù),表3為學(xué)生畫(huà)像表(User_Profile)。

        表3 學(xué)生畫(huà)像表

        HiveQL標(biāo)簽生成語(yǔ)句:

        insert into table User_Profile select g. School_ID ,g.Student_ID,g.Student_Name,001,“數(shù)學(xué)”,0.9,2016-12-01 from Grade g where Subject=“數(shù)學(xué)”。

        不是異常學(xué)生的概率為:

        P(A2|B1)=1-P(A2|B1)=1-0.15=0.85

        (13)

        如果所具有的一項(xiàng)信息不是B1,而是B2、B3、B4,則是否是異常的概率分別為:

        P(A1|B2)=0.13P(A2|B2)=0.87P(A1|B3)=0.11P(A2|B3)=0.89P(A1|B4)=0.16P(A2|B4)=0.84

        (14)

        再計(jì)算同時(shí)有2、3、4項(xiàng)特征的學(xué)生是異常狀態(tài)的概率,如表4所示。例如,同時(shí)有B1、B2兩項(xiàng)與B1、B2、B3三項(xiàng)的學(xué)生是異常的概率分別為:

        P(A1|B1B2)=

        (15)

        P(A1|B1B2B3)=

        (16)

        表4 具有各種異常特征的概率

        4 結(jié) 語(yǔ)

        本文提出了基于Hadoop的智慧校園預(yù)警決策系統(tǒng)。通過(guò)智慧校園中各種智能終端、可感知設(shè)備,動(dòng)態(tài)獲取學(xué)生海量活動(dòng)軌跡與狀態(tài)數(shù)據(jù),利用Hadoop大數(shù)據(jù)技術(shù)對(duì)多維數(shù)據(jù)進(jìn)行關(guān)聯(lián)、分類(lèi)、降維及聚類(lèi)分析,生成“學(xué)生畫(huà)像”,實(shí)時(shí)監(jiān)測(cè)學(xué)生狀態(tài),科學(xué)研判異常行為,實(shí)現(xiàn)對(duì)異常事件監(jiān)控、預(yù)警、根源分析的閉環(huán)管理,預(yù)警信息主動(dòng)推送,開(kāi)創(chuàng)智慧校園管理決策的新途徑。該系統(tǒng)為高校智慧校園學(xué)生管理的決策科學(xué)化、監(jiān)督過(guò)程化提供智能參考的依據(jù),開(kāi)創(chuàng)高校教育管理的新模式。同時(shí)該系統(tǒng)可在其他高校中逐步推廣,讓高校的智慧校園建設(shè)邁上一個(gè)嶄新的臺(tái)階,對(duì)高校的教學(xué)管理和人才培養(yǎng)具有重要的實(shí)際應(yīng)用價(jià)值。

        猜你喜歡
        中心點(diǎn)軌跡標(biāo)簽
        軌跡
        軌跡
        Scratch 3.9更新了什么?
        如何設(shè)置造型中心點(diǎn)?
        電腦報(bào)(2019年4期)2019-09-10 07:22:44
        無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車(chē)迷(2018年11期)2018-08-30 03:20:32
        軌跡
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        進(jìn)化的軌跡(一)——進(jìn)化,無(wú)盡的適應(yīng)
        標(biāo)簽化傷害了誰(shuí)
        漢字藝術(shù)結(jié)構(gòu)解析(二)中心點(diǎn)處筆畫(huà)應(yīng)緊奏
        乱人伦人妻中文字幕不卡| 欧美人伦禁忌dvd放荡欲情| 色屁屁www影院免费观看入口| 91日韩高清在线观看播放| 美女精品国产一区二区三区 | 国产乱人伦真实精品视频| 极品新娘高清在线观看| 亚洲夫妻性生活免费视频| 久久99精品久久久久久秒播| 91av国产视频| 99久久免费中文字幕精品| 中文有码人妻字幕在线| 国产白嫩护士被弄高潮| 国产精品密播放国产免费看| 亚洲国产精品一区二区第一| 美妇炮灰被狂躁爽到高潮h| 久久久老熟女一区二区三区| 国产欧美精品一区二区三区–老狼 | 国产亚洲欧美日韩国产片| 日本一区二区三级免费| 国产a在亚洲线播放| 中文字幕乱码人妻一区二区三区| 久久久久亚洲AV片无码乐播 | 国产99视频精品免视看7| 国产乱人伦av在线无码| 成人综合久久精品色婷婷| 成人高清在线播放视频| 国产成人午夜无码电影在线观看| 亚洲人成网站77777在线观看| 国产高清一区在线观看| 中文字幕乱码在线人妻| 天天燥日日燥| 国产精品美女AV免费观看| 日本女同性恋一区二区三区网站| 欧美不卡一区二区三区| 鲁一鲁一鲁一鲁一澡| 亚洲女同系列高清在线观看| 精品亚洲一区二区三区四区五| 正在播放东北夫妻内射| 99久久久无码国产精品动漫 | 亚洲欧美在线观看|