亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用spss軟件分析校園霸凌事件的發(fā)生規(guī)律以及預(yù)防

        2018-02-05 09:16:57李英娜
        軟件 2018年1期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則分析

        趙 楠,王 昕,李英娜,吳 晟

        (1. 昆明理工大學(xué) 信息工程與自動化學(xué)院,云南 昆明 650500;2. 云南電網(wǎng)公司電力科學(xué)研究院工作站,云南 昆明 650217)

        0 引言

        校園欺凌是指同學(xué)間欺負(fù)弱小的行為,校園欺凌多發(fā)生在中小學(xué),由于很多國家實行多是九年制的義務(wù)教育制度,受害者會長期受到欺凌。欺凌過程,蘊藏著一個復(fù)雜的互動狀態(tài),欺負(fù)同學(xué)會對同學(xué)構(gòu)成心理問題,影響健康,甚至影響人格發(fā)展。在世界的各個國家,每天都會發(fā)生校園欺凌的事件,并不時有校園學(xué)生欺凌暴力案件的報道,其中還有一些性質(zhì)相當(dāng)嚴(yán)重的惡性案件。案件中那些心靈被扭曲的孩子們作案手段之殘忍,令人觸目驚心。在中國,校園暴力一般要到非常嚴(yán)重,甚至已經(jīng)觸犯刑法的程度,才會受到社會注意。

        1 問題重述

        近年來,我國發(fā)生的多起校園霸凌事件在媒體的報道下引發(fā)了許多國人的關(guān)注。所謂校園霸凌實際上是指孩子們之間權(quán)力不平等的欺凌與壓迫,表現(xiàn)為同儕間肢體與言語的攻擊、人際互動中的抗拒及排擠等有意圖的攻擊性行為。霸凌事件對學(xué)生身體和精神上的影響是極為嚴(yán)重而長遠(yuǎn)的,因此對這些情況我們應(yīng)該給予高度的重視。面對科學(xué)技術(shù)的快速發(fā)展和互聯(lián)網(wǎng)的普及,給青少年帶來的不僅僅是積極的影響。網(wǎng)絡(luò)霸凌的暴力行為的傳播速度之快與范圍之廣對受害者極易造成很大程度的傷害??紤]到驅(qū)使青少年施加暴力行為的主要誘因還是年齡,因此我們設(shè)計了一次針對不同年齡段青少年的心理狀況的問卷調(diào)查,調(diào)查分為5個年齡段,涉及生命教育、生活方式、娛樂三個領(lǐng)域,分別包括正向、負(fù)向兩個框架,根據(jù)自變量和因變量的選擇,如附件一中調(diào)查結(jié)果所示,按照選擇的答案計算相應(yīng)的得分,試圖以此模型來判斷青少年存在一些潛在心理問題的可能性。

        (1)通過統(tǒng)計分析,請判斷各個年齡段的心理狀況是否有顯著的差異。

        (2)請建立合理的數(shù)學(xué)模型,分析不同框架的主要影響因素。

        2 問題分析

        問題中包含了兩個小問,在問題(1)中要判斷各個年齡段的心理狀況是否有顯著差異。從實際出發(fā),青少年在成長的階段,隨著對世界新事物的接觸及人際交往的復(fù)雜,不同年齡段的心理狀態(tài)應(yīng)該有顯著差異。但我們要根據(jù)調(diào)查所得的數(shù)據(jù)通過分析來確定差異性變化;調(diào)查所得數(shù)據(jù)是基于正向反向兩個框架而得,所以問題(2)是在問題(1)的基礎(chǔ)上,要具體分析不同框架的主要影響因素。

        3 模型假設(shè)

        (1)假設(shè)問卷調(diào)查的數(shù)據(jù)真實可靠;

        (2)假設(shè)調(diào)查問卷的對象中男女生人數(shù)差異不大,即性別是個年齡段心理狀況的無關(guān)影響因素;

        4 變量與符號說明

        A:正向程度深(沖動性強(qiáng))

        B:負(fù)向程度深(沖動性弱)

        風(fēng)險偏好:A1-A18

        認(rèn)知需要:B1、B10、B15、B20、B25

        理智型:C2、C8、C11、C18、C23

        直覺性:D3、D7、D12、D17、D22

        依賴性:E4、E6、E13、E16、E21

        回避型:F5、F9、F14、F24

        i:表示年齡段的參數(shù) ,取值i=1,2,3,4,5,對應(yīng)題中年齡段9~10,11~12,13~14,15~16,17~18時

        j:表示男女的參數(shù),取值 j=1,0對應(yīng)題中男性和女性

        5 問題(1)的分析求解

        對于問題(1)在我們采用SPSS分析軟件,基于調(diào)查得到的數(shù)據(jù),通過選擇自變量與因變量,得到了以下數(shù)表:

        由上圖可知,對于5個不同的年齡段的綜合分析,可知學(xué)生心理狀況在年齡上有顯著差異,近似成正態(tài)分布。

        6 問題(2)模型的建立與求解

        6.1 頻繁項集的評估標(biāo)準(zhǔn)

        什么樣的數(shù)據(jù)才是頻繁項集呢?也許你會說,這還不簡單,肉眼一掃,一起出現(xiàn)次數(shù)多的數(shù)據(jù)集就是頻繁項集嗎!的確,這也沒有說錯,但是有兩個問題,第一是當(dāng)數(shù)據(jù)量非常大的時候,我們沒法直接肉眼發(fā)現(xiàn)頻繁項集,這催生了關(guān)聯(lián)規(guī)則挖掘的算法,比如Apriori, PrefixSpan, CBA。第二是我們?nèi)狈σ粋€頻繁項集的標(biāo)準(zhǔn)。比如10條記錄,里面A和B同時出現(xiàn)了三次,那么我們能不能說A和B一起構(gòu)成頻繁項集呢?因此我們需要一個評估頻繁項集的標(biāo)準(zhǔn)。

        常用的頻繁項集的評估標(biāo)準(zhǔn)有支持度,置信度和提升度三個。支持度就是幾個關(guān)聯(lián)的數(shù)據(jù)在數(shù)據(jù)集中出現(xiàn)的次數(shù)占總數(shù)據(jù)集的比重?;蛘哒f幾個數(shù)據(jù)關(guān)聯(lián)出現(xiàn)的概率。如果我們有兩個想分析關(guān)聯(lián)性的數(shù)據(jù)X和Y,則對應(yīng)的支持度為:

        以此類推,如果我們有三個想分析關(guān)聯(lián)性的數(shù)據(jù)X,Y和Z,則對應(yīng)的支持度為:

        一般來說,支持度高的數(shù)據(jù)不一定構(gòu)成頻繁項集,但是支持度太低的數(shù)據(jù)肯定不構(gòu)成頻繁項集。置信度體現(xiàn)了一個數(shù)據(jù)出現(xiàn)后,另一個數(shù)據(jù)出現(xiàn)的概率,或者說數(shù)據(jù)的條件概率。如果我們有兩個想分析關(guān)聯(lián)性的數(shù)據(jù)X和Y,X對Y的置信度為

        Confidence(X?Y)=P(X|Y)=P(XY)/P(Y)

        也可以以此類推到多個數(shù)據(jù)的關(guān)聯(lián)置信度,比如對于三個數(shù)據(jù)X,Y,Z,則X對于Y和Z的置信度為:

        Confidence(X?YZ)=P(X|YZ)=P(XYZ)/P(YZ)

        舉個例子,在購物數(shù)據(jù)中,紙巾對應(yīng)雞爪的置信度為40%,支持度為1%。則意味著在購物數(shù)據(jù)中,總共有1%的用戶既買雞爪又買紙巾;同時買雞爪的用戶中有40%的用戶購買紙巾。提升度表示含有Y的條件下,同時含有X的概率,與X總體發(fā)生的概率之比,即:

        Lift(X?Y)=P(X|Y)/P(X)=Confidence(X?Y)/P(X)

        提升度體先了X和Y之間的關(guān)聯(lián)關(guān)系,提升度大于1則X?Y是有效的強(qiáng)關(guān)聯(lián)規(guī)則,提升度小于等于1則X?Y是無效的強(qiáng)關(guān)聯(lián)規(guī)則。一個特殊的情況,如果X和Y獨立,則有Lift(X?Y)=1,因為此時P(X|Y)=P(X)。

        一般來說,要選擇一個數(shù)據(jù)集合中的頻繁數(shù)據(jù)集,則需要自定義評估標(biāo)準(zhǔn)。最常用的評估標(biāo)準(zhǔn)是用自定義的支持度,或者是自定義支持度和置信度的一個組合。

        設(shè)A是一個項集,事務(wù)T包含A當(dāng)且僅當(dāng)A T。犯罪模式中的合作關(guān)聯(lián)規(guī)則,是形如 A B的蘊涵式,其中A I,B I,并且A∩B=。規(guī)則A B在事務(wù)集D中成立,具有支持度s,其中s是D中事務(wù)包含A B的百分比,它是概率P(A B)。規(guī)則A B在事務(wù)集D中具有置信度c,如果D中包含A的事務(wù)同時也包含B的百分比是c,這是條件概率P(B|A)。即是:

        support A B =P(A B) confidence A B =P(B|A)

        同時滿足min_sup和min_conf的規(guī)則稱作強(qiáng)規(guī)則。如果包含k項的項集在事務(wù)集D中的出現(xiàn)頻率大于設(shè)定的最小支持度min_sup與事務(wù)集中記錄總數(shù)的成績,則該項集滿足最小支持度閾值,稱該項集為頻繁k - 項集。

        沖動模式中,青少年的關(guān)聯(lián)規(guī)則的挖掘是一個兩步的過程,首先要找出所有的頻繁項集,然后再由頻繁項集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。下面根據(jù)上述步驟進(jìn)行關(guān)聯(lián)規(guī)則的挖掘。

        6.2 Apriori算法思想

        對于 Apriori算法,我們使用支持度來作為我們判斷頻繁項集的標(biāo)準(zhǔn)。Apriori算法的目標(biāo)是找到最大的K項頻繁集。這里有兩層意思,首先,我們要找到符合支持度標(biāo)準(zhǔn)的頻繁集。但是這樣的頻繁集可能有很多。第二層意思就是我們要找到最大個數(shù)的頻繁集。比如我們找到符合支持度的頻繁集AB和ABE,那么我們會拋棄AB,只保留ABE,因為AB是2項頻繁集,而ABE是3項頻繁集。那么具體的,Apriori算法是如何做到挖掘K項頻繁集的呢?

        Apriori算法采用了迭代的方法,先搜索出候選1項集及對應(yīng)的支持度,剪枝去掉低于支持度的 1項集,得到頻繁1項集。然后對剩下的頻繁1項集進(jìn)行連接,得到候選的頻繁2項集,篩選去掉低于支持度的候選頻繁 2項集,得到真正的頻繁二項集,以此類推,迭代下去,直到無法找到頻繁k+1項集為止,對應(yīng)的頻繁k項集的集合即為算法的輸出結(jié)果。

        可見這個算法還是很簡潔的,第i次的迭代過程包括掃描計算候選頻繁 i項集的支持度,剪枝得到真正頻繁i項集和連接生成候選頻繁i+1項集三步。

        我們的數(shù)據(jù)集D有4條記錄,分別是134,235,1235和25。現(xiàn)在我們用 Apriori算法來尋找頻繁k

        項集,最小支持度設(shè)置為50%。首先我們生成候選頻繁1項集,包括我們所有的5個數(shù)據(jù)并計算5個數(shù)據(jù)的支持度,計算完畢后我們進(jìn)行剪枝,數(shù)據(jù) 4由于支持度只有25%被剪掉。我們最終的頻繁1項集為1235,現(xiàn)在我們鏈接生成候選頻繁2項集,包括12,13,15,23,25,35共6組。此時我們的第一輪迭代結(jié)束。

        圖1 算法迭代圖Fig.1 Algorithm iteration diagram

        進(jìn)入第二輪迭代,我們掃描數(shù)據(jù)集計算候選頻繁2項集的支持度,接著進(jìn)行剪枝,由于12和15的支持度只有25%而被篩除,得到真正的頻繁2項集,包括13,23,25,35。現(xiàn)在我們鏈接生成候選頻繁3項集,123,125,135和235共4組,這部分圖中沒有畫出。通過計算候選頻繁3項集的支持度,我們發(fā)現(xiàn)123,125和135的支持度均為25%,因此接著被剪枝,最終得到的真正頻繁3項集為235一組。由于此時我們無法再進(jìn)行數(shù)據(jù)連接,進(jìn)而得到候選頻繁4項集,最終的結(jié)果即為頻繁3三項集235。

        6.3 Aprior算法流程

        下面我們對Aprior算法流程做一個總結(jié)。

        輸入:數(shù)據(jù)集合D,支持度閾值α

        輸出:最大的頻繁k項集

        (1)掃描整個數(shù)據(jù)集,得到所有出現(xiàn)過的數(shù)據(jù),作為候選頻繁1項集。k=1,頻繁0項集為空集。

        (2)挖掘頻繁k項集

        (a)掃描數(shù)據(jù)計算候選頻繁k項集的支持度

        (b)去除候選頻繁 k項集中支持度低于閾值的數(shù)據(jù)集,得到頻繁 k項集。如果得到的頻繁 k項集為空,則直接返回頻繁k-1項集的集合作為算法結(jié)果,算法結(jié)束。如果得到的頻繁k項集只有一項,則直接返回頻繁k項集的集合作為算法結(jié)果,算法結(jié)束。

        (c)基于頻繁k項集,連接生成候選頻繁k+1項集。

        (3)令k=k+1,轉(zhuǎn)入步驟2。

        從算法的步驟可以看出,Aprior算法每輪迭代都要掃描數(shù)據(jù)集,因此在數(shù)據(jù)集很大,數(shù)據(jù)種類很多的時候,算法效率很低。

        (1)找出所有頻繁項集(利用Apriori算法)。

        Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法。 根據(jù)Apriori算法的性質(zhì),頻繁項集的所有非空子集都必須也是頻繁的。Apriori性質(zhì)基于如下觀察:根據(jù)定義,如果項集 I不滿足最小支持度min_sup,則I不是頻繁的,即P(A)

        (2)由頻繁項集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。 置信度由下式表示:

        support_count(A B)

        confidenceA B=PBA= 其中,support_count(A B)是包含項集 A B的事務(wù)數(shù),support_count(A)是包含項集A的事務(wù)數(shù)。根據(jù)該式,關(guān)聯(lián)規(guī)則可以產(chǎn)生如下:

        (1)對于每個頻繁項集 l,產(chǎn)生 l的所有非空子集;(2)對于l的每個非空子集s,如果:

        support_count(l)

        ≥min_conf

        則輸出規(guī)則“s (l s)”。其中,min_conf是最小置信度閾值。

        根據(jù)上述分析,設(shè)定min_sup為10%,min_conf為80%,對附件1中提供的數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析的結(jié)果如表1。

        本文首先根據(jù)數(shù)據(jù)挖掘的關(guān)聯(lián)分析技術(shù),通過Apriori算法分析青少年性格的觀察數(shù)據(jù),得到了可能的發(fā)生暴力的模式集合。進(jìn)一步通過決策樹分析,得到了結(jié)合青少年間的犯罪模式,并通過模式對比得到各種犯罪模式的正確率,與觀測數(shù)據(jù)吻合非常好。

        決策樹(Decision tree)是一類二叉樹,其中每個內(nèi)部節(jié)點表示在一個屬性上的測試,每個分枝代表一個測試輸出,而每個樹葉節(jié)點代表類或類分布。樹的最頂層節(jié)點是根節(jié)點。開發(fā)預(yù)測決策樹的過程是:首先考慮訓(xùn)練數(shù)據(jù)集 X,然后根據(jù)自變量的值和最佳的劃分選擇將X分為兩個或更多子集的所有可能分枝,從而生成預(yù)測決策樹。

        在本題中,可以將事務(wù)T中的布爾變量作為二叉分枝。根據(jù)圖2,建立決策樹如下。

        根據(jù)上圖所示的決策樹,得出犯罪模式組合如表2所示。

        從該決策樹中,可以得出一些預(yù)測知識。當(dāng)然,由于樣本數(shù)量和項目還不夠多,分析程度和分類知識的獲取還不夠理想,可信度也還相對不夠,還只能稱作一個簡單的粗層次的分類分析模型,但其精度已經(jīng)滿足需要。

        表1 關(guān)聯(lián)分析表Tab.1 Association analysis table

        表2 犯罪模式表Tab.2 Crime pattern table

        根據(jù)上述分析,只需找到特定的犯罪模式,就可以根據(jù)預(yù)測決策樹來計算相應(yīng)模式的危害度。根據(jù)預(yù)測決策樹計算出各個模式的危害度為:

        表3 犯罪模式危害度表Tab.3 Crime mode hazard table

        給出平均絕對誤差和平均相對誤差:

        平均絕對誤差=0.008平均相對誤差=1.6%

        該誤差可以作為對可信度的評價,本文將下式作為可信度的置信度的評價式:

        置信度=1平均相對誤差=98.4%

        圖8示例葉節(jié)點所在位置示意圖

        所選擇節(jié)點為節(jié)點13,該節(jié)點的信息如下:

        表4 節(jié)點表Tab.4 Node table

        X5 = 1 and X1 = 0 and X2 = 0 and X4 = 0的所有規(guī)則,均為發(fā)生變化的規(guī)則。

        7 模型的評價及改進(jìn)

        (1)模型的優(yōu)點

        (a)模型利用數(shù)據(jù)挖掘中的關(guān)聯(lián)分析和決策樹的概念,完成了針對題目所給的 數(shù)據(jù)的分析,并給出了數(shù)據(jù)的組合模式,模型能夠排除小部分異常數(shù)據(jù)對模式分析的干擾。

        (b)模型具有一定的普遍使用性,不僅僅可以在犯罪模式識別領(lǐng)域,在解決其 他海量數(shù)據(jù)的關(guān)聯(lián)分析和決策方面,也具有一定的適用性。

        (2)模型的缺點

        (a)Apriori算法需要產(chǎn)生巨大的候選集并且多次掃描數(shù)據(jù)集,在處理大規(guī)模數(shù) 據(jù)時,可能會遇到性能瓶頸。

        (b)模型不能針對所給數(shù)據(jù),給出確定的,具體的犯罪模式組合,僅可以對犯 罪模式組合的可能性進(jìn)行分析。

        (3)模型的改進(jìn)

        (a)將Apriori算法改進(jìn)為基于FP-tree的頻繁集查找算法,提高運行效率,由于時間所限,本文不再贅述。

        [1] 黃弋石, 梁艷. 手寫識別建模數(shù)學(xué)方法研究[J]. 軟件,2013, 34(8): 13-15.

        [2] 章亮, 劉斌, 陸民燕等. 嵌入式軟件測試開發(fā)環(huán)境的框架設(shè)計[J]. 北京航空航天大學(xué)學(xué)報, 2005, 31(3): 336-34.Zhang Liang, Liu Bin, Lu Minyan. Framework design of embedded soft-ware testing development environment[J].Journal of Beijing University of Aerounautics And Astronautics, 2005, 31(3): 336-340.

        [3] 李偉. 軟件產(chǎn)品測試系統(tǒng)的設(shè)計與功能實現(xiàn)[D]. 中國海洋大學(xué), 2004. Li Wei.Design and implementation of test system software products [D]. Ocean University of China, 2004.

        [4] 林曉欲, 石磊. 嵌入式軟件系統(tǒng)測試模型的研究與實現(xiàn)[J].科學(xué)技術(shù)與工程, 2009, 9(24): 75157520.Lin Xiaoyu, Shi Lei. The Research and Realization of System Testing Model for Embedded Software[J]. SCIENCE TECHNOLOGY AND ENGINEERING, 2009, 9(24): 75157520.

        [5] 趙蒙, 宋俊德, 鄂海紅. 一種社會化標(biāo)簽系統(tǒng)的用戶興趣建模方法[J]. 軟件, 2013, 34(12): 136-138.

        [6] 葉新, 潘清, 董正宏. 多領(lǐng)域建模仿真方法綜述[J]. 軟件,2014, 35(3): 233-236.

        [7] 浦慧忠. 基于Web挖掘的用戶興趣建模方法的研究[J]. 軟件, 2014, 35(7): 126-128.

        [8] 張雅媛. 3D MIMO信道建模及性能分析[J]. 軟件, 2014,35(9): 115-119.

        [9] 盧超, 黃蔚, 胡國超. 基于圖形數(shù)據(jù)結(jié)構(gòu)的復(fù)雜對象建模設(shè)計[J]. 軟件, 2015, 36(12): 220-223.

        [10] 賈一琦. 校園網(wǎng)絡(luò)安全問題的分析與對策探討[J]. 軟件,2014, 35(3): 161-162.

        [11] 胡健, 王理江. 數(shù)據(jù)挖掘在選課推薦中的研究[J]. 軟件,2016, 37(4): 119-121.

        [12] 王尚廣, 孫其博, 楊放春. 基于云模型的不確定性QoS感知的Skyline服務(wù)選擇.軟件學(xué)報, 2012, 23(6): 1397-1412.

        [13] 陳妍. 計算機(jī)軟件開發(fā)的規(guī)范化探析[J]. 軟件, 2313, 34(7):33-34.

        [14] 雷文育. 關(guān)于如何創(chuàng)新和完善計算機(jī)軟件工程管理的探討[J]. 軟件, 2013, 34(10): 46.

        [15] 李偉. 基于工作過程的計算機(jī)軟件學(xué)習(xí)策略探究[J]. 軟件,2014, 35(1): 146.

        猜你喜歡
        關(guān)聯(lián)規(guī)則分析
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨的規(guī)則和演變
        隱蔽失效適航要求符合性驗證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對我國的啟示
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        精品国产一区二区av麻豆不卡 | 精彩视频在线观看一区二区三区 | 亚洲∧v久久久无码精品| 欧美成人www免费全部网站| 一本大道综合久久丝袜精品 | 无码av中文一区二区三区| 成人免费看吃奶视频网站| 国产一区二区牛影视| 免费高清日本一区二区| 亚洲精品中文字幕一二三区| 国语对白做受xxxxx在线| 四虎永久在线精品免费观看地址| 永久免费在线观看蜜桃视频| 人妻少妇精品视频一区二区三区l 日韩人妻中文字幕专区 | 日本久久黄色高清视频| 亚洲一区二区二区视频| 久久精品国产69国产精品亚洲| 无码片久久久天堂中文字幕| 精品国产污黄网站在线观看| 久久综合99re88久久爱| 久久av高潮av无码av喷吹| 精品国产一区二区三区久久女人| 亚洲日本中文字幕乱码| 国产免费牲交视频| 18禁无遮挡无码网站免费| 欧美亚洲尤物久久综合精品| 国产性色av一区二区| 三级全黄的视频在线观看| 东北无码熟妇人妻AV在线| 免费观看成人稀缺视频在线播放| 丝袜美腿福利一区二区| 骚片av蜜桃精品一区| 亚洲午夜精品久久久久久抢 | 日韩欧美人妻一区二区三区| 国产 中文 制服丝袜 另类| 久久人妻精品免费二区| 人妻精品久久久久中文字幕69| 国产成人无码区免费网站| 国产美女胸大一区二区三区| 日韩有码中文字幕在线观看 | 日本中文字幕av网址|