夏士嵐 覃希 劉夢(mèng)娟
[摘 要] 文章針對(duì)現(xiàn)行高校大學(xué)生潛在的“網(wǎng)癮”問題,提出基于支持向量機(jī)的“網(wǎng)癮”模式識(shí)別方法。通過問卷調(diào)查和實(shí)際調(diào)查兩種形式獲得實(shí)驗(yàn)數(shù)據(jù),借助計(jì)算機(jī)學(xué)科中的支持向量機(jī)算法對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行模式識(shí)別,并對(duì)識(shí)別結(jié)果進(jìn)行分析、核驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法能有效輔助高校管理者及時(shí)發(fā)現(xiàn)具有“網(wǎng)癮”特征的學(xué)生。
[關(guān)鍵詞] “網(wǎng)癮”;支持向量機(jī);模式識(shí)別;大學(xué)生;高校
中圖分類號(hào):G647 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-1722(2021)09-0001-03
★基金項(xiàng)目:廣西高校本科生潛在網(wǎng)癮威脅預(yù)測(cè)與防控研究研究階段性成果(項(xiàng)目編號(hào):2015LSZ032);廣西大學(xué)大學(xué)生潛在網(wǎng)癮威脅預(yù)測(cè)與防控研究研究階段性成果(項(xiàng)目編號(hào):XGS1437);廣西高等學(xué)校大學(xué)生思想政治教育理論與實(shí)踐研究課題
21世紀(jì)是一個(gè)網(wǎng)絡(luò)時(shí)代,大學(xué)生群體既是潮流的先鋒,又極易迷失在網(wǎng)絡(luò)世界,導(dǎo)致自我封閉、學(xué)習(xí)成績(jī)下降。更有甚者,導(dǎo)致精神抑郁、品行障礙、情感分裂、人格分裂、自殺行為或青少年犯罪等。這就是人們俗稱的“網(wǎng)癮”現(xiàn)象,對(duì)高校大學(xué)生的“網(wǎng)癮”問題應(yīng)當(dāng)予以高度重視。筆者利用支持向量機(jī)數(shù)學(xué)模型,通過對(duì)高校大學(xué)生的問卷數(shù)據(jù)和實(shí)際調(diào)查數(shù)據(jù)進(jìn)行挖掘分析,及時(shí)發(fā)現(xiàn)具有“網(wǎng)癮”特征或潛在“網(wǎng)癮”特征的個(gè)體,并對(duì)其實(shí)施及時(shí)的教育引導(dǎo)。
一、相關(guān)概念的界定及研究背景
(一)大學(xué)生“網(wǎng)癮”
“網(wǎng)癮”的概念,最初由美國(guó)心理學(xué)家格登博格(Goldberg)提出,隨后,匹茲堡大學(xué)的金伯利·揚(yáng)博士(Dr.Kimberly Young)發(fā)展完善了他的這一概念?!熬W(wǎng)絡(luò)成癮”(IA)、“網(wǎng)絡(luò)成癮癥”(IAD)或“病態(tài)網(wǎng)絡(luò)使用”(PIU),是指在無成癮物質(zhì)作用下的上網(wǎng)行為沖動(dòng)失控,表現(xiàn)為由于過度使用互聯(lián)網(wǎng)而導(dǎo)致個(gè)體明顯的社會(huì)、心理功能損害。中國(guó)青少年網(wǎng)絡(luò)協(xié)會(huì)在2005年發(fā)布的《中國(guó)青少年網(wǎng)癮報(bào)告》中對(duì)“網(wǎng)癮”做出了如下界定:在認(rèn)同“上網(wǎng)給青少年的學(xué)習(xí)、工作或現(xiàn)實(shí)中的人際交往帶來不良影響”前提下,如果滿足了以下三個(gè)條件中任何一個(gè),就認(rèn)為該網(wǎng)民從一定程度上具有網(wǎng)癮特征,即判定屬于“網(wǎng)癮”。1.覺得在網(wǎng)絡(luò)中比在現(xiàn)實(shí)生活中更快樂或更能實(shí)現(xiàn)自我;2.每當(dāng)因特網(wǎng)的線路被掐斷或由于其他原因不能上網(wǎng)時(shí)會(huì)感到煩躁不安、情緒低落或無所適從;3.向親人隱瞞了自己上網(wǎng)時(shí)間。
(二)支持向量機(jī)
支持向量機(jī)(SVM)是一種用來具體實(shí)現(xiàn)統(tǒng)計(jì)學(xué)習(xí)理論核心思想的一種通用的學(xué)習(xí)方法。SVM由統(tǒng)計(jì)學(xué)習(xí)理論(SLT)和結(jié)構(gòu)化風(fēng)險(xiǎn)最小化原則(SRM)派生而來,是借助最優(yōu)化方法實(shí)現(xiàn)機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘利器。它能從小樣本中提取必要信息,能解決非線性問題,適用性廣,不會(huì)產(chǎn)生局部極小值。因此,SVM可以擺脫傳統(tǒng)統(tǒng)計(jì)學(xué)中“以大數(shù)據(jù)為實(shí)驗(yàn)基礎(chǔ)”的束縛,采用小樣本即可解決分類、預(yù)測(cè)等問題[1]。SVM的數(shù)學(xué)機(jī)制如圖1所示,分類問題最終是要找到最優(yōu)分類面。圖1中實(shí)心點(diǎn)和空心點(diǎn)代表兩類樣本,H為分類線,H1、H2分別為過兩類中離分類線最近的樣本且平行于分類線的直線,它們之間的距離叫做分類間隔。若能將兩類數(shù)據(jù)正確分開,并且使分類間隔最大,此時(shí)的H為最優(yōu)分類線。由此概念可推廣得出最優(yōu)分類平面的概念。虛線上的少量樣本稱之為支持向量,支持向量機(jī)也因此得名。
二、大學(xué)生“網(wǎng)癮”成因分析
(一)個(gè)人因素
很多學(xué)者在研究中強(qiáng)調(diào)了個(gè)人因素以及生理機(jī)制對(duì)于大學(xué)生“網(wǎng)癮”的影響。個(gè)人因素主要包括大學(xué)生的性格、社交圈、人生觀、培養(yǎng)環(huán)境等方面。性格內(nèi)向的學(xué)生更喜歡使用網(wǎng)絡(luò)進(jìn)行社交。尤其對(duì)于自信心不足、表達(dá)能力不好的學(xué)生在傳統(tǒng)的交流方式下他們不善于表達(dá)自己內(nèi)心的想法,而面對(duì)網(wǎng)絡(luò)所提供的方式就很喜歡。目前網(wǎng)絡(luò)社交的方式除了聊天以外就是網(wǎng)絡(luò)游戲。大學(xué)生在心理上長(zhǎng)期依賴網(wǎng)絡(luò),久而久之就形成“網(wǎng)迷”或“網(wǎng)癮”習(xí)慣。大學(xué)生正常的社交圈人群多為同學(xué)、老師,交流的內(nèi)容是經(jīng)過校園環(huán)境凈化、篩選的精英主流文化。而具有“網(wǎng)癮”的大學(xué)生其社交圈人群是很復(fù)雜的,社交圈內(nèi)所交流的內(nèi)容往往都是未經(jīng)過濾的社會(huì)信息,這些信息中往往摻雜黃色、暴力文化、錯(cuò)誤偏激認(rèn)識(shí)等。因?yàn)槌砷L(zhǎng)的社交圈不同,所以造就“網(wǎng)癮”大學(xué)生和非“網(wǎng)癮”大學(xué)生。所以,大學(xué)生的個(gè)人因素跟“網(wǎng)癮”的形成有重要關(guān)系。
(二)家庭因素
家庭因素是大學(xué)生“網(wǎng)癮”問題的根源。據(jù)有關(guān)研究顯示,家長(zhǎng)從小的教育方式深刻影響著大學(xué)生在校的行為。實(shí)際上,教育是家庭、學(xué)校、社會(huì)三者結(jié)合的產(chǎn)物,而家庭教育是教育體系的基礎(chǔ)。大學(xué)生在高校中出現(xiàn)“網(wǎng)癮”問題往往是長(zhǎng)期家庭環(huán)境所致。父母缺乏關(guān)愛、錯(cuò)誤的家庭教育方法等因素造成孩子心靈上的空缺,孩子只能通過網(wǎng)絡(luò)來彌補(bǔ)。進(jìn)入大學(xué)后,離開父母的約束,他們習(xí)慣性地通過最熟悉的網(wǎng)絡(luò)來滿足自己,最終導(dǎo)致出現(xiàn)“網(wǎng)癮”的現(xiàn)象。因此,家庭中父母的情況、親情關(guān)系、教育方式都影響在校大學(xué)生對(duì)網(wǎng)絡(luò)的使用狀態(tài)。
(三)學(xué)校因素
在教育體系三元素中,學(xué)校是教育的主體,承擔(dān)著主要的教育任務(wù)。大學(xué)生在學(xué)校的學(xué)習(xí)環(huán)境、專業(yè)教學(xué)情況、同學(xué)氛圍都將影響大學(xué)生在學(xué)校的發(fā)展。教學(xué)設(shè)施是否完善、大學(xué)生對(duì)所學(xué)專業(yè)是否感興趣、同班或同宿舍同學(xué)的學(xué)習(xí)態(tài)度都會(huì)影響大學(xué)生個(gè)體的發(fā)展。當(dāng)大學(xué)生個(gè)體在學(xué)校發(fā)展不好時(shí),普遍通過網(wǎng)絡(luò)來消除煩惱,如果大學(xué)生長(zhǎng)期處于低迷狀態(tài)并通過網(wǎng)絡(luò)來解脫,這就有可能形成“網(wǎng)癮”習(xí)慣。
(四)社會(huì)因素
隨著信息時(shí)代的到來,網(wǎng)絡(luò)已經(jīng)成為人們生活中必不可少的元素。這使得人們足不出戶也能滿足生活需要。但是現(xiàn)階段的網(wǎng)絡(luò)社會(huì)發(fā)展還不夠健全,仍無法跟真實(shí)社會(huì)等同。有的大學(xué)生長(zhǎng)期只通過網(wǎng)絡(luò)進(jìn)行社交,只接受網(wǎng)絡(luò)規(guī)則的熏染,對(duì)真實(shí)社會(huì)的規(guī)則不能適應(yīng),甚至無法接受。久而久之,真實(shí)大學(xué)生個(gè)體對(duì)真實(shí)世界產(chǎn)生排斥感,反而對(duì)網(wǎng)絡(luò)世界充滿喜愛。最終,大學(xué)生只能依賴網(wǎng)絡(luò)生存,形成“網(wǎng)癮”習(xí)慣。
三、建立大學(xué)生潛在“網(wǎng)癮”預(yù)測(cè)模型
本文設(shè)計(jì)的大學(xué)生潛在“網(wǎng)癮”預(yù)測(cè)模型是基于SVM理論的分類預(yù)測(cè)模型完成的。模型中的各個(gè)維屬性根據(jù)大學(xué)生“網(wǎng)癮”的成因進(jìn)行歸納而得。屬性根據(jù)性質(zhì)分為4組,共27維屬性值[2]。
第一、二組:父親/母親信息
職業(yè){1: 單位干部,2: 普通白領(lǐng),3: 工人,4: 務(wù)農(nóng)}
文化程度{1: 大學(xué)及以上,2: 大學(xué)以下}
收入{1: 5000元以上/月,2: 5000~3000元/月,3: 3000~1000元/月,4: 100 0元以下/月}
年齡{1: 60以上,2: 50多,3: 40多,4: 40以下}
第三組:家庭關(guān)系信息
1.父母關(guān)系{1:和睦,2:不和諧,3:離異}
2.是否為獨(dú)生子女家庭{1:是,2:否}
3.家里有無電腦{1:有,2:無}
4.父母一直為你設(shè)計(jì)好一切{1:是,2:否}
5.父母對(duì)你管教如何?{1: 非常嚴(yán)厲、事事干涉,2:正常關(guān)心,3: 有求必應(yīng),4: 不聞不問}
6.當(dāng)你犯錯(cuò)誤時(shí)父母采取什么方式?{1: 打罵,2: 講道理,3: 不理睬}
7.跟父母有代溝嗎?{1:有,2:無}
第四組:個(gè)人信息
1.政治面貌{1: 黨員,2:團(tuán)員,3:群眾}
2.性格{1:外向,2:內(nèi)向}
3.在大學(xué)中人際關(guān)系如何?{1: 朋友很多、社交很廣,2: 社交圈一般,只跟本班同學(xué)熟,3: 沒有什么朋友,常感到孤單寂寞}
4.目前是否談戀愛?{1:是,2:否}
5.進(jìn)入大學(xué)后的成績(jī)?nèi)绾??{1:一如既往的好,2:比高中時(shí)好,3:比高中時(shí)差,4:一直一般,5:一直不好}
6.喜歡本專業(yè)嗎?{1:喜歡,2:不喜歡}
7.進(jìn)入大學(xué)時(shí)是否給自己定有學(xué)習(xí)/工作上的奮斗目標(biāo)?{1:是,2:否}
8.目前是否仍朝著目標(biāo)努力?{1:能,2:不能}
9.無人提醒時(shí)能否自主學(xué)習(xí)?{1:是,2:否}
10.經(jīng)常自己的事情自己決定{1:有,2:沒有}
11.上大學(xué)前有無接觸過電腦?{1:有,2:沒有}
12.上大學(xué)前有無接觸過網(wǎng)游?{1:有,2:沒有}
四、實(shí)驗(yàn)操作過程
(一)準(zhǔn)備階段
實(shí)驗(yàn)數(shù)據(jù)通過發(fā)放問卷獲得。實(shí)驗(yàn)對(duì)象選取廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院2019級(jí)(當(dāng)年大一)、2018級(jí)(當(dāng)年大二)、2017級(jí)(當(dāng)年大三)三個(gè)年級(jí)的大學(xué)生。共發(fā)放問卷數(shù)量1000份,回收934份,有效問卷929份。我們將回收的問卷數(shù)據(jù)錄入數(shù)據(jù)庫(kù),并對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換,將文本型的問卷數(shù)據(jù)轉(zhuǎn)換成數(shù)值型數(shù)據(jù)。本實(shí)驗(yàn)的SVM模式識(shí)別借助libSVM算法包完成,因此要以libSVM的分類格式規(guī)范源數(shù)據(jù)。另外,SVM分類預(yù)測(cè)需要準(zhǔn)備兩個(gè)集合:訓(xùn)練集和測(cè)試集。于是我們將2017級(jí)、2018級(jí)的大學(xué)生數(shù)據(jù)作為訓(xùn)練集,將2019級(jí)大學(xué)生數(shù)據(jù)作為測(cè)試集。剔除不規(guī)則數(shù)據(jù)后,得到訓(xùn)練集數(shù)據(jù)670條,測(cè)試集數(shù)據(jù)264條。
(二)數(shù)據(jù)狀態(tài)的審定
實(shí)驗(yàn)中“-1”表示網(wǎng)癮狀態(tài),“1”表示正常狀態(tài)。SVM利用訓(xùn)練集來習(xí)得預(yù)測(cè)模式,訓(xùn)練集中每一名同學(xué)的分類情況要盡可能的符合實(shí)際[3]。因此,訓(xùn)練集狀態(tài)的審定是至關(guān)重要的。訓(xùn)練集中的數(shù)據(jù)由老生(2017級(jí)、2018級(jí)的大學(xué)生)數(shù)據(jù)組成。通過對(duì)老生長(zhǎng)期在校的表現(xiàn)、欠學(xué)分情況、大多數(shù)同學(xué)的反饋,很容易可以知道老生中具有顯性網(wǎng)癮表現(xiàn)的同學(xué),以此得到訓(xùn)練集中的數(shù)據(jù)狀態(tài)。
對(duì)于測(cè)試集而言,數(shù)據(jù)來自新生(2019級(jí)大學(xué)生)。利用SVM的分類功能來識(shí)別新生的狀態(tài),最后對(duì)預(yù)測(cè)的情況進(jìn)行評(píng)測(cè)。新生經(jīng)過一個(gè)學(xué)期的觀察后,滿足以下條件的判定為具有潛在網(wǎng)癮威脅:
在校表現(xiàn):平時(shí)曠課時(shí)數(shù)≥5學(xué)時(shí)
考試情況:正考不及格科目數(shù)≥3門
宿舍調(diào)查:使用電腦從事上網(wǎng)活動(dòng)超過≥6小時(shí)
(三)評(píng)測(cè)指標(biāo)
實(shí)驗(yàn)設(shè)定3個(gè)評(píng)測(cè)指標(biāo)來評(píng)測(cè)試驗(yàn)結(jié)果:精確度、漏檢率、誤檢率。其中精確度用來衡量實(shí)驗(yàn)方法的準(zhǔn)確程度,公式如下:
精確度=實(shí)驗(yàn)得到的狀態(tài)跟審定狀態(tài)相同的人數(shù)/新生總?cè)藬?shù)×100%
漏檢率用來描述實(shí)驗(yàn)方法把有“網(wǎng)癮”學(xué)生誤判成了無“網(wǎng)癮”學(xué)生的錯(cuò)誤程度,公式如下:
漏檢率=(實(shí)際狀態(tài)為有“網(wǎng)癮”但識(shí)別為無“網(wǎng)癮”的新生人數(shù))/新生總?cè)藬?shù)×100%
誤檢率用來描述實(shí)驗(yàn)方法把無“網(wǎng)癮”的學(xué)生誤判成了有“網(wǎng)癮”的學(xué)生情況,公式如下:
誤檢率=(實(shí)際是無“網(wǎng)癮”但實(shí)驗(yàn)識(shí)別為有“網(wǎng)癮”的新生人數(shù))/新生總?cè)藬?shù)×100%
(四)實(shí)驗(yàn)數(shù)據(jù)分析
實(shí)驗(yàn)結(jié)果的評(píng)測(cè)標(biāo)準(zhǔn)是經(jīng)審定后的測(cè)試數(shù)據(jù)狀態(tài)。將審定的數(shù)據(jù)狀態(tài)分別跟SVM實(shí)驗(yàn)預(yù)測(cè)狀態(tài)和問卷調(diào)查得到的狀態(tài)經(jīng)行對(duì)比。結(jié)果如下表所示:
從表中精確度一欄看出SVM的精確度是88.46%,問卷調(diào)查得到的精確度是90.76%。雖然SVM比問卷調(diào)查得到的精確度要略低,但經(jīng)過進(jìn)一步對(duì)比發(fā)現(xiàn),SVM的“網(wǎng)癮”漏檢率是17.6%,問卷的“網(wǎng)癮”漏檢率是44.1%,問卷比SVM預(yù)測(cè)的“網(wǎng)癮”漏檢率高出26.5個(gè)百分點(diǎn)。這說明,使用問卷的調(diào)查方式很難獲取潛在“網(wǎng)癮”狀態(tài),即被調(diào)查者更傾向于將自己認(rèn)為是無“網(wǎng)癮”的。而使用SVM預(yù)測(cè)獲得的“網(wǎng)癮”狀態(tài)相對(duì)來說更客觀。SVM是通過計(jì)算被調(diào)查者的特征,將其根據(jù)模式歸類得到的結(jié)果。SVM能更客觀地挖掘潛在的“網(wǎng)癮”情況。從非“網(wǎng)癮”誤檢率看出,SVM的偏高,問卷的偏低。這也說明了,問卷調(diào)查過程中,被調(diào)查者更偏向于將自己填寫成非“網(wǎng)癮”狀態(tài),所以問卷的非“網(wǎng)癮”誤檢率低;而SVM通過計(jì)算來挖掘,會(huì)把一些本來是認(rèn)為自己是正常的大同學(xué)誤檢成是“網(wǎng)癮”狀態(tài)。
綜上所述,在挖掘“新生中具有潛在‘網(wǎng)癮威脅”的過程中,SVM的挖掘效果更好。雖然SVM在盡可能發(fā)現(xiàn)具有“網(wǎng)癮”威脅大學(xué)生的同時(shí),會(huì)把小部分無“網(wǎng)癮”的大學(xué)生誤認(rèn)為是有“網(wǎng)癮”的,但這種誤檢,在實(shí)際中對(duì)大學(xué)生工作的開展沒有任何阻礙。相反,若將有潛在“網(wǎng)癮”威脅的”漏檢,在實(shí)際工作中輔導(dǎo)員和班主任會(huì)因此錯(cuò)過對(duì)新生最佳的引導(dǎo)和教育時(shí)機(jī),最終導(dǎo)致更多“網(wǎng)癮”大學(xué)生的出現(xiàn)。
五、結(jié)語(yǔ)
目前針對(duì)大學(xué)生“網(wǎng)癮”問題普遍的解決措施有兩大方面。一是針對(duì)已經(jīng)有明顯“網(wǎng)癮”狀況的大學(xué)生所采取的補(bǔ)救措施,二是為了防止“網(wǎng)癮”的發(fā)生而針對(duì)所有大學(xué)生采取的有效措施。前者屬于亡羊補(bǔ)牢,收效甚微;后者屬于漫天撒網(wǎng),費(fèi)時(shí)費(fèi)力,工作沒有重點(diǎn),它們都不能從根本上解決這一問題。利用筆者提出的基于支持向量機(jī)的大學(xué)生潛在“網(wǎng)癮”威脅預(yù)測(cè)方法,可以利用老生的特征數(shù)據(jù),對(duì)新生進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果能為高校輔導(dǎo)員及大學(xué)生工作者提供有針對(duì)性的大學(xué)生群體名單,進(jìn)而可以根據(jù)大學(xué)生的具體情況對(duì)該群體實(shí)施預(yù)防性的心理輔導(dǎo)教育。
參考文獻(xiàn):
[1]危雅玲.青少年網(wǎng)癮治理的困境及對(duì)策研究 ——以南京市為例[J].南京師范大學(xué),2020(01):66.
[2]覃希,夏寧霞,蘇一丹.基于支持向量機(jī)的垃圾標(biāo)簽檢測(cè)模型[J].計(jì)算機(jī)應(yīng)用研究,2010,27(10):3893--3895.
[3]肖丹.社會(huì)化理論視域下網(wǎng)絡(luò)成癮大學(xué)生思想政治教育途徑研究[J].西南石油大學(xué),2017(05):49.