韓煦 張妮娜 李潤(rùn)澤
摘要:本文通過(guò)運(yùn)用K近鄰算法對(duì)睡眠質(zhì)量展開(kāi)研究,主要針對(duì)睡眠質(zhì)量的后期影響展開(kāi)研究,已期為現(xiàn)代居民提高睡眠質(zhì)量提供借鑒意義。
關(guān)鍵詞:K近鄰算法 睡眠質(zhì)量
一、K近鄰算法
K近鄰算法是由Cover與Hart在1968年提出的一種基于統(tǒng)計(jì)學(xué)的分類(lèi)算法,是非參數(shù)算法中最重要的一種算法。在對(duì)每個(gè)樣本數(shù)據(jù)集進(jìn)行相似程度計(jì)算時(shí),距離的度量標(biāo)準(zhǔn)中常用的有:歐式距離、曼哈頓距離、向量?jī)?nèi)積、漢明距離,本文采用歐氏距離作為度量標(biāo)準(zhǔn):
歐式距離為常用的兩點(diǎn)間或多點(diǎn)間的距離度量方法,又稱(chēng)為歐幾里得度量。公式(1)中的數(shù)值越小說(shuō)明兩個(gè)數(shù)據(jù)之間的相似度越大。
如下圖所示是一個(gè)在2維空間中采用SR樹(shù)劃分?jǐn)?shù)值點(diǎn)的實(shí)例:
二、支持向量機(jī)算法
支持向量機(jī)算法(Support Vector Machine,SVM)由Vapnik等人在統(tǒng)計(jì)學(xué)習(xí)方法中的VC維和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的基礎(chǔ)上于1995年完整地提出,是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的新型算法。由于支持向量機(jī)有著優(yōu)異的分類(lèi)能力,該算法已在眾多研究領(lǐng)域得到廣泛的研究與應(yīng)用,近年來(lái)走向了非線性復(fù)雜科學(xué)和人工智能科學(xué)研究的前沿。
設(shè)計(jì)SVM的一個(gè)關(guān)鍵問(wèn)題是核函數(shù)和核參數(shù)的選擇,選取核函數(shù)的不同對(duì)SVM性能的影響并不大,但是核函數(shù)的參數(shù)σ2及誤差懲罰因子C對(duì)SVM性能有著顯著影響,本文采用的核函數(shù)是目前婕用最為廣泛的徑向基函數(shù):
Xi、Xj是特征向量σ2是徑向基核函數(shù)的參數(shù),σ2主要影響著樣本集在高維特征空間中分布的復(fù)雜度,而誤差懲罰因子c能夠在確定的特征空間中調(diào)整學(xué)習(xí)機(jī)的置信度及經(jīng)驗(yàn)風(fēng)險(xiǎn)的比例。
最后將診斷指數(shù)作為輸出量,睡眠質(zhì)量、入睡時(shí)間、睡眠時(shí)間、睡眠效率、睡眠障礙、催眠藥物、日間功能障礙、年齡作為輸入量,得到KNN-SVM模型,將測(cè)試號(hào)的數(shù)據(jù)代入模型得到診斷結(jié)果,綜合模型的預(yù)測(cè)得到最終診斷結(jié)果。結(jié)果表明睡眠質(zhì)量低的話,會(huì)產(chǎn)生一系列的不良后果,甚至導(dǎo)致抑郁焦慮等嚴(yán)重后果。