李 健,周 捷,毛 倩,馬秋瑞
(西安工程大學(xué) 服裝與藝術(shù)設(shè)計(jì)學(xué)院,陜西 西安 710048)
足部是人體的重要部位,承擔(dān)著行走、負(fù)重等各項(xiàng)功能。作為起支撐和保護(hù)作用的鞋類產(chǎn)品,其合腳性直接影響到足部的健康狀況[1-2]。為了追求更健康的體型及生活方式,慢跑運(yùn)動(dòng)越來越受到青年人的青睞,為他們量腳制鞋成為鞋類企業(yè)和科研機(jī)構(gòu)需要解決的問題。然而,在人體足部測量實(shí)驗(yàn)中,由于骨骼特征點(diǎn)難以確定,以致跖圍、兜跟圍等圍度尺寸的非接觸式測量結(jié)果精確度不高[3-4]。
針對上述問題,學(xué)者們通過小規(guī)模的基本部位測量,建立人體體型數(shù)學(xué)模型,由已知部位尺寸推斷未知部位,在誤差允許范圍內(nèi)簡化了量體工作。迄今,較流行的人體建模預(yù)測方法有回歸分析[5-6]、灰色系統(tǒng)理論[7-8]、神經(jīng)網(wǎng)絡(luò)[9-10]以及將灰色模型與神經(jīng)網(wǎng)絡(luò)耦合的灰色神經(jīng)網(wǎng)絡(luò)方法[11]等。盡管這些研究在一定程度上簡化了量體工作,但預(yù)測精度相差較大[12-13]。以往研究方法較為離散,缺乏對各種方法的差異及其適用條件的系統(tǒng)比較,以致結(jié)果的說服力不強(qiáng)。
基于此,本文以跖圍為例,以122名女性和84名男性非競技運(yùn)動(dòng)員樣本為研究對象,運(yùn)用灰色關(guān)聯(lián)分析理論確定跖圍的基本部位,分別建立BP神經(jīng)網(wǎng)絡(luò)、GM(1,N)[14]和多元線性回歸模型。同時(shí),以平均絕對誤差、均方根誤差和平均相對誤差為評價(jià)指標(biāo),分析模型參數(shù)的設(shè)置及模型預(yù)測性能,為制鞋企業(yè)進(jìn)行足部測量提供簡便方法。
從體育大學(xué)及公共活動(dòng)中招募230名受試者作為實(shí)驗(yàn)對象,完成足部數(shù)據(jù)采集(喬丹體育股份有限公司)。在招募受試者時(shí),考慮年齡、性別、籍貫和運(yùn)動(dòng)愛好等指標(biāo)。受試者來自中國大陸且均為漢族,按樣本量(n)大小降序排列為福建(n=101)、江西(n=7)、河南(n=7)、湖北(n=6)以及其他省市;受試者參加定期訓(xùn)練(主要運(yùn)動(dòng)以跑步為基礎(chǔ),如籃球、游泳、羽毛球等),并為休閑跑步者(每周至少進(jìn)行2次30~60 min中等強(qiáng)度或高強(qiáng)度訓(xùn)練)。
在 230 名受試者中, 共有24名受試者由于數(shù)據(jù)缺失或明顯的足部畸形而被取消資格。最終納入 122 名女性,年齡 (25.6±7.8)歲,身高(162.9±5.5)cm, 體重(53.1±8.9)kg;84 名男性,年齡 (27.3±10.1)歲, 身高(174±5.9)cm, 體重(70.1±10.3)kg。所有程序經(jīng)喬丹體育公司批準(zhǔn), 并獲得受試者的書面知情同意, 受試者基本統(tǒng)計(jì)信息見表1。
表1 受試者基本統(tǒng)計(jì)信息
注:BMI(Body Mass Index)是國際上衡量人體肥胖程度的標(biāo)準(zhǔn)。BMI(kg·m-2)=體重/身高2。
采用LSF腳型三維掃描儀(深圳市精易迅科技有限公司)。該掃描儀采用非接觸式激光掃描方式構(gòu)建三維足部模型。足部掃描儀精度≤1.0 mm,掃描一只腳約10 s。
分別從長度、寬度、高度和圍度等4個(gè)方面提取17項(xiàng)腳型指標(biāo),測量項(xiàng)目超過了以往的研究[4-5,14]。足部測量參數(shù)包括長度指標(biāo)(足長、第一跖趾關(guān)節(jié)長、第五跖趾關(guān)節(jié)長、第五足趾端點(diǎn)長、踵心位置長)、寬度指標(biāo)(足寬、第一跖趾里段輪廓寬、踵心寬度、跖趾關(guān)節(jié)斜寬)、圍度指標(biāo)(跖圍、前跗骨圍、兜根圍)和高度指標(biāo)(拇指高、第一趾關(guān)節(jié)高、前跗骨高、外踝下緣高、足弓高)。其中,跖圍位于腳最寬處,是足部的重要活動(dòng)區(qū)域,也是衡量腳肥瘦的依據(jù),跖圍測量示意圖如圖1所示。其他16個(gè)測量項(xiàng)目的測量方法見文獻(xiàn)[4-5,14]。
圖1 跖圍測量示意圖
分析BP神經(jīng)網(wǎng)絡(luò)、灰色GM(1,N)模型和多元線性回歸模型的結(jié)構(gòu)和實(shí)現(xiàn),并以平均絕對誤差、平均相對誤差和均方根誤差作為建模精度的評價(jià)指標(biāo)。足部跖圍尺寸最優(yōu)預(yù)測方法流程如圖2所示。
圖2 足部跖圍最優(yōu)預(yù)測方法流程圖
為了定量比較不同模型對跖圍的預(yù)測效果,定義3個(gè)評價(jià)指標(biāo)[15]:
(1)
(2)
(3)
采用灰色關(guān)聯(lián)分析[16]確定跖圍的基本部位。對17項(xiàng)足型測量指標(biāo)標(biāo)準(zhǔn)化及無綱量化處理,計(jì)算足型測量指標(biāo)相對跖圍的灰色關(guān)聯(lián)度?;疑P(guān)聯(lián)度越大,表明該指標(biāo)與跖圍的關(guān)聯(lián)性越強(qiáng),即為跖圍的基本部位。
設(shè)跖圍尺寸構(gòu)成序列為X0,各部位指標(biāo)構(gòu)成序列Xi(i=1, 2,…,17),則其它部位與跖圍的關(guān)聯(lián)系數(shù)為ξi(k),關(guān)聯(lián)度為ri。ξi(k)計(jì)算公式為
(4)
經(jīng)灰色關(guān)聯(lián)分析,跖圍與足長、足寬、前跗骨圍、拇指高的灰色關(guān)聯(lián)度ξi(k)最大,分別為0.813,0.889,0.891,0.864。由此確定足長、足寬、前跗骨圍、拇指高為測量跖圍的基本部位。
以足長、足寬、前跗骨圍、拇指高為基本部位變量輸入、輸出跖圍指標(biāo),依次建立BP神經(jīng)網(wǎng)絡(luò)、GM(1,4)模型和多元線性回歸模型。輸入206個(gè)訓(xùn)練樣本,其中隨機(jī)選擇80%為訓(xùn)練集,20%為測試集。按照樣本比例,測試集分別在男子組中隨機(jī)抽取15個(gè)樣本,女子組中抽取25個(gè)樣本為檢驗(yàn)數(shù)據(jù)。
2.2.1 BP神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò)包含輸入層、隱含層和輸出層。隱含層神經(jīng)元個(gè)數(shù)n2與輸入層神經(jīng)元個(gè)數(shù)n1近似滿足n2=2n1+1[9]。跖圍樣本有4個(gè)輸入?yún)?shù)(足長、足寬、前跗骨圍和拇指高),1個(gè)輸出參數(shù)(跖圍),故設(shè)置4-9-1結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò),即輸入層節(jié)點(diǎn)數(shù)為4,隱含層節(jié)點(diǎn)數(shù)為9,輸出層節(jié)點(diǎn)數(shù)為1。網(wǎng)絡(luò)訓(xùn)練的其他參數(shù)為隱含神經(jīng)元的傳遞函數(shù)(S型正切函數(shù))、輸出層神經(jīng)元的傳遞函數(shù)(S型對數(shù)函數(shù))、最小訓(xùn)練速率(0.01)、動(dòng)態(tài)參數(shù)(0.6)、允許誤差(0.01)、最大訓(xùn)練次數(shù)(1 000)、Sigmoid參數(shù)值(0.9)和數(shù)據(jù)轉(zhuǎn)換方法(數(shù)據(jù)標(biāo)準(zhǔn)化轉(zhuǎn)換)。
輸入206個(gè)訓(xùn)練樣本,其中隨機(jī)選擇80%(n=166)作為訓(xùn)練集,20%(n=40)作為測試集。采用Matlab 2017a軟件構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練曲線如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練曲線
從圖3可以看出,經(jīng)過14次訓(xùn)練后,網(wǎng)絡(luò)成功收斂,訓(xùn)練誤差為2.851 8×10-3,低于0.01的允許誤差范圍,表明該網(wǎng)絡(luò)訓(xùn)練速度快,效果好。
BP神經(jīng)網(wǎng)絡(luò)模型跖圍尺寸擬合回歸圖如圖4所示。圖4擬合方程中,x為目標(biāo)值,y為輸出值,Y=T為對角參考線。從圖4可以看出,訓(xùn)練集、驗(yàn)證集、測試集和整體的擬合值R依次為0.982 10,0.980 06,0.956 99和0.976 38,樣本分布在對角線附近,說明建立的BP神經(jīng)網(wǎng)絡(luò)模型具有較好的訓(xùn)練、驗(yàn)證、測試和整體擬合效果。擬合值R越大,表示模型擬合效果越好。
(a)訓(xùn)練集
(b)驗(yàn)證集
(c)測試集
(d)整體集
2.2.2 灰色GM(1,N)模型 GM(1,N)模型是含n個(gè)變量的一階微分方程,具有小樣本建模的優(yōu)勢,在人體體型研究中應(yīng)用廣泛[7-8,14]。GM(1,N)模型適合小樣本數(shù)據(jù),樣本量增加誤差反而變大[17]。因此,選擇適合的維數(shù)長度,減少系統(tǒng)的干擾。
鑒于小樣本特性,建立20個(gè)樣本的灰微分方程:
(5)
經(jīng)過1階累減還原為原始序列的預(yù)測值:
(6)
輸入足長、足寬、前跗骨圍、拇指高指標(biāo),輸出跖圍指標(biāo),建立GM(1,4)模型。經(jīng)計(jì)算,模型系數(shù)a為2.201,足長系數(shù)b1為0.170,足寬系數(shù)b2為2.696,前跗骨圍系數(shù)b3為0.777,拇指高系數(shù)b4為1.847。
2.2.3 多元線性回歸 多元線性回歸研究多個(gè)最優(yōu)組合的自變量與因變量的相關(guān)關(guān)系[5-6]。以跖圍為因變量,以足長、足寬、前跗骨圍、拇指高為自變量,運(yùn)用統(tǒng)計(jì)軟件Matlab 2017a建立多元線性回歸方程:
y=β0+β1x1+β2x2+…+βnxn
(7)
式中:y為跖圍;β0為常數(shù);β1,β2,β3,…,βn為回歸系數(shù);xi為基本部位。
在Matlab 2017a軟件中運(yùn)算,輸出跖圍與足長、足寬、前跗骨圍、拇指高的多元線性回歸模型:
y=0.050x1+1.125x2+0.413x3+0.389x4
調(diào)整后的R2=0.919。
為比較不同模型的預(yù)測精度,歸納3種模型預(yù)測的EMA,EMS,EMAP,不同模型擬合效果統(tǒng)計(jì)如圖5所示。
圖5 不同模型擬合效果統(tǒng)計(jì)
從圖5可以看出,3種方法的預(yù)測誤差均控制在16%以內(nèi),BP神經(jīng)網(wǎng)絡(luò)模型的EMA,EMS和EMAP分別為3.470%,4.494%和1.474%,GM(1,4)模型的EMA,EMS和EMAP分別為4.725%,15.702%和2.115%,線性回歸模型的EMA,EMS和EMAP分別為9.940%,10.813%和3.976%。結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度高、計(jì)算簡便,而GM(1,N)模型和多元線性回歸模型預(yù)測性能雖較好,但運(yùn)行過程中隨機(jī)性較大,預(yù)測結(jié)果不穩(wěn)定。相比較而言,無論是平均誤差還是標(biāo)準(zhǔn)差指標(biāo),BP神經(jīng)網(wǎng)絡(luò)模型更適合足部跖圍的數(shù)學(xué)建模。
采用BP神經(jīng)網(wǎng)絡(luò)、GM(1,N)模型和多元線性回歸模型對足部跖圍尺寸進(jìn)行建模分析。研究發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)比GM(1,N)模型和多元線性回歸模型的預(yù)測精度更高,預(yù)測結(jié)果更穩(wěn)定;GM(1,N)模型和多元線性回歸模型雖然也可以進(jìn)行跖圍尺寸預(yù)測,但這2種模型隨機(jī)性較大,預(yù)測結(jié)果不穩(wěn)定。
文獻(xiàn)[11]以新生兒死亡率預(yù)測為例,比較了回歸模型和BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果。結(jié)果發(fā)現(xiàn),當(dāng)不存在明顯非線性關(guān)系時(shí),回歸模型優(yōu)于BP神經(jīng)網(wǎng)絡(luò),與本研究結(jié)果不一致。文獻(xiàn)[12]以人體腹圍為例,比較了回歸模型與灰色系統(tǒng)、BP神經(jīng)網(wǎng)絡(luò)的耦合模型(灰色神經(jīng)網(wǎng)絡(luò))的預(yù)測效果,結(jié)果發(fā)現(xiàn)二者預(yù)測值之間無顯著差異。針對以上預(yù)測精度報(bào)道的差異性,文獻(xiàn)[13]比較了多元線性回歸與BP神經(jīng)網(wǎng)絡(luò)對BMI的預(yù)測性能,結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)的ERMS和EMAP指標(biāo)分別為0.94%,8.4%,優(yōu)于多元線性回歸(1.31%,15.3%),與本研究結(jié)果一致。
文獻(xiàn)[18]指出,BP神經(jīng)網(wǎng)絡(luò)的性能與訓(xùn)練樣本數(shù)、隱含層神經(jīng)元個(gè)數(shù)等參數(shù)設(shè)置相關(guān)。在樣本數(shù)一定的條件下,本文探討隱含層神經(jīng)元個(gè)數(shù)對訓(xùn)練效果的影響。
以206個(gè)樣本作為訓(xùn)練數(shù)據(jù),以灰色關(guān)聯(lián)分析確定的4個(gè)基本部位作為跖圍的輸入?yún)?shù)。為減少初始權(quán)值和閾值對結(jié)果的影響,以決定系數(shù)R2為誤差指標(biāo),對不同隱含神經(jīng)元個(gè)數(shù)進(jìn)行測試。在Matlab 2017a軟件中運(yùn)行10次,取其均值。隱含神經(jīng)元個(gè)數(shù)對BP神經(jīng)網(wǎng)絡(luò)性能的影響如圖6所示。
圖6 隱含神經(jīng)元個(gè)數(shù)對BP神經(jīng)網(wǎng)絡(luò)性能的影響
從圖6可以看出,當(dāng)隱含層神經(jīng)元個(gè)數(shù)為9時(shí),最大R2為0.931 71,與本文參數(shù)設(shè)定一致。
文獻(xiàn)[12,19]指出,耦合模型的精度優(yōu)于單一模型?;诖?結(jié)合線性回歸、GM(1,N)模型、BP神經(jīng)網(wǎng)絡(luò)等3種模型的模型優(yōu)勢,形成線性-GM(1,N)-BP耦合模型,改善其預(yù)測性能。
GM(1,N)模型包含系統(tǒng)特征序列和相關(guān)因子序列,與多元回歸模型同屬線性因果模型。但它們本質(zhì)不同,前者基于灰色理論,后者基于概率統(tǒng)計(jì)。對足部灰色系統(tǒng)而言,維數(shù)對模型的預(yù)測精度影響較大,若直接應(yīng)用全部樣本數(shù)據(jù)建模,由于維數(shù)過多,系統(tǒng)的干擾因素不斷變化,降低了模型的精度[17]。因此,必須選擇適合的維數(shù)長度,減少系統(tǒng)的干擾。
文獻(xiàn)[11]指出,當(dāng)樣本數(shù)n<30時(shí)為小樣本,n≥30時(shí)為大樣本。由于灰色系統(tǒng)最少需要4個(gè)建模樣本,故當(dāng)樣本數(shù)4≤n<30時(shí),優(yōu)先采用灰色系統(tǒng)方法;當(dāng)樣本數(shù)n≥30時(shí),采用回歸分析等數(shù)理統(tǒng)計(jì)方法。基于維數(shù)對模型精度的影響,隨機(jī)選取20個(gè)樣本進(jìn)行建模,與文獻(xiàn)[7]選取全部46個(gè)樣本(大樣本)建模相比,從精度上提升較小,但從理論意義上看更科學(xué)。本文設(shè)置維數(shù)n=20。
文獻(xiàn)[20]指出,足部自變量個(gè)數(shù)對跖圍精度的影響不同,故采用逐步回歸分析法建立跖圍數(shù)學(xué)模型。將足長、足寬、前跗骨圍及拇指高等足部參數(shù)逐個(gè)引入回歸模型,并進(jìn)行統(tǒng)計(jì)分析,同時(shí)剔除自變量,直到回歸方程中包含了所有的顯著的自變量。跖圍逐步回歸模型的相關(guān)參數(shù)見表2。
從表2可知,隨著前跗骨圍、足寬和拇指高參數(shù)逐個(gè)引入回歸模型,相關(guān)系數(shù)R和決定系數(shù)R2也隨之增大,說明自變量參數(shù)對跖圍的作用加深。逐步回歸的調(diào)整后的R2=0.939,略大于多元線性回歸的0.919,說明逐步回歸的擬合效果更好。
表2 跖圍逐步回歸模型顯著性檢驗(yàn)
表3列出了逐步回歸方程的相關(guān)參數(shù)。從表3可以看出,顯著性水平均小于0.05,說明模型有效。根據(jù)表3建立逐步回歸方程:
Y=0.432X1+1.160X2+0.415X3+13.872
(8)
式中:Y為跖圍;X1為前跗骨圍;X2為足寬;X3為拇指高;單位均為mm。
表3 逐步回歸相關(guān)參數(shù)
采用40個(gè)相同檢驗(yàn)樣本進(jìn)行精度評價(jià),結(jié)果顯示,多元線性回歸和逐步回歸的EMA分別為3.470%,3.195%,EMS分別為4.494%,4.332%,EMAP分別為1.474%,1.280%。從預(yù)測性能上看,逐步回歸模型略優(yōu)于多元線性回歸,提高了擬合精度,減少了工作量。
人體足部是一個(gè)灰色系統(tǒng),各變量相互獨(dú)立又彼此相關(guān)。BP神經(jīng)網(wǎng)絡(luò)模型在以足長、足寬、前跗骨圍、拇指高指標(biāo)預(yù)測跖圍尺寸時(shí),相對于另外2種方法有更好的預(yù)測效果。
(1)運(yùn)用灰色關(guān)聯(lián)分析確定足長、足寬、前跗骨圍、拇指高為人體足部跖圍的基本部位,可用于構(gòu)建足部跖圍數(shù)學(xué)模型。
(2)在人體足部數(shù)學(xué)模型中,BP神經(jīng)網(wǎng)絡(luò)模型簡單,預(yù)測結(jié)果最穩(wěn)定,適用于足部尺寸預(yù)測工作。該方法同樣適用于足部跗圍和足跟圍尺寸的預(yù)測。
(3)多元線性回歸模型的預(yù)測性能是3種模型中最差的,原因在于它對樣本量的要求較高。若能增加樣本數(shù)量,可能將提高模型精度。
(4)模型參數(shù)設(shè)置對預(yù)測性能有較大影響,應(yīng)選擇最優(yōu)模型參數(shù)建模,以提高模型預(yù)測性能。