李芳 盧鑫垚 陳龍 陳瑋
摘要:針對(duì)誤差理論與數(shù)據(jù)處理教學(xué)過(guò)程中存在的數(shù)據(jù)計(jì)算量大,學(xué)生理解困難等問(wèn)題,提出應(yīng)用Matlab和Excel軟件相結(jié)合,實(shí)現(xiàn)人機(jī)交互,測(cè)量數(shù)據(jù)的自動(dòng)讀取及分析功能。應(yīng)用到教學(xué)中,可以幫助學(xué)生理解數(shù)據(jù)處理的理論知識(shí),直觀觀測(cè)到數(shù)據(jù)的變化趨勢(shì)及實(shí)現(xiàn)數(shù)據(jù)的分析預(yù)測(cè),有效提高教學(xué)質(zhì)量。
關(guān)鍵詞:數(shù)據(jù)處理;等精度數(shù)據(jù)處理;回歸分析及預(yù)測(cè)
中圖分類號(hào): G424? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)07-0066-02
誤差理論與數(shù)據(jù)處理課程是測(cè)控技術(shù)與儀器專業(yè)的一門重要的專業(yè)基礎(chǔ)課,屬于交叉學(xué)科。該課程以概率論、數(shù)理統(tǒng)計(jì)、矩陣論、隨機(jī)過(guò)程等為基礎(chǔ),內(nèi)容主要包括含誤差的測(cè)量數(shù)據(jù)處理方法、誤差的合成與分配、曲線擬合等多方面的知識(shí),要求學(xué)生能解釋相關(guān)的專業(yè)術(shù)語(yǔ)、能實(shí)現(xiàn)對(duì)測(cè)量誤差的來(lái)源和測(cè)量誤差分布類型的判斷、能實(shí)現(xiàn)對(duì)隨機(jī)誤差、粗大誤差、系統(tǒng)誤差的處理并能實(shí)現(xiàn)各種誤差的合成和分配及測(cè)量數(shù)據(jù)的一元線性回歸分析。本課程中涉及了大量的數(shù)學(xué)計(jì)算,這就對(duì)學(xué)生的數(shù)學(xué)知識(shí)的掌握程度提出了更高的要求。教學(xué)中教師往往花費(fèi)大量的時(shí)間來(lái)講解數(shù)學(xué)過(guò)程,而學(xué)生對(duì)枯燥的數(shù)學(xué)公式推導(dǎo)望而卻步,學(xué)習(xí)興趣往往不高,考試前突擊地機(jī)械性記憶公式,而不能理解其實(shí)際的物理意義,無(wú)法與工程應(yīng)用相結(jié)合,理論難以在實(shí)際測(cè)量中得到很好的應(yīng)用[1-3]。
本課題根據(jù)誤差理論課程知識(shí)模塊的特點(diǎn),將Matlab軟件與Excel軟件相結(jié)合,通過(guò)人機(jī)界面調(diào)用測(cè)量數(shù)據(jù),Matlab軟件實(shí)現(xiàn)誤差信號(hào)的各種分析處理,簡(jiǎn)化大量的數(shù)學(xué)計(jì)算,加強(qiáng)學(xué)生對(duì)數(shù)據(jù)處理方法的理解,能直觀地看到檢測(cè)點(diǎn)的曲線圖和數(shù)據(jù)處理結(jié)果[4]。同時(shí)通過(guò)測(cè)量數(shù)據(jù)進(jìn)行誤差來(lái)源的分析,鞏固學(xué)生對(duì)于誤差合成和分配的概念。在曲線擬合中,通過(guò)測(cè)量數(shù)據(jù)的讀取,選擇不同的曲線擬合形式,得到不同的結(jié)果,也可實(shí)現(xiàn)對(duì)測(cè)量結(jié)果的預(yù)測(cè)。實(shí)現(xiàn)課程以學(xué)生為中心、教師為指導(dǎo),注重教學(xué)內(nèi)容與算法實(shí)現(xiàn)的融合,突出學(xué)生的主動(dòng)參與、思考和實(shí)踐。通過(guò)理論知識(shí)傳授、工程軟件仿真及教學(xué)演示測(cè)試等環(huán)節(jié),形成的探究式教學(xué)方式,有助于學(xué)生更直觀與深入地掌握誤差分析理論和數(shù)據(jù)處理方法。
1 系統(tǒng)結(jié)構(gòu)
根據(jù)課程內(nèi)容要求,設(shè)計(jì)軟件主要包括等精度數(shù)據(jù)處理和回歸分析兩部分:
打開(kāi)Matlab主界面,輸入guide,完成主界面的設(shè)計(jì)。然后完成數(shù)據(jù)讀取、存貯功能的實(shí)現(xiàn):
測(cè)量數(shù)據(jù)保存方式可以是.xls或.txt等格式,在程序運(yùn)行中,首先需要運(yùn)行主界面,打開(kāi)數(shù)據(jù)文件,讀取數(shù)據(jù)。
數(shù)據(jù)讀取可通過(guò)兩種方式實(shí)現(xiàn):
方式一:直接讀取數(shù)據(jù)文件
點(diǎn)擊導(dǎo)入數(shù)據(jù)文件按鈕,選擇callback選項(xiàng),填入以下程序段。
[FileName PathName]=uigetfile({'*.xls','ExcelFiles(*.xls)';'*.txt','Txt Files(*.txt)';'*.*','All Files(*.*)'},'Choose a File');
str=[PathName FileName];
num=xlsread(str,'A1:B3');
set(handles.uitable1,'data',num);即可將數(shù)據(jù)在界面上顯示出來(lái)
方式二:在界面上添加控件,可以從界面上直接輸入測(cè)量數(shù)據(jù)。
數(shù)據(jù)存貯程序如下:xlswrite('test.xlsx',num);
數(shù)據(jù)處理結(jié)果將保存到Matlab工作文件夾下。
2 等精度數(shù)據(jù)處理功能實(shí)現(xiàn)
誤差的變化規(guī)律各不相同,由此可以分為隨機(jī)誤差、系統(tǒng)誤差和粗大誤差三類。由于系統(tǒng)誤差的減小和消除通常不通過(guò)數(shù)據(jù)處理實(shí)現(xiàn),所以本文中的數(shù)據(jù)處理主要針對(duì)隨機(jī)誤差和粗大誤差進(jìn)行。其數(shù)據(jù)處理流程圖1所示。
1)最佳測(cè)量值的表示:
以等權(quán)測(cè)量條件下,對(duì)同一量進(jìn)行多次重復(fù)測(cè)量,得到一系列不同的測(cè)量值。根據(jù)隨機(jī)誤差的處理方法,最可信賴值可用以下公式表示:
由于隨機(jī)誤差的本質(zhì)特征是抵償性,所以將算術(shù)平均值作為測(cè)量結(jié)果的最佳估計(jì)。通過(guò)此種方法計(jì)算的值,可以有效減小隨機(jī)誤差的影響。
2)粗大誤差判斷:
在對(duì)一列重復(fù)測(cè)量數(shù)據(jù)進(jìn)行處理的過(guò)程中,可能會(huì)出現(xiàn)有某個(gè)數(shù)據(jù)與其他數(shù)據(jù)相比差異較大,此時(shí)其值就可能含有粗大誤差的影響。根據(jù)隨機(jī)誤差理論,出現(xiàn)大誤差的概率雖然小,但也是可能的,不恰當(dāng)?shù)靥蕹笳`差的正常數(shù)據(jù),會(huì)造成測(cè)量重復(fù)性偏好的假象。反之對(duì)確定混有粗大誤差的數(shù)據(jù)未加剔除,必然會(huì)造成測(cè)量重復(fù)性偏低的后果。
粗大誤差的判斷準(zhǔn)則應(yīng)用最廣泛的是拉伊達(dá)準(zhǔn)則,是以測(cè)量次數(shù)充分大為前期的。格拉布斯準(zhǔn)則和狄克遜準(zhǔn)則也被經(jīng)常使用,本教學(xué)軟件中將根據(jù)不同的測(cè)量條件實(shí)現(xiàn)這三種準(zhǔn)則的合理選擇及運(yùn)用。
本軟件在選擇粗大誤差判斷準(zhǔn)則時(shí),當(dāng)測(cè)量次數(shù)n>50時(shí),可以采用拉伊達(dá)準(zhǔn)則,50>n>30采用格拉布斯準(zhǔn)則。30>n>3時(shí),格拉布斯準(zhǔn)則和狄克遜準(zhǔn)則要同時(shí)應(yīng)用。若其結(jié)果出現(xiàn)差異,則可以認(rèn)為該數(shù)據(jù)沒(méi)有粗大誤差,此數(shù)據(jù)不應(yīng)該被剔除。在本設(shè)計(jì)中,根據(jù)測(cè)量次數(shù)的多少,并根據(jù)具體的使用條件自動(dòng)合理選擇應(yīng)用的準(zhǔn)則,并在界面中加以顯示。
在實(shí)際測(cè)量中,如果無(wú)法判斷數(shù)據(jù)分布是否服從正態(tài)分布或測(cè)量數(shù)據(jù)偏離正態(tài)分布嚴(yán)重的情形下,可以采用測(cè)量數(shù)據(jù)的穩(wěn)健處理方法,其流程如圖2所示。
3)隨機(jī)誤差的處理:
在置信概率p一定的情況下,置信區(qū)間的大小與誤差屬于哪種分布形式是密切相關(guān)的,本軟件中按照正態(tài)分布來(lái)表示置信區(qū)間,也就是極限誤差。數(shù)據(jù)處理結(jié)果如圖3所示。在不同概率情況下,可以得到不同大小的極限誤差。
在界面中,左側(cè)實(shí)現(xiàn)數(shù)據(jù)輸入功能,中間列是數(shù)據(jù)處理流程,右側(cè)將數(shù)據(jù)以圖像形式顯示出來(lái),圖中的上下限是應(yīng)用拉伊達(dá)準(zhǔn)則計(jì)算出來(lái)的極限誤差值的圖線。
數(shù)據(jù)處理的結(jié)果在頁(yè)面最下行顯示出來(lái),如圖3所示。
3 曲線擬合功能實(shí)現(xiàn)
回歸分析是處理變量之間相關(guān)關(guān)系的一種數(shù)理統(tǒng)計(jì)方法,也是廣泛用于獲得數(shù)學(xué)表達(dá)式的較好方法。
本軟件中主要對(duì)一元線性回歸進(jìn)行分析處理。
假設(shè)有自變量x1,x2,…,xn,此時(shí)獲得的輸出量為y1,y2,…,yn,則通過(guò)對(duì)測(cè)量值y1,y2[,…,]yn之間的差異進(jìn)行分析可知,差異來(lái)源于兩個(gè)方面:
首先自變量x取值的不同造成輸出值y也不同;其次是由于測(cè)量誤差的存在等其他因素的影響導(dǎo)致輸出值產(chǎn)生差異。所以如果將上述兩個(gè)因素造成的結(jié)果分離出來(lái),就可以實(shí)現(xiàn)對(duì)對(duì)線性回歸的效果進(jìn)行檢驗(yàn)。
將變量y的n的測(cè)值與其平均值的偏差分解為由變量x變量的不同取值引起的回歸偏差和由測(cè)量誤差等其他因素造成的殘余誤差,并進(jìn)一步用n個(gè)值的偏離平方和來(lái)描述。也就是總偏差平方和反映因變量的n個(gè)觀測(cè)值與其均值的總偏差;回歸平方和在總的偏差中因x和y的線性關(guān)系而引起y變化的大小;殘余平方和在總的偏離中除了x對(duì)y線性影響之外的其他因素而引起y變化的大小?;貧w分析的要求就是使殘余平方和最小,其值越小,說(shuō)明回歸效果越好。
從實(shí)際測(cè)量中可以發(fā)現(xiàn),任意一組測(cè)量數(shù)據(jù)(xi,yi)都可以采用此方法擬合出回歸方程,但是如果實(shí)際的測(cè)量點(diǎn)數(shù)據(jù)實(shí)際是分散的,不呈線性,那討論回歸就沒(méi)有意義了。所以要對(duì)數(shù)據(jù)是否真的能夠顯著呈現(xiàn)線性進(jìn)行檢驗(yàn)。一元線性回歸自變量x和輸出量y之間的線性關(guān)系的檢驗(yàn)實(shí)現(xiàn)就是將回歸平方和(代表線性回歸程度)和殘余平方和(代表測(cè)量誤差等因素的影響)的值作比值。本軟件中應(yīng)用F檢驗(yàn)(也可以使用其他檢驗(yàn)方法),在一定置信概率p下,如果回歸平方和遠(yuǎn)大于殘余平方和,說(shuō)明回歸效果非常顯著,x和y的線性關(guān)系明顯,反之則不顯著,就無(wú)法說(shuō)明二者呈現(xiàn)線性關(guān)系。
在軟件界面中(如圖4所示),左側(cè)實(shí)現(xiàn)的是數(shù)據(jù)輸入功能。右上側(cè)是根據(jù)輸入數(shù)據(jù)所進(jìn)行的方差分析表格,假設(shè)服從F分布(也可以選擇其他類型),可以通過(guò)查表求出不同[α(顯著度)]情況下的臨界值,由此判斷是否高度顯著,得出有效結(jié)論。
右下角是利用分析結(jié)果做出的回歸直線及預(yù)測(cè)區(qū)間,選擇不同概率情況下,可以得出不同的數(shù)據(jù)預(yù)測(cè)區(qū)間。
4 結(jié)論
適用于誤差理論與數(shù)據(jù)處理課程項(xiàng)目式教學(xué)的軟件還有很多,本課題選擇Matlab和Excel實(shí)現(xiàn)了人機(jī)的交互,數(shù)據(jù)的自動(dòng)輸入和手動(dòng)輸入、等精度數(shù)據(jù)處理及回歸分析等功能,簡(jiǎn)化了數(shù)據(jù)處理的計(jì)算過(guò)程,學(xué)生可以使用該軟件進(jìn)行數(shù)據(jù)處理,使學(xué)生直觀形象地理解誤差理論的知識(shí)。在后續(xù)的功能擴(kuò)展中,將繼續(xù)將其與虛擬仿真軟件相結(jié)合,實(shí)現(xiàn)測(cè)量過(guò)程的仿真與數(shù)據(jù)實(shí)時(shí)讀取,加速推進(jìn)誤差理論與數(shù)據(jù)處理課程的教學(xué)改革之路。
參考文獻(xiàn):
[1] 李成,錢政,樊尚春,等.《誤差分析與數(shù)據(jù)處理》的探究式教學(xué)[J].實(shí)驗(yàn)科學(xué)與技術(shù),2013,11(1) 83-85,148.
[2] 費(fèi)業(yè)泰,蔣敏蘭,劉芳芳.動(dòng)態(tài)測(cè)量精度理論研究進(jìn)展與未來(lái)[J].中國(guó)機(jī)械工程,2007(18):2260-2262.
[3] 汪鳳林,汪秀麗,溫秀蘭.誤差理論與數(shù)據(jù)處理課程改革探索[J].中國(guó)現(xiàn)代教育裝備,2008(11):60-62.
[4] 費(fèi)業(yè)泰.誤差理論與數(shù)據(jù)處理[M].北京:機(jī)械工業(yè)出版社, 1986.
【通聯(lián)編輯:唐一東】