■李志勤
近幾年高考對(duì)相關(guān)關(guān)系以及線性回歸方程的考查力度逐步增加,主要考查同學(xué)們的數(shù)據(jù)處理能力、運(yùn)算能力、閱讀能力,以及利用統(tǒng)計(jì)思想解決問(wèn)題的能力。利用具有相關(guān)關(guān)系的兩個(gè)變量,得到的線性回歸方程可以用來(lái)預(yù)測(cè)與估計(jì),為決策提供依據(jù)。下面通過(guò)具體例題剖析線性回歸方程的常見(jiàn)題型。
例1某數(shù)學(xué)小組從醫(yī)院和氣象局獲得2018年1月至6月每月20日的晝夜溫差x(單位:℃,x≥3)和患感冒人數(shù)y(單位:人)的數(shù)據(jù),畫出如圖1所示的折線圖。
圖1
(1)建立y關(guān)于x的回歸方程(精確到0.01),預(yù)測(cè)2019年1月至6月晝夜溫差為4℃時(shí)患感冒的人數(shù)(精確到整數(shù))。
(2)求y與x的相關(guān)系數(shù),并說(shuō)明y與x的相關(guān)性的強(qiáng)弱(若r>0.75,則認(rèn)為y與x具有較強(qiáng)的相關(guān)性)。
分析:(1)由已知求得b與a的值,即得線性回歸方程,取x=4求得y的值,可預(yù)測(cè)2019年1月至6月晝夜溫差為4℃時(shí)患感冒的人數(shù);(2)求出的值,結(jié)合b的值進(jìn)一步求得r的值,可得y與x的相關(guān)性。
解:(1)由已知條件可得b=17,a=17-2.61×9.15≈-6.88,所以y關(guān)于x的線性回歸方程為^y=2.61x-6.88。當(dāng)x=4時(shí),^y=2.61×4-6.88≈4。
故預(yù)測(cè)2019年1月至6月晝夜溫差為4℃時(shí)患感冒的人數(shù)為4。
當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān);r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng),r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系。通常當(dāng)|r|>0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性。
例2已知某校5個(gè)學(xué)生期末考試數(shù)學(xué)成績(jī)和總分年級(jí)排名如表1所示。
表1
(1)通過(guò)大量事實(shí)證明發(fā)現(xiàn),一個(gè)學(xué)生的數(shù)學(xué)成績(jī)和總分年級(jí)排名具有很強(qiáng)的線性相關(guān)關(guān)系,在表1是正確的前提下,用x表示數(shù)學(xué)成績(jī),用y表示年級(jí)排名,求y與x的回歸方程。(其中b,a都取整數(shù))
(2)在本次考試中,預(yù)計(jì)數(shù)學(xué)分?jǐn)?shù)為120分的學(xué)生的年級(jí)排名大概是多少。
分析:(1)求出x,y的平均數(shù),再求出相關(guān)系數(shù),即可求出回歸方程;(2)由x的值,可求出y的預(yù)報(bào)值。
解:(1)由表1可得(115+112+93+125+145)=118,(250+300+450+70+10)=216。
利用參考公式可得b=-9,a=1278,故y與x的回歸方程為^y=-9x+1278。
(2)當(dāng)x=120時(shí),^y=198,故預(yù)計(jì)數(shù)學(xué)分?jǐn)?shù)為120分的學(xué)生的年級(jí)排名大概是198。
本題考查求回歸方程問(wèn)題,考查函數(shù)的求值問(wèn)題,屬于一道常規(guī)題。利用回歸直線可以由一個(gè)變量的變化推測(cè)另一個(gè)變量的變化,為決策提供依據(jù),可見(jiàn)利用回歸直線可以對(duì)實(shí)際問(wèn)題進(jìn)行分析與預(yù)測(cè)。
例3在“新零售”模式的背景下,自由職業(yè)越來(lái)越流行,諸如:淘寶網(wǎng)店主、微商等?,F(xiàn)調(diào)研某自由職業(yè)者的工資收入情況,記x表示該自由職業(yè)者平均每天工作的時(shí)間(單位:h),y表示平均每天工作xh的月收入(單位:千元)。x,y的對(duì)應(yīng)值如表2所示。
表2
假設(shè)y與x具有線性相關(guān)關(guān)系,則y關(guān)于x的線性回歸方程^y=bx+a必經(jīng)過(guò)點(diǎn)( )。
A.(3,3) B.(3,4)
C.(4,4) D.(4,5)
分析:根據(jù)所給的數(shù)據(jù),求出x和y的平均數(shù),得到數(shù)據(jù)的樣本中心點(diǎn),根據(jù)線性回歸方程一定過(guò)樣本中心點(diǎn),即得線性回歸直線一定經(jīng)過(guò)的點(diǎn)的坐標(biāo)。
解:由可得這組數(shù)據(jù)的樣本中心點(diǎn)是(4,4)。
因?yàn)榫€性回歸方程過(guò)樣本中心點(diǎn),所以線性回歸方程一定過(guò)點(diǎn)(4,4)。應(yīng)選C。
本題考查線性回歸方程的性質(zhì),即線性回歸方程一定過(guò)樣本中心點(diǎn)。解答本題的關(guān)鍵是正確求出樣本中心點(diǎn),題中的運(yùn)算量比較小,屬于統(tǒng)計(jì)問(wèn)題的基礎(chǔ)題。
例4某工廠為了對(duì)研發(fā)的一種產(chǎn)品進(jìn)行合理定價(jià),將該產(chǎn)品按事先擬定的價(jià)格進(jìn)行試銷,得到如表3所示的數(shù)據(jù)。
表3
(1)若銷量y與單價(jià)x服從線性相關(guān)關(guān)系,求該回歸直線方程。
(2)在(1)的前提下,已知該產(chǎn)品的成本是5元/件,問(wèn)該產(chǎn)品如何確定單價(jià),可使工廠獲得最大利潤(rùn)。
參考公式:對(duì)于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸直線方程=bx+a的斜率的最小二乘估計(jì)值為b=
分析:(1)由題意求出b與a的值,可得線性回歸方程;(2)設(shè)該產(chǎn)品的售價(jià)為x元,工廠利潤(rùn)為L(zhǎng)元,由題意可得L=(x-5)·(-20x+280)=20(x-5)(14-x),然后利用二次函數(shù)求最值。
解:(1)由題意可得則a==90+20×9.5=280。故回歸直線方程為^y=-20x+280。
(2)設(shè)該產(chǎn)品的售價(jià)為x元,工廠利潤(rùn)為L(zhǎng)元。因?yàn)楫?dāng)x≤5時(shí),利潤(rùn)L≤0,定價(jià)不合理,所以x>5。由^y=-20x+280>0,可得x<14,故5<x<14。
由題意可得L=(x-5)(-20x+280)=20(x-5)(14-x),根據(jù)二次函數(shù)的圖像與性質(zhì)可知,當(dāng)x=9.5時(shí),L取得最大值。因此為使工廠獲得最大利潤(rùn),該產(chǎn)品的單價(jià)應(yīng)定為9.5元。
線性回歸方程的交匯命題主要有兩類:一是與概率、統(tǒng)計(jì)的交匯,二是與函數(shù)的交匯。解答這類問(wèn)題要綜合利用線性回歸方程的性質(zhì)求解。
例5某地隨著經(jīng)濟(jì)的發(fā)展,居民收入逐年增長(zhǎng),表4所示的是該地一建設(shè)銀行連續(xù)5年的儲(chǔ)蓄存款(年底余額)。
表4
為了研究和計(jì)算的方便,工作人員將表中的數(shù)據(jù)進(jìn)行了處理,t=x-2012,z=y-5,由此得到了表5。
表5
(1)求z關(guān)于t的線性回歸方程。
(2)通過(guò)(1)中的方程,求出y關(guān)于x的回歸方程。
(3)用所求回歸方程預(yù)測(cè)到2022年年底,該地儲(chǔ)蓄存款額可達(dá)多少?
分析:(1)由表中的數(shù)據(jù)求得,再得到b與a,即得線性回歸方程;(2)將t=x-2012,z=y-5代入=1.2t-1.4,可得y關(guān)于x的回歸方程;(3)利用(2)中的回歸方程,令x=2022,即可求得y的值。
解:(1)由可得1.4。
本題主要考查線性回歸方程的求法,考查計(jì)算能力,考查數(shù)學(xué)思想在統(tǒng)計(jì)中的應(yīng)用。