侯有岐(正高級教師 特級教師)
(陜西省漢中市四〇五學(xué)校)
成對數(shù)據(jù)的統(tǒng)計分析是高考概率與統(tǒng)計考查的重點內(nèi)容之一.這部分知識要求學(xué)生從過去的單變量觀察階段轉(zhuǎn)變到多變量的數(shù)據(jù)理性分析推斷階段,往往聚焦數(shù)學(xué)核心素養(yǎng),以解決生產(chǎn)生活中的實際問題為背景,考查學(xué)生的必備品格與關(guān)鍵能力,深受命題者的青睞.本文對成對數(shù)據(jù)的統(tǒng)計分析考查的常見題型及解題策略進(jìn)行總結(jié).
例1(1)(多選題)下列各圖中,兩個變量x,y具有相關(guān)關(guān)系的是( ).
(2)已知變量x和y滿足關(guān)系式y(tǒng)=-0.2x+3,變量y與z正相關(guān),則下列結(jié)論中正確的是( ).
A.x與y正相 關(guān),x與z負(fù)相關(guān)
B.x與y正相關(guān),x與z正相關(guān)
C.x與y負(fù)相關(guān),x與z負(fù)相關(guān)
D.x與y負(fù)相關(guān),x與z正相關(guān)
(3)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數(shù)R2如下,其中擬合效果最好的模型是( ).
A.模型1的決定系數(shù)R2為0.98
B.模型2的決定系數(shù)R2為0.80
C.模型3的決定系數(shù)R2為0.50
D.模型4的決定系數(shù)R2為0.25
(2)因為y=-0.2x+3的斜率小于0,故x與y負(fù)相關(guān).因為y與z正相關(guān),可設(shè)z=by+a,b>0,則z=by+a=-0.2bx+3b+a,所以x與z負(fù)相關(guān),故選C.
(3)在兩個變量y與x的回歸模型中,它們的決定系數(shù)R2越接近1,模型擬合效果越好,在四個選項中A 的決定系數(shù)最大,所以擬合效果最好的是模型1.故選A.
1)散點圖法:如果所有的樣本點都落在某一函數(shù)的圖像附近,那么變量之間有相關(guān)關(guān)系;如果所有的樣本點都落在某一直線附近,那么變量之間有線性相關(guān)關(guān)系.
2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,|r|越趨近于1,相關(guān)性越強(qiáng).
3)決定系數(shù)法:利用決定系數(shù)判定,R2越接近1,模型的擬合效果越好,相關(guān)性越強(qiáng).
例2某種機(jī)械設(shè)備隨著使用年限的增加,它的使用功能逐漸減退,使用價值逐年減少,通常把它使用價值逐年減少的“量”換算成費(fèi)用,稱之為“失效費(fèi)”.該種機(jī)械設(shè)備的使用年限x(單位:年)與失效費(fèi)y(單位:萬元)的統(tǒng)計數(shù)據(jù)如表1所示.
表1
由表1數(shù)據(jù)可知,可用線性回歸模型擬合y與x的關(guān)系,請用相關(guān)系數(shù)加以說明(精確到0.01).
參考公式:相關(guān)系數(shù)
因為y與x的相關(guān)系數(shù)近似為0.99,所以y與x的線性相關(guān)程度相當(dāng)大,因此可用線性回歸模型擬合y與x的關(guān)系.
2)確定R2:
例3某高中生參加社會實踐活動,對某公司1月份至6月份某種配件的銷售量及銷售單價進(jìn)行了調(diào)查,銷售單價x(單位:元)和銷售量y(單位:千件)之間的一組數(shù)據(jù)如表2所示.
表2
(1)根據(jù)1月份至5月份的數(shù)據(jù),求y關(guān)于x的回歸直線方程;
(2)若由回歸直線方程得到的預(yù)報值與實際數(shù)據(jù)的誤差不超過0.5,則認(rèn)為此回歸直線方程是理想的,試問(1)中的回歸直線方程是否理想?
(2)由(1)知,當(dāng)x=8 時,14.4,此時有14.4-14.2=0.2<0.5,故可認(rèn)為(1)中所得到的回歸直線方程是理想的.
例4某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費(fèi)xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖(如圖1)及一些統(tǒng)計量的值.
圖1
參考數(shù)據(jù):
(2)根據(jù)(1)的判斷結(jié)果及參考數(shù)據(jù),建立y關(guān)于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系式為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題:
(ⅰ)年宣傳費(fèi)x=49時,年銷售量及年利潤的預(yù)測值是多少?
(ⅱ)年宣傳費(fèi)x為何值時,年利潤的預(yù)測值最大?
附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其經(jīng)驗回歸直線的斜率和截距的最小二乘估計分別為
(1)由散點圖可以判斷,適宜作為年銷售量y關(guān)于年宣傳費(fèi)x的回歸方程類型.
所以y關(guān)于w的經(jīng)驗回歸方程為因此y關(guān)于x的回歸方程為
(3)(ⅰ)由(2)知,當(dāng)x=49時,年銷售量y的預(yù)測值,年利潤z的預(yù)測值
2)利用經(jīng)驗回歸方程進(jìn)行預(yù)測,把經(jīng)驗回歸方程看作一次函數(shù),求函數(shù)值.
3)經(jīng)驗回歸方程的擬合效果可以利用相關(guān)系數(shù)判斷,當(dāng)|r|越趨近于1時,兩變量的線性相關(guān)性越強(qiáng).
例5(2022年全國甲卷文17)甲、乙兩城之間的長途客車均由A和B兩家公司運(yùn)營.為了解這兩家公司長途客車的運(yùn)行情況,隨機(jī)調(diào)查了甲、乙兩城之間的500個班次,得到列聯(lián)表如表3所示.
表3
(1)根據(jù)表3,分別估計這兩家公司甲、乙兩城之間的長途客車準(zhǔn)點的概率;
(2)能否有90%的把握認(rèn)為甲、乙兩城之間的長途客車是否準(zhǔn)點與客車所屬公司有關(guān)?
表4
(2)列聯(lián)表如表5所示.根據(jù)臨界值表可知,有90%的把握認(rèn)為甲、乙兩城之間的長途客車是否準(zhǔn)點與客車所屬公司有關(guān).
表5
1)2個明確:明確兩類主體;明確研究的兩個問題.
2)2 個關(guān)鍵:準(zhǔn)確畫出2×2 列聯(lián)表;準(zhǔn)確求解K2.
縱觀近幾年高考的概率與統(tǒng)計試題,成對數(shù)據(jù)的統(tǒng)計分析占有相當(dāng)高的比重,而且命題形式也逐步趨于平穩(wěn),注重落實?中國高考評價體系?中四層四翼的考核要求.試題命制背景多與生產(chǎn)生活實際緊密聯(lián)系,文字量大,信息多,對學(xué)生的閱讀理解能力、信息獲取能力和批判性思維能力有較高的要求.因此,筆者希望學(xué)生在復(fù)習(xí)中注重提高用數(shù)學(xué)概念、原理解讀具體問題和提煉有用信息的能力,強(qiáng)化運(yùn)算求解能力和統(tǒng)計推斷思維.
(完)