亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)處理能力的統(tǒng)計與概率復習備考研究*

        2018-12-18 10:40:32廣東省廣州市越秀區(qū)教育發(fā)展中心510080吳平生
        中學數(shù)學研究(廣東) 2018年21期
        關(guān)鍵詞:模型

        廣東省廣州市越秀區(qū)教育發(fā)展中心(510080) 吳平生

        統(tǒng)計與概率是高中數(shù)學的重要內(nèi)容.以理科數(shù)學統(tǒng)計與概率為例,全國卷高考的考查重點是用樣本估計總體,古典概率,離散型隨機變量的分布列、期望、方差,應用回歸分析與獨立性檢驗思想方法解決簡單實際問題的能力.試題強調(diào)應用性,以實際問題為背景,構(gòu)建數(shù)學模型,突出考查統(tǒng)計與概率的思想和考生的數(shù)據(jù)處理能力及應用意識[1].全國卷高考數(shù)學統(tǒng)計與概率試題強調(diào)以素養(yǎng)為導向,突出考查數(shù)學建模、數(shù)據(jù)分析等數(shù)學學科核心素養(yǎng),以能力立意,突出考查數(shù)據(jù)處理能力及應用意識,那么什么是數(shù)據(jù)處理能力呢?

        一、數(shù)據(jù)處理能力

        數(shù)據(jù)處理能力是指會收集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù),能從數(shù)據(jù)中抽取對研究問題有用的信息,并作出合理判斷.數(shù)據(jù)處理能力要求考生能理解問題所提供的文字、數(shù)字、圖形、圖表等信息,并能從中提取有關(guān)信息,對它們進行分析和處理.能對有關(guān)的數(shù)據(jù)和圖形進行統(tǒng)計和分析,應用統(tǒng)計或統(tǒng)計案例中的方法解決實際問題[1].

        數(shù)據(jù)處理的一般過程是:用抽樣方法收集數(shù)據(jù),用統(tǒng)計圖表整理數(shù)據(jù),用數(shù)字特征分析數(shù)據(jù),用估計思想作出推斷.“圖表→信息→公式→模型”體現(xiàn)了數(shù)據(jù)處理的四個層次.那么全國卷高考數(shù)學統(tǒng)計與概率試題如何體現(xiàn)數(shù)據(jù)處理能力的考查呢?

        二、試題統(tǒng)計分析

        近五年全國卷理科數(shù)學統(tǒng)計與概率試題以“一小一大”或“兩小一大”為主,詳見下表:

        ____________年份 卷次_________客觀題_______________________解答題___________________合計全國I卷____2014年 第5題古典概型___第18題某種產(chǎn)品的質(zhì)量指標值問題2題__全國II卷___第5題條件概率___第19題某地區(qū)農(nóng)村居民家庭人均純收入問題___2題__全國I卷____2015年 第4題事件概率___第19題某種產(chǎn)品的年銷售量問題____________2題__全國II卷___第3題統(tǒng)計圖表___第18題某產(chǎn)品的用戶滿意度問題____________2題__全國I卷____第4題幾何概型___第19題某公司購買機器的易損零件問題_______2題__2016年全國II卷___第10題幾何概型___第18題某險種的年度保費問題2題________________________全國III卷 第4題統(tǒng)計圖表___第18題我國生活垃圾無害化處理量問題_______2題__全國I卷____第2題幾何概型___第19題某種零件的生產(chǎn)過程監(jiān)控問題_________2題__2017年全國II卷___第13題二項分布___第18題海水養(yǎng)殖場新舊養(yǎng)殖法的箱產(chǎn)量問題___2題________________________全國III卷 第3題統(tǒng)計圖表___第18題某超市的酸奶銷售利潤問題___________2題__全國I卷____第20題每一箱產(chǎn)品的檢驗方式問題___________第3題統(tǒng)計圖表第10題幾何概型___3題__2018年全國II卷___第8題古典概型___第18題某地區(qū)環(huán)境基礎設施投資額問題_______2題________________________全國III卷 第8題二項分布___第18題兩種生產(chǎn)方式的效率比較問題_________2題__

        其中“一小”或“兩小”是以一道或兩道客觀題的形式呈現(xiàn),主要考查抽樣方法、統(tǒng)計圖表、基本概型、重要分布等基礎知識,難度中等偏易;“一大”是以一道解答題的形式呈現(xiàn),主要考查用樣本估計總體、回歸分析、獨立性檢驗、復雜事件的概率、隨機變量的概率分布與數(shù)學期望等實際應用問題,難度中等或中等偏難.如何進行全國卷高考數(shù)學統(tǒng)計與概率內(nèi)容的復習備考呢?從解答題的試題特點來看,一是題目較長,閱讀量較大,這需要過好審題關(guān);二是題目背景多為生產(chǎn)、生活實際問題,強調(diào)應用性,這需要過好建模關(guān);三是數(shù)據(jù)多,關(guān)系復雜,運算量較大,這需要過好運算關(guān).其中“理解題意,明確原理,識別模型”是解決問題的關(guān)鍵.那么高中統(tǒng)計與概率的基本模型有哪些呢?

        三、基本模型備考

        1.基本模型分類

        高中理科數(shù)學統(tǒng)計與概率的模型可分為統(tǒng)計模型與概率模型兩大類.

        統(tǒng)計模型可分為統(tǒng)計初步模型與統(tǒng)計案例模型兩類.統(tǒng)計初步模型主要是“用樣本估計總體”模型,包括“收集數(shù)據(jù)→整理數(shù)據(jù)→分析數(shù)據(jù)→作出推斷”的統(tǒng)計過程.統(tǒng)計案例模型可分為回歸分析模型與獨立性檢驗模型兩類,回歸分析模型包括線性回歸分析模型與非線性回歸分析模型兩類.

        概率模型可分為概率初步模型與隨機變量模型兩類.概率初步模型可分為基本概型與復雜事件的概率模型兩類,基本概型包括古典概型與幾何概型兩類,復雜事件的概率模型包括互斥事件的概率、對立事件的概率、相互獨立事件的概率、獨立重復試驗的概率、條件概率五種.隨機變量分為離散型隨機變量與連續(xù)型隨機變量兩類,離散型隨機變量的概率分布模型包括一般分布列與重要分布列兩類,重要分布列模型包括超幾何分布與二項分布,連續(xù)型隨機變量的概率分布模型主要是正態(tài)分布.

        綜上所述,統(tǒng)計與概率的基本模型分類見下圖.

        圖1

        2.基本模型例析

        模型1:隨機變量的概率分布模型

        離散型隨機變量的分布列、期望、方差是理科數(shù)學高考的考查重點.求離散型隨機變量的期望與方差,關(guān)鍵是求出離散型隨機變量的分布列.如何求離散型隨機變量的分布列?一般步驟如下:第一步,確定隨機變量X的所有可能取值;第二步,求出隨機變量X的每一種取值所對應事件的概率;第三步,列表寫出X的分布列,并檢驗各列的概率之和等于1.

        題目1(2013年全國I卷理科第19題)一批產(chǎn)品需要進行質(zhì)量檢驗,檢驗方案是:先從這批產(chǎn)品中任取4件作檢驗,這4件產(chǎn)品中優(yōu)質(zhì)品的件數(shù)記為n.如果n=3,再從這批產(chǎn)品中任取4件作檢驗,若都為優(yōu)質(zhì)品,則這批產(chǎn)品通過檢驗;如果n=4,再從這批產(chǎn)品中任取1件作檢驗,若為優(yōu)質(zhì)品,則這批產(chǎn)品通過檢驗;其他情況下,這批產(chǎn)品都不能通過檢驗.假設這批產(chǎn)品的優(yōu)質(zhì)品率為50%,即取出的每件產(chǎn)品是優(yōu)質(zhì)品的概率都為,且各件產(chǎn)品是否為優(yōu)質(zhì)品相互獨立.

        (1)求這批產(chǎn)品通過檢驗的概率;

        (2)已知每件產(chǎn)品的檢驗費用為100元,凡抽取的每件產(chǎn)品都需要檢驗,對這批產(chǎn)品作質(zhì)量檢驗所需的費用記為X(單位:元),求X的分布列及數(shù)學期望.

        解析(1)“這批產(chǎn)品通過檢驗”是一個復雜事件.如何將復雜事件轉(zhuǎn)化為簡單事件?通過分類與分步.“這批產(chǎn)品通過檢驗”可分為兩類事件,一類是“先任取4件產(chǎn)品恰有3件是優(yōu)質(zhì)品,再任取4件產(chǎn)品都是優(yōu)質(zhì)品”;另一類是“先任取4件產(chǎn)品都是優(yōu)質(zhì)品,再任取1件產(chǎn)品也是優(yōu)質(zhì)品”.每一類事件都需分為兩步完成.由于“各件產(chǎn)品是否為優(yōu)質(zhì)品相互獨立”,所以每一步都是一個獨立重復試驗.所以這批產(chǎn)品通過檢驗的概率為.

        (2)對這批產(chǎn)品作質(zhì)量檢驗所需的費用X是由什么決定?X由檢驗次數(shù)Y決定,且X=100Y.檢驗次數(shù)Y與什么有關(guān)?Y與第一次任取4件產(chǎn)品中優(yōu)質(zhì)品的件數(shù)n有關(guān).當n=4時,Y=4+1=5;當n=3時,Y=4+4=8;當n=2,1,0時,Y=4.只要求出n的分布列,就能對應求出Y的分布列,從而通過線性變換就能求出X的分布列.

        _n 0___1___2___3___4___P___14641 16____16____16____16____16__

        因為Y=所以Y的分布列為:

        __Y ___4___5___8__P 1111 16____16____4__

        因為X=100Y,所以X的分布列為:

        _X 400__500__800__P 1111 16______16______4___

        所以X的數(shù)學期望為.

        評述本題突出考查了復雜事件概率的求法與離散型隨機變量的分布列、數(shù)學期望的求法.求復雜事件的概率,常通過分類與分步,將復雜事件分解為互斥事件與相互獨立事件來解決,比如第(1)小問.在第(2)小問中,求未知隨機變量X的分布列,通過中間隨機變量Y,轉(zhuǎn)化為已知隨機變量n服從的二項分布來解決,體現(xiàn)了聯(lián)系與轉(zhuǎn)化的數(shù)學思想方法.

        超幾何分布與二項分布是離散型隨機變量的兩個重要分布,兩者之間有何區(qū)別與聯(lián)系?

        一般地,在含有M件次品的N(N>M)件產(chǎn)品中,任取n件,其中恰有X件次品.若采用無放回抽樣方式,則X服從超幾何分布;若采用有放回抽樣方式,則X服從二項分布;若采用無放回抽樣方式,當N很大而n較小時,每次抽出產(chǎn)品后,次品率近似不變,每次抽樣的結(jié)果可以近似看成是相互獨立的,X近似服從二項分布.兩者比較見下表[2].

        _抽樣方式無放回抽樣_____________________________有放回抽樣_________________概率模_________________型古典概型獨立重復試驗_分布模型X ~H(n,M,N),次品率為 M X ~B(n,p),取到次品的成功概率為p=M N N_變量取_______值X=0,1,2,···,min{M,n}._________________X=0,1,2,···,n._概率公_________式P(X=k)=CkMCn-kN-M P(X=k)=Cknpk(1-p)n-k______________________E(X)=nM CnN期望公式E(X)=np(N)_方差公式_____D(X)=nM 1-M D(X)=np(1-p)N_______N__·N-n N-1_______________________________________________兩者聯(lián)_____________________系當N很大而n較小時,超幾何分布近似于二項分布._________________

        當N很大而n較小時,超幾何分布H(n,M,N)近似于二項分布B(n,p).證明如下[3]:

        在抽樣問題中,如何識別超幾何分布與二項分布呢?若以抽到的次品數(shù)X作為隨機變量,則可以從產(chǎn)品總數(shù)與抽樣方式兩個方面進行判斷,見下表.

        __抽樣_________方式 產(chǎn)品總數(shù)已知_______產(chǎn)品總數(shù)未知_____有放回抽樣_____X服從二項分布_____X服從二項分布____無放回抽樣____X服從超幾何分布__X近似服從二項分布_

        在題1中,由于這批產(chǎn)品的總數(shù)未知,且“各件產(chǎn)品是否為優(yōu)質(zhì)品相互獨立”,因此從這批產(chǎn)品中任取4件作檢驗得到的優(yōu)質(zhì)品件數(shù)n服從的是二項分布.

        模型2:回歸分析模型

        回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種統(tǒng)計方法.如何進行回歸分析?一般步驟如下:第一步,確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量;第二步,畫出散點圖,直觀判斷相關(guān)變量是否線性相關(guān);第三步,若線性相關(guān),則用最小二乘估計求出線性回歸方程的系數(shù),并求出線性回歸方程;第四步,若非線性相關(guān),則選擇非線性回歸方程類型,通過數(shù)學變換求出回歸方程;第五步,利用回歸方程進行預報或進行擬合效果分析.

        題目2(2015年全國I卷文理科第19題)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的年宣傳費xi和年銷售量yi(i=1,2,···,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.

        圖2

        (2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;

        (3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題:

        (i)年宣傳費x=49時,年銷售量及年利潤的預報值是多少?

        (ii)年宣傳費x為何值時,年利潤的預報值最大?

        附:對于一組數(shù)據(jù) (u1,v1),(u2,v2),···,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為:

        解析(1)從散點圖來看,樣本點分布在某條曲線(開口向右的拋物線,或底數(shù)大于1的對數(shù)型曲線)周圍,根據(jù)題意,宜選擇作為年銷售量y關(guān)于年宣傳費x的回歸方程類型.

        (ii)由(2)得,年利潤z的預報值,所以當,即x=46.24時,z?取得最大值66.36.

        所以年宣傳費為46.24千元時,年利潤的預報值最大.

        評述本題突出考查了非線性回歸分析.如何判斷兩個相關(guān)變量是線性相關(guān)還是非線性相關(guān)?通常有兩種方法.一是畫散點圖進行直觀判斷.若樣本點分布在某條帶狀區(qū)域附近,則可直觀判斷兩個相關(guān)變量是線性相關(guān)關(guān)系;若樣本點分布在某條曲線周圍,則可直觀判斷兩個變量是非線性相關(guān)關(guān)系.二是利用相關(guān)系數(shù)r進行分析.若0.75≤│r│≤1,則兩個相關(guān)變量的線性相關(guān)程度很強;若0<│r│<0.25,則兩個相關(guān)變量的線性相關(guān)程度較弱.如何求非線性回歸方程?一般步驟如下:第一步,根據(jù)曲線形狀判斷回歸方程類型;第二步,通過數(shù)學變換將非線性關(guān)系轉(zhuǎn)化為線性關(guān)系;第三步,利用最小二乘估計求出線性回歸方程系數(shù),并求出線性回歸方程;第四步,通過數(shù)學變換還原求出非線性回歸方程.

        本題也可用對數(shù)型回歸方程模型來擬合.如何比較不同模型的擬合效果?通常利用相關(guān)指數(shù)R2來比較,對于同一組變量得到的不同回歸模型,當相關(guān)指數(shù)R2越大時,模型的擬合效果越好;當相關(guān)指數(shù)R2越小時,模型的擬合效果越差.

        模型3:獨立性檢驗模型

        獨立性檢驗是利用隨機變量K2來判斷“兩個分類變量是否有關(guān)系”的一種統(tǒng)計方法.如何進行獨立性檢驗?一般步驟如下:第一步,根據(jù)樣本數(shù)據(jù)寫出2×2列聯(lián)表;第二步,提出假設H0:假設分類變量X與Y沒有關(guān)系;第三步,根據(jù)實際問題的需要確定容許推斷“X與Y有關(guān)系”犯錯誤概率的上界α,并查表P(K2≥k0)≈α確定臨界值k;第四步,根據(jù)公式計算K2的觀測值k;第五步,作出判斷:若k≥k0,說明小概率事件發(fā)生了,則有理由拒絕假設H0,即在犯錯誤的概率不超過α的前提下可以推斷“X與Y有關(guān)系”;若k<k0,說明小概率事件未發(fā)生,則有理由接受假設H0,即在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”.

        題目3(2017年全國II卷理科第18題)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg)某頻率分布直方圖如下:

        圖3

        圖4

        (1)設兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg,新養(yǎng)殖法的箱產(chǎn)量不低于50kg”,估計A的概率;

        (2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān);

        箱產(chǎn)量<50kg 箱產(chǎn)量≥50kg舊養(yǎng)殖法新養(yǎng)殖法

        (3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01).附:

        P(K2≥k)0.050 0.010 0.001 k 3.841 6.635 10.828

        解析(1)設事件A1:“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,事件A2:“新養(yǎng)殖法的箱產(chǎn)量不低于50kg”,則A1與A2相互獨立,且P(A)=P(A1A2)=P(A1)P(A2).用樣本估計總體得,P(A1)≈(0.012+0.014+0.024+0.034+0.040)×5=0.62,P(A2)≈(0.068+0.046+0.010+0.008)×5=0.66,所以事件A的概率估計值為0.62×0.66=0.4092.

        (2)依題意,可得列聯(lián)表如下:

        箱產(chǎn)量<50kg 箱產(chǎn)量≥50kg 總計舊養(yǎng)殖法62 38 100新養(yǎng)殖法34 66 100總計96 104 200

        假設H0:“箱產(chǎn)量與養(yǎng)殖方法無關(guān)”.當H0成立時,P(K2≥6.635)≈0.01.將2×2列聯(lián)表中的數(shù)據(jù)代入公式,計算得因為15.705>6.635,所以小概率事件發(fā)生了,有理由拒絕假設.所以在犯錯誤的概率不超過0.01的前提下可以推斷箱產(chǎn)量與養(yǎng)殖方法有關(guān),即有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān).

        (3)根據(jù)新養(yǎng)殖法箱產(chǎn)量的頻率分布直方圖得,箱產(chǎn)量低于50kg的頻率為(0.004+0.020+0.044)×5=0.34<0.5,箱產(chǎn)量低于55kg的頻率為

        所以樣本中位數(shù)位于區(qū)間[50,55].設樣本中位數(shù)為x,則0.34+(x-50)×0.068=0.5,解得x≈52.35.用樣本估計總體,所以新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值為52.35kg.

        評述本題突出考查了獨立性檢驗與用樣本估計總體的思想.獨立性檢驗的原理是假設檢驗,因此解答過程要提出統(tǒng)計假設,確定拒絕域,進行統(tǒng)計檢驗,體現(xiàn)假設檢驗的思想,詳見第(2)小問的解答過程.用樣本估計總體是統(tǒng)計的基本思想,用樣本估計總體主要包括兩種估計,一是用樣本的頻率估計總體的概率,比如第(1)小問;二是用樣本的數(shù)字特征(如眾數(shù),中位數(shù),平均數(shù),方差,標準差)估計總體的數(shù)字特征,比如第(3)小問.

        在頻率分布直方圖的背景下,如何求樣本的眾數(shù)、中位數(shù)、平均數(shù)、方差?方法如下:①通常以頻率最大的一組的區(qū)間中點值作為樣本的眾數(shù).②通常以頻率為0.5處的數(shù)據(jù)作為樣本的中位數(shù).設中位數(shù)為x,中位數(shù)所在的區(qū)間為[a,b],區(qū)間[a,b]所在小矩形的高為h,區(qū)間[a,b]左邊的頻率為f1,則f1+(x-a)h=0.5,可解得.③設第i個區(qū)間的中點值為xi,第i個區(qū)間上的頻率為fi,則樣本平均數(shù)為,樣本方差為.根據(jù)用樣本估計總體的思想,就可用樣本的數(shù)字特征估計總體的數(shù)字特征.

        由上可見,處理數(shù)據(jù)有四種常用方法:用概念,用圖表,用公式,用模型,其中模型是一種整體結(jié)構(gòu).只要抓住了統(tǒng)計與概率的基本模型,就能從整體上把握統(tǒng)計與概率問題的基本結(jié)構(gòu).這樣“通過概念,揭示本質(zhì);根據(jù)圖表,提取信息;運用公式,處理數(shù)據(jù)”就有了方向,根據(jù)統(tǒng)計與概率的基本模型來分析問題與解決問題就有了堅實的基礎,從而達到“化繁為簡,以簡馭繁”的目的.

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        99精品欧美一区二区三区美图| 国产亚av手机在线观看| 午夜成人鲁丝片午夜精品| 国产精品一区二区在线观看99| 亚洲av综合日韩精品久久久| 国产精品黑丝美腿美臀| 亚洲乱码一区av春药高潮| 极品熟妇大蝴蝶20p| 国产成人AⅤ| 手机在线播放av网址| 热久久美女精品天天吊色| 亚洲 都市 校园 激情 另类| 国产在线观看精品一区二区三区| 午夜亚洲精品视频在线 | 日韩在线视频专区九区| 久久久久久av无码免费网站下载| 久久久久久久久久久国产| 真实国产网爆门事件在线观看| 久久成人永久婷婷99精品| 97se狠狠狠狠狼鲁亚洲综合色| 少妇邻居内射在线| 国产美女三级视频网站| 国产成人亚洲一区二区| 真人做爰片免费观看播放| 综合网五月| 在线亚洲精品一区二区三区| 曰韩无码av一区二区免费| 国产精品美女久久久久久久久| 国产在线高清无码不卡| 中文字幕av永久免费在线| 亚洲精品www久久久| аⅴ天堂国产最新版在线中文| 亚洲成人av在线播放不卡| 久久国产成人精品国产成人亚洲 | 国产精品白浆一区二区免费看| 国产在线视频一区二区三| 国产精品永久久久久久久久久| 中文亚洲av片在线观看不卡| 久久精品国产亚洲av麻豆四虎| 国产午夜视频在线观看.| 黑人巨茎大战欧美白妇|