《2020版高考數學一輪復習 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第3節(jié) 用樣本估計總體教學案 理(含解析)新人教A版》由會員分享,可在線閱讀,更多相關《2020版高考數學一輪復習 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第3節(jié) 用樣本估計總體教學案 理(含解析)新人教A版(9頁珍藏版)》請在裝配圖網上搜索。
1、第三節(jié) 用樣本估計總體
[考綱傳真] 1.了解分布的意義與作用,能根據頻率分布表畫頻率分布直方圖、頻率折線圖、莖葉圖,體會它們各自的特點.2.理解樣本數據標準差的意義和作用,會計算數據標準差.3.能從樣本數據中提取基本的數字特征(如平均數、標準差),并做出合理的解釋.4.會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征.理解用樣本估計總體的思想,會用樣本估計總體的思想解決一些簡單的實際問題.
1.頻率分布直方圖
(1)畫頻率分布直方圖的步驟:
(2)頻率分布直方圖:反映樣本頻率分布的直方圖.
橫軸表示樣本數據,縱軸表示,每個小矩形的面積表示樣本落在
2、該組內的頻率.
2.頻率分布折線圖和總體密度曲線
(1)頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.
(2)總體密度曲線:隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率折線圖會越來越接近于一條光滑曲線,統(tǒng)計中稱這條光滑曲線為總體密度曲線.
3.莖葉圖
統(tǒng)計中一種被用來表示數據的圖叫做莖葉圖,莖是指中間的一列數,葉是從莖的旁邊生長出來的數.
4.樣本的數字特征
(1)眾數:一組數據中出現次數最多的那個數據,叫做這組數據的眾數.
(2)中位數:把n個數據按大小順序排列,處于最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數
3、據的中位數.
(3)平均數:把=稱為x1,x2,…,xn這n個數的平均數.
(4)標準差與方差:設一組數據x1,x2,x3,…,xn的平均數為,則這組數據的標準差和方差分別是
s=;
s2=[(x1-)2+(x2-)2+…+(xn-)2].
[常用結論]
1.頻率分布直方圖中各小矩形的面積之和為1.
2.頻率分布直方圖與眾數、中位數與平均數的關系
(1)最高的小長方形底邊中點的橫坐標即是眾數.
(2)中位數左邊和右邊的小長方形的面積和是相等的.
(3)平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和.
3.若數據x1
4、,x2,…,xn的平均數為,方差為s2,則數據mx1+a,mx2+a,mx3+a,…,mxn+a的平均數是m+a,方差為m2s2.
[基礎自測]
1.(思考辨析)判斷下列結論的正誤.(正確的打“√”,錯誤的打“×”)
(1)平均數、眾數與中位數從不同的角度描述了一組數據的集中趨勢.( )
(2)一組數據的方差越大,說明這組數據越集中. ( )
(3)頻率分布直方圖中,小矩形的面積越大,表示樣本數據落在該區(qū)間的頻率越高.( )
(4)莖葉圖一般左側的葉按從大到小的順序寫,右側的葉按從小到大的順序寫,相同的數據可以只記一次.( )
[答案] (1)√ (2)× (3)√ (4
5、)×
2.為評估一種農作物的種植效果,選了n塊地作試驗田.這n塊地的畝產量(單位:kg)分別為x1,x2,…,xn,下面給出的指標中可以用來評估這種農作物畝產量穩(wěn)定程度的是( )
A.x1,x2,…,xn的平均數
B.x1,x2,…,xn的標準差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位數
B [標準差反映樣本數據的離散波動大小,故選B.]
3.數據1,3,4,8的平均數與方差分別是( )
A.2,2.5 B.2,10.5
C.4,2 D.4,6.5
D [平均數為=4,方差為=6.5.]
4.某學生在一門功課的22次考試中,所得分數莖
6、葉圖如圖所示,則此學生該門功課考試分數的極差與中位數之和為( )
A.117 B.118
C.118.5 D.119.5
B [22次考試中,所得分數最高的為98,最低的為56,所以極差為98-56=42,
將分數從小到大排列,中間兩數為76,76,所以中位數為76,
所以此學生該門功課考試分數的極差與中位數之和為42+76=118.]
5.(教材改編)某校為了了解教科研工作開展狀況與教師年齡之間的關系,將該校不小于35歲的80名教師按年齡分組,分組區(qū)間為[35,40),[40,45),[45,50),[50,55),[55,60],由此得到頻率分布直方圖如圖,則這8
7、0名教師中年齡小于45歲的有________人.
48 [由頻率分布直方圖可知45歲以下的教師的頻率為5×(0.040+0.080)=0.6,所以共有80×0.6=48(人). ]
樣本的數字特征的計算與應用
1.在某次測量中,得到的A樣本數據為81,82,82,84,84,85,86,86,86,若B樣本數據恰好是A樣本數據分別加2后所得的數據,則A,B兩個樣本的下列數字特征對應相同的是( )
A.眾數 B.平均數
C.標準差 D.中位數
C [由題意可得A,B兩組數據的眾數分別是86和88,排除A;B組數據的平均數比A組數據的平均數大2,排除B;B組數
8、據的中位數比A組數據的中位數大2,排除D;A,B兩組數據的標準差相同,C正確,故選C.]
2.甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統(tǒng)計圖如圖所示,則( )
甲 乙
A.甲的成績的平均數小于乙的成績的平均數
B.甲的成績的中位數等于乙的成績的中位數
C.甲的成績的方差小于乙的成績的方差
D.甲的成績的極差小于乙的成績的極差
C [根據條形統(tǒng)計圖可知甲的中靶情況為4環(huán)、5環(huán)、6環(huán)、7環(huán)、8環(huán);乙的中靶情況為5環(huán)、5環(huán)、5環(huán)、6環(huán)、9環(huán).甲=(4+5+6+7+8)=6,乙=(5×3+6+9)=6,甲的成績的方差為
=2,乙的成績的方差為=2.4;甲的成績的
9、極差為4環(huán),乙的成績的極差為4環(huán);甲的成績的中位數為6環(huán),乙的成績的中位數為5環(huán),綜上可知C正確,故選C.]
3.某人5次上班途中所花的時間(單位:分鐘)分別為x,y,10,11,9.已知這組數據的平均數為10,方差為2,則|x-y|的值為( )
A.1 B.2
C.3 D.4
D [由題意可知
∴
∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.
∴(x-y)2=x2+y2-2xy=16,∴|x-y|=4,故選D.]
[規(guī)律方法] 眾數、中位數、平均數、方差的意義及常用結論
(1)平均數與方差都是重要的數字特征,是對總體的一種簡明的
10、描述,它們所反映的情況有著重要的實際意義,平均數、中位數、眾數描述其集中趨勢,方差和標準差描述波動大小.
(2)方差的簡化計算公式:,或寫成s2=,即方差等于原數據平方的平均數減去平均數的平方.
莖葉圖
【例1】 某良種培育基地正在培育一小麥新品種A,將其與原有的一個優(yōu)良品種B進行對照試驗,兩種小麥各種植了25畝,所得畝產量的數據(單位:千克)如下:
品種A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
品種B:
3
11、63,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)作出品種A與B畝產量數據的莖葉圖;
(2)用莖葉圖處理現有的數據,有什么優(yōu)點?
(3)通過觀察莖葉圖,對品種A與B的畝產量及其穩(wěn)定性進行比較,寫出統(tǒng)計結論.
[解] (1)畫出莖葉圖如圖所示.
(2)由于每個品種的數據都只有25個,樣本容量不大,畫莖葉圖很方便;此時莖葉圖不僅清晰明了地展示了數據的分布情況,便于比較,沒有任何信息損失,而且可以隨時記錄新的數據.
(3)通過觀察莖
12、葉圖可以看出:①品種A的畝產量的平均數(或均值)比品種B高;②品種A的畝產量的標準差(或方差)比品種B大,故品種A的畝產量的穩(wěn)定性較差.
[規(guī)律方法] 莖葉圖中的兩個關注點
(1)重復出現的數據要重復記錄,不能遺漏.
(2)給定兩組數據的莖葉圖,估計數字特征,莖上的數字由小到大排列,一般“重心”下移者平均數較大,數據集中者方差較小.
易錯警示:莖葉圖中數字大小排列不一定從小到大排列,一定要看清楚.
(1)空氣質量指數(Air Quality Index,簡稱AQI)是定量描述空氣質量狀況的指數,空氣質量按照AQI大小分為六級,0~50為優(yōu);51~100為良;101~150為輕度污
13、染;151~200為中度污染;201~300為重度污染;大于300為嚴重污染.從某地一環(huán)保人士某年的AQI記錄數據中,隨機抽取10個,用莖葉圖記錄如圖.根據該統(tǒng)計數據,估計此地該年AQI大于100的天數約為________.(該年為365天)
(2)如圖所示的莖葉圖是甲、乙兩位選手在某次比賽中的比賽得分,則下列說法正確的是( )
A.甲的平均數大于乙的平均數
B.甲的中位數大于乙的中位數
C.甲的方差大于乙的方差
D.甲的平均數等于乙的中位數
(1)146 (2)C [(1)該樣本中AQI大于100的頻數是4,頻率為,
由此估計該地全年AQI大于100的頻率為,
估計此地
14、該年AQI大于100的天數約為365×=146.
(2)由莖葉圖可知,甲=×(59+45+32+38+24+26+11+12+14)=29,乙=×(51+43+30+34+20+25+27+28+12)=30,s=×(302+162+32+92+52+32+182+172+152)≈235.3,s=×(212+132+02+42+102+52+32+22+182)≈120.9,甲的中位數為26,乙的中位數為28.所以甲的方差大于乙的方差.故選C.]
頻率分布直方圖
【例2】 某城市100戶居民的月平均用電量(單位:千瓦時),以[160,180),[180,200),[200,22
15、0),[220,240),[240,260),[260,280),[280,300]分組的頻率分布直方圖如圖.
(1)求直方圖中x的值.
(2)求月平均用電量的眾數和中位數.
(3)在月平均用電量為[220,240),[240,260),[260,280),[280,300]的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量在[220,240]的用戶中應抽取多少戶?
[解] (1)(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,解得x=0.007 5.
即直方圖中x的值為0.007 5.
(2)月平均用電量的眾數是
16、=230.
∵(0.002+0.009 5+0.011)×20=0.45<0.5,
(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,
∴月平均用電量的中位數在[220,240)內.
設中位數為a,則0.45+0.012 5×(a-220)=0.5,解得a=224,即中位數為224.
(3)月平均用電量在[220,240]的用戶有0.012 5×20×100=25(戶).同理可得月平均用電量在[240,260)的用戶有15戶,月平均用電量在[260,280)的用戶有10戶,月平均用電量在[280,300]的用戶有5戶,故抽取比例為=.
∴月平均用電量
17、在[220,240)的用戶中應抽取25×=5(戶).
[規(guī)律方法] 頻率、頻數、樣本容量的計算方法
(1)
(2)
從某企業(yè)生產的某種產品中抽取100件,測量這些產品的一項質量指標值,由測量結果得如下頻數分布表:
質量指標
值分組
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
頻數
6
26
38
22
8
(1)作出這些數據的頻率分布直方圖:
(2)估計這種產品質量指標值的平均數及方差(同一組中的數據用該組區(qū)間的中點值作代表);
(3)根據以上抽樣調查數據,能否認為該企業(yè)生產的這種產品符合“質量指標值不
18、低于95的產品至少要占全部產品的80%”的規(guī)定?
[解] (1)如圖所示:
(2)質量指標值的樣本平均數為=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
質量指標值的樣本方差為s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以這種產品質量指標值的平均數的估計值為100,方差的估計值為104.
(3)質量指標值不低于95的產品所占比例的估計值為0.38+0.22+0.08=0.68.由于該估計值小于0.8,故不能認為該企業(yè)生產的這種產品符合“質量指標值不低于95的產
19、品至少要占全部產品的80%”的規(guī)定.
1.(2017·全國卷Ⅲ)某城市為了解游客人數的變化規(guī)律,提高旅游服務質量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬人)的數據,繪制了下面的折線圖.
根據該折線圖,下列結論錯誤的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩(wěn)
A [對于選項A,由圖易知月接待游客量每年7,8月份明顯高于12月份,故A錯;
對于選項B,觀察折線圖的變化趨勢可知年接待游客量逐年增加
20、,故B正確;
對于選項C,D,由圖可知顯然正確.
故選A.]
2.(2018·全國卷Ⅰ)某地區(qū)經過一年的新農村建設,農村的經濟收入增加了一倍,實現翻番.為更好地了解該地區(qū)農村的經濟收入變化情況,統(tǒng)計了該地區(qū)新農村建設前后農村的經濟收入構成比例,得到如下餅圖:
則下面結論中不正確的是( )
A.新農村建設后,種植收入減少
B.新農村建設后,其他收入增加了一倍以上
C.新農村建設后,養(yǎng)殖收入增加了一倍
D.新農村建設后,養(yǎng)殖收入與第三產業(yè)收入的總和超過了經濟收入的一半
A [設新農村建設前經濟收入的總量為x,則新農村建設后經濟收入的總量為2x.
建設前種植收入為0.6x,建設后種植收入為0.74x,故A不正確;
建設前其他收入為0.04x,建設后其他收入為0.1x,故B正確;
建設前養(yǎng)殖收入為0.3x,建設后養(yǎng)殖收入為0.6x,故C正確;
建設后養(yǎng)殖收入與第三產業(yè)收入的總和占建設后經濟收入總量的58%,故D正確.]
- 9 -