《2019-2020年高中數(shù)學第2章統(tǒng)計2.1抽樣方法名師導航學案蘇教版必修.doc》由會員分享,可在線閱讀,更多相關(guān)《2019-2020年高中數(shù)學第2章統(tǒng)計2.1抽樣方法名師導航學案蘇教版必修.doc(8頁珍藏版)》請在裝配圖網(wǎng)上搜索。
2019-2020年高中數(shù)學第2章統(tǒng)計2.1抽樣方法名師導航學案蘇教版必修
三點剖析
一、總體與樣本
總體是指考察對象的全體;其中每一個考察對象是個體;從總體中所抽取的一部分個體叫做總體的一個樣本;樣本中個體的數(shù)目叫做樣本容量.樣本的抽取要具有隨機性.
例如:某學校高一年級為了了解全年級1 200名學生的體重,從中抽取100名學生進行測量分析.在這個問題中總體是指“某學校高一年級全年級1 200名學生的體重”,而樣本則是指“從中抽取的100名學生的體重”,樣本容量則是100.
統(tǒng)計的基本思想方法就是用樣本估計總體,即當總體容量很大或檢測過程具有一定的破壞性時,不去直接研究總體,而是從總體中抽取一個樣本,根據(jù)樣本的情況去估計總體的相應情況.如為了檢測一批小麥良種的發(fā)芽率,我們可以從中隨機地選出100粒進行試驗.通過這100粒小麥的發(fā)芽率來估計這批小麥的發(fā)芽率.
二、簡單隨機抽樣
1.定義
一般地,從個體數(shù)為N的總體中不重復地取出n(n
39,將它去掉;繼續(xù)向右讀,得到16,將它取出;繼續(xù)下去,又得到19,10,12,07,39,38,33,21,隨后的兩位數(shù)字號碼是12,由于它在前面已經(jīng)取出,將它去掉,再繼續(xù)下去,得到34.至此,10個樣本已經(jīng)取滿,于是,所要抽取的樣本號碼是:16,19,10,12,07,39,38,33,21,34.
(6)使用隨機數(shù)表法的注意事項:
利用隨機數(shù)表抽取樣本時,數(shù)表中的數(shù)字可以兩兩連在一起,也可以三三連在一起,這就要視總體中個體的個數(shù)而言.如果總體中個體的個數(shù)不多于100個,我們一般用兩位數(shù)表,即將數(shù)表中的數(shù)碼兩兩連在一起,如01,23,99,…;如果總體中個體的個數(shù)多于100個而不多于1 000個,我們一般用三位數(shù),就是將數(shù)碼三三連在一起,如012,567,999,…;….除此之外,當選定開始讀數(shù)的數(shù)后,讀數(shù)的方向可以向右,也可以向左、向上、向下等等.如在上一個實例中,當選定數(shù)碼5后,我們也可以向左讀取數(shù)碼,這樣得到樣本號碼分別是:01,06,12,25,33,21,04,24,31,17.
(7)隨機數(shù)表法的適用范圍:適用于總體中個體個數(shù)較少時抽取樣本的抽樣方法.當總體中個體數(shù)較多時,利用隨機數(shù)表選數(shù)將變得比較麻煩.
三、系統(tǒng)抽樣
1.定義
當總體中個體的個數(shù)較多時,采用簡單隨機抽樣顯得較為費事.這時,可將總體平均分成幾部分,然后按照預先定出的規(guī)則,從每個部分中抽取一個個體,得到所需要的樣本,這樣的抽樣方法稱為系統(tǒng)抽樣.
例如,為了了解參加某種知識競賽的1 000名學生的成績,打算從中抽取一個容量為50的樣本.假定這1 000名學生的編號是1,2,…,1 000,由于50∶1 000=1∶20,我們將總體分成50部分,其中每一部分包括20個個體,例如第1部分的編號是1,2,…,20.然后在第1部分利用簡單隨機抽樣的方法隨機抽取一個號碼,比如它是18,那么可以從第18號起,按事先確定的規(guī)則,如每隔20個抽取一個號碼,這樣得到一個容量為50的樣本:
18,38,58,…,978,998.
上例中,由于總體中的個體數(shù)1 000恰好是50的倍數(shù),可以被樣本容量50整除,可以用它們的比值作為進行系統(tǒng)抽樣的間隔.如果不能整除,比如總體中的個體為1 003,樣本容量仍為50,這時可用簡單隨機抽樣先從總體中剔除3個個體(抽簽法和隨機數(shù)表法均可),使剩下的個體數(shù)1 000能被樣本容量50整除,然后再按系統(tǒng)抽樣方法往下進行.
2.系統(tǒng)抽樣的步驟
(1)采用隨機的方式將總體中的個體編號.
(2)將整個的編號按一定的間隔分段(樣本容量是幾,就分成幾部分),要確定分段的間隔.當(N為總體中的個體數(shù),n為樣本容量)是整數(shù)時,k= ;當不是整數(shù)時,通過從總體中剔除一些個體使剩下的總體中個體個數(shù)N`能被n整除,這時k= .
(3)在第1段中用簡單隨機抽樣的方法確定起始號m.
(4)將編號為m,m+k,m+2k,…,m+(n-1)k的個體抽出.
3.系統(tǒng)抽樣與簡單隨機抽樣的聯(lián)系
系統(tǒng)抽樣與簡單隨機抽樣的聯(lián)系在于:將總體均分后的每一部分進行抽樣時,采用的是簡單隨機抽樣.
4.系統(tǒng)抽樣的優(yōu)點和缺點
系統(tǒng)抽樣的優(yōu)點是簡便易行;當對總體結(jié)構(gòu)有一定了解時,充分利用已有信息對總體中的個體進行排隊再抽樣,可提高抽樣的效率;當總體中的個體存在一種自然編號時,便于施行系統(tǒng)抽樣法.系統(tǒng)抽樣的缺點是在不了解樣本總體的情況下,所抽出的樣本可能有一定的偏差.
四、分層抽樣
1.定義
一般地,當已知總體由差異明顯的幾部分組成時,為了使樣本更客觀地反映總體的情況,通常將總體中的個體按不同的特點分層次比較分明的幾部分,然后按照各部分在總體中所占的比實施抽樣,這樣的抽樣方法就叫分層抽樣.其中所分成的各部分稱為層.
例如,一個單位的職工有500人,其中不到35歲的有125人,35歲到49歲之間的有280人,50歲以上的有95人.為了了解這個單位職工與身體狀況有關(guān)的某項指標,要從中抽取一個容量為100的樣本.總體是由差異明顯的幾部分組成的.不同年齡的職工的身體狀況差異比較大,不能在這500人中隨機地抽取100人,也不宜在這三個年齡段的職工中平均抽取樣本.這時,前面所學的兩種抽樣方法都不適用,因為這兩種抽樣方法都不能準確地反映客觀實際,這就需要一個更有效的抽樣方法——分層抽樣.
具體的操作過程是:(1)確定各年齡段被抽的人數(shù).由于樣本容量與總體中的個體數(shù)的比為100∶500=1∶5,所以在各年齡段抽取的個體數(shù)依次為,,,即25,56,19.
(2)用簡單隨機抽樣或系統(tǒng)抽樣的方法抽出各年齡段作為樣本的職工.
分層抽樣的特點是:分層抽樣時,每個個體被抽到的可能性是相等的.由于分層抽樣充分利用了已知信息,使樣本具有較好的代表性,而且在各層抽樣時,可以根據(jù)具體情況采取不同的抽樣方法,因此分層抽樣在實踐中有著非常廣泛的應用.
2.分層抽樣的步驟
(1)將總體按一定的標準(分層的標準由題意來確定)分層;
(2)計算各層的個體數(shù)與總體的個體的比;
(3)按各層中個體數(shù)占總體的比確定各層應抽取的樣本容量;
(4)在每一層進行抽樣,抽樣時根據(jù)各層中個體的個數(shù)選擇適當?shù)某闃臃椒?個體數(shù)較少時用簡單隨機抽樣,當個體數(shù)較多時可采用系統(tǒng)抽樣.
3.三種抽樣方法的特點與適用范圍
分層抽樣和簡單隨機抽樣、系統(tǒng)抽樣的聯(lián)系:將總體分成幾層,分層抽取樣本時采用簡單隨機抽樣或系統(tǒng)抽樣.簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣關(guān)系密切,對抽取樣本來說,可謂異曲同工.無論采取哪一種抽樣方法,必須保證在整個抽樣過程中每個個體被抽到的可能性相等.為了對三種抽樣方法進行比較,加深對三者的理解,以達到在抽樣實踐中正確地對它們進行選擇的功效,教材又將三種抽樣方法的特點和適用范圍進行了歸納,現(xiàn)列表如下:
類 別
特 點
相互聯(lián)系
適用范圍
共同點
簡單隨機抽樣
從總體中逐個抽取
總體中個體個數(shù)較少
抽樣過程中每個個體被抽到的可能性相等
系統(tǒng)抽樣
將總體均分為幾部分,按事先確定的規(guī)則在各部分抽取
在起始部分抽樣時采用簡單隨機抽樣
總體中個體個數(shù)較多
分層抽樣
將總體分成幾層,分層進行抽取
各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣
總體由差異明顯的幾部分組成
抓住三種抽樣方法的本質(zhì)特征是正確應用這三種抽樣方法的前提.
問題探究
問題1:吸煙有害健康.你知道嗎?被動吸煙(在吸煙的環(huán)境中被動地吸入煙氣)也大大危害著人類的健康.為此,聯(lián)合國規(guī)定每年的5月31日為世界無煙日.讓我們行動起來,在無煙的環(huán)境中健康地成長和生活.
請你想一想,如果讓你統(tǒng)計你們地區(qū)居民的吸煙狀況,你會采用什么方法,注意什么問題?
探究:由于不論是哪一個地區(qū),人口都很多,我們不可能對每個對象都進行調(diào)查,只能從其中抽取一部分來進行調(diào)查.這就涉及到了抽樣方法的選取.我們學的抽樣方法有三種:簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣.這三種抽樣方法有著各自的特點和適用范圍.簡單隨機抽樣簡便易行,但它只適用于個體數(shù)較少的總體,當總體中個體個數(shù)較多時我們常采用系統(tǒng)抽樣的方法抽取樣本.當總體由差異明顯的幾部分組成時我們宜采用分層抽樣的方法.由于不論是哪個地區(qū)吸煙的人群中年齡、性別、經(jīng)濟基礎(chǔ)和工作性質(zhì)都有著很大的區(qū)別,所以在抽取樣本時宜采用分層抽樣的方法(如可按年齡分層,也可以按性別分層).而在每層抽取樣本時,再根據(jù)實際情況來選取是用簡單隨機抽樣還是采用系統(tǒng)抽樣.
問題2:抽樣方法在實際生活中有著廣泛的應用.你能說說都有哪些嗎?
探究:我們生活在一個數(shù)字化的時代,時時刻刻都在與數(shù)據(jù)打交道,如產(chǎn)品的合格率、農(nóng)作物的產(chǎn)量、商品銷售量、當?shù)氐臍鉁?、就業(yè)狀況、電視臺的收視率等.這些數(shù)據(jù)都是通過抽樣的方法得到的.常用的抽樣方法有三種:簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣,這三種抽樣方法關(guān)系密切,對抽取樣本來說,可謂異曲同工.無論采取哪一種抽樣方法,必須保證在整個抽樣過程中每個個體被抽到的可能性是相等的.而在實際操作時,應根據(jù)總體中的個體數(shù)和個體的特點來選擇適當?shù)某闃臃椒?
例如:要從高一(1)班40名學生中隨機抽選8人去參加一項活動,我們應采用簡單隨機抽樣的方法.
但應注意:由于總體的復雜性,在實際抽樣中,為了使樣本具有代表性,通常要同時使用幾種抽樣方法.
問題3:1936年,美國《文學文摘》雜志根據(jù)1 000萬戶電話用戶和從該雜志訂戶所收回的意見,斷言蘭登將以370∶161的優(yōu)勢在總統(tǒng)選舉中擊敗羅斯福.但結(jié)果是,羅斯福當選了,《文學文摘》大丟面子.你知道原因何在嗎?
探究:在實際抽樣中,應使樣本具有代表性,對于美國選民來說他們在年齡、性別、經(jīng)濟基礎(chǔ)和工作性質(zhì)等方面都有著很大的區(qū)別.因此在抽樣調(diào)查時,應采用分層抽樣的方法進行抽樣,這樣才能使樣本具有一定代表性.在1936年使用電話或訂閱《文學文摘》雜志的人,在經(jīng)濟上都相對富裕,而收入不高的是大多數(shù)的選民,他們選擇了羅斯福.《文學文摘》的教訓表明,抽樣抽查時,既要關(guān)注樣本的大小,又要關(guān)注樣本的代表性.
精題精講
例1.某工廠有工人1 200人,為了調(diào)查某種情況打算抽取一個樣本容量為50的樣本,問此樣本若采用簡單隨機抽樣將如何獲得?
思路解析
簡單隨機抽樣分兩種:抽簽法和隨機數(shù)表法.盡管此題的總體中的個數(shù)不算少,但依題意其操作過程能保障每一個個體被抽到的機會等可能.所以,可將這1 200個工人進行編號,利用抽簽法或隨機數(shù)表法來進行抽樣.
解法一:首先,把該工廠的工人都編上號碼:0 001,0 002,0 003,…,1 200.如用抽簽法,則作1 200個形狀、大小相同的號簽(號簽可以用小球、卡片、紙條等制作),然后將這些號混合放在同一個箱子里,進行均勻攪拌.抽簽時,每次從中抽一個號簽,連續(xù)抽50次,就得到一個容量為50的樣本.
解法二:首先,把該工廠的工人都編上號碼:0 001,0 002,0 003,…,1 200.如用隨機數(shù)表法,則可在數(shù)表上隨機選定一個起始位置.假如起始位置是表中第5行第9列的數(shù)字從6開始向右連續(xù)取數(shù)字,以4個數(shù)為一組,碰到右邊線時向下錯一行向左繼續(xù)取,所得數(shù)字如下:
6 438,5 482,4 622,3 162,4 309,9 006,1 844,3 253,2 383,0 130,3 046,1 943,6 248,3 469,0 253,7 887,3 239,7 371,2 845,3 445,9 493,4 977,2 261,8 442,….
所錄取的4位數(shù)字如果小于或等于1 200,則對應此號的工人就是被抽取的個體;如果所取的4位數(shù)大于1 200而小于2 400,則減去1 200剩余數(shù)即是被抽取的號碼;如果所取的4位數(shù)大于2 400而小于3 600,則減去2 400剩余數(shù)即是被抽取的號碼…(出現(xiàn)重復數(shù)則去掉)可得下列數(shù)字:
0 438,0 682,1 022,0 762,0 709,0 606,0 644,0 853,1 183,0 130,0 646,0 743,0 248,1 069,0 253,0 687,0 839,0 171,0 445,1 045,1 093,0 177,1 061,0 042,…,一直取夠50人為止.
綠色通道
本題的解法體現(xiàn)了簡單隨機抽樣的適用范圍和步驟.規(guī)范的、不帶主觀意向的隨機抽樣,才能保證公平性、客觀性、準確性和可信性.而利用隨機數(shù)表法進行抽樣時,數(shù)表中數(shù)字的位數(shù)要與編號的位數(shù)一致.
例2.某單位有在崗職工1 244人,為了調(diào)查工人上班時,從離開家到來到單位的路上平均所用時間,決定從中抽取10%的工人調(diào)查這一情況.如何采用系統(tǒng)抽樣方法完成這一抽樣?
思路解析
由于總體中個體數(shù)比較多,且抽取的樣本中個體的個數(shù)也比較多,如果此時再用簡單隨機抽樣,則操作過程將比較麻煩.所以此時可以考慮系統(tǒng)抽樣.抽樣時總體中的每個個體,都必須等可能地入樣.本題中總體中個體數(shù)為1 244,而為了抽取一個容量為120的樣本,只有先剔除總體中的一部分個體才能實現(xiàn)“等距”入樣,且又具有等可能性.因此,解此題時,應選用系統(tǒng)抽樣法,且應先剔除,再“分段”,后定起始位置.
解:首先,將在崗的工人1 244人,用隨機方式編號(如按出生年月順序),0 000,0 001,0 002,0 003,…,1 243.第二步,由題意知,應取124人的樣本.因為不是整數(shù),所以應從總體中剔除4個人,(剔除方法用隨機數(shù)表法或抽簽法)將余下的1 200人,按編號順序補齊0 000,0 001,0 002,0 003,…,1 239分成120段,每段10人,在第一段0 000,0 001,0 002,…,0 009這十個編號中隨機定一起始號為m,則編號m,m+10,m+20,…,m+11910為所取的樣本.
綠色通道
采用系統(tǒng)抽樣可以減少工作量,提高可操作性,減少人為的導向和誤差.當總體中個體數(shù)不能被所抽樣本中個體數(shù)整除時,必須先用簡單隨機抽樣的方法從中抽取幾個樣本,以使余下的總體中的個體數(shù)被樣本中的個體數(shù)整除.
利用隨機抽樣的方法抽取樣本時,總體中的個體數(shù)必須是樣本中個體的倍數(shù),否則必須先用簡單隨機抽樣的方法從中抽取幾個樣本,使余下的總體中的個體數(shù)被樣本中的個體數(shù)整除.
例3.要從高一(1)班40名學生中隨機抽選8人去參加一項活動,分別用抽簽法和隨機數(shù)表法進行抽簽,并寫出過程.
思路解析
本題考查抽簽法和隨機數(shù)表法的步驟應用.先將40名學生編號,然后按抽簽法和隨機數(shù)表法的步驟進行抽樣即可.
解:抽簽法:
將全班40名學生編號,可編號為00,01,02,…,39,并把號碼寫在形狀、大小相同的小球上,然后將這些號簽放在同一個箱子中,攪拌均勻.每次從中抽出一個號簽,連續(xù)抽取8次,便可得到一個容量為8的樣本,參加比賽的8人便產(chǎn)生了.當然,也可以一次從中取出8個號簽.
隨機數(shù)表法:
第一步,先將這40名學生編號,可以編為00,01,02,…,39.
第二步,在附錄1隨機數(shù)表中任選出一個數(shù)作為開始.例如從第8行第9列的數(shù)5開始.
第三步,從選定的數(shù)字5開始,向右讀下去,得到第一個兩位數(shù)字號碼59,由于59>39,將它去掉;繼續(xù)向右讀,得到16,將它取出;繼續(xù)下去,又得到19,10,12,07,39,38,33.至此,8個樣本已經(jīng)取滿,于是,所要抽取的樣本號碼是:16,19,10,12,07,39,38,33.參加比賽的8人便產(chǎn)生了.
綠色通道
簡單隨機抽樣的方法適用于總體中個體數(shù)較少時.在用抽簽法抽取樣本時,為了體現(xiàn)抽簽的客觀性和公平性,在制作號簽時,一定要注意使號簽的大小、形狀都相同.
利用隨機數(shù)表法抽樣本時,起始數(shù)字可以隨便選擇,在讀數(shù)時,讀數(shù)的方向可以向右,也可以向左、向上、向下等等,只要具有一定的規(guī)律就可以.如果總體中個體的個數(shù)不多于100個,我們一般用兩位數(shù)表,即將數(shù)表中的數(shù)碼兩兩連在一起,如01,23,…,99.
例4.在1 000個有機會中獎的號碼(編號為000~999)中,在公證部門監(jiān)督下按照隨機抽取的方法確定后兩位為88的號碼為中獎號碼,這是運用哪種抽樣方法來確定中獎號碼的?依次寫出這10個中獎號碼.
思路解析
由于總體中個體的個數(shù)較多,且被抽取的號碼有一定的規(guī)律性,故不宜采用隨機抽樣,因為隨機抽樣抽取的號碼具有隨機性,所以宜采用系統(tǒng)抽樣.
解:題中運用了系統(tǒng)抽樣的方法來確定中獎號碼,中獎號碼依次為088,188,288,388,488,588,688,788,888,988.
綠色通道
若題目中出現(xiàn)判斷采用何種抽樣方法時,可根據(jù)各抽樣方法的定義來判斷.利用系統(tǒng)抽樣的方法抽取樣本時,如果規(guī)則已給出,則按題中給出的規(guī)則抽取樣本即可.
例5.為了考察某校的教學水平,將抽查這個學校高三年級的部分學生的本學年考試成績.為了全面地反映實際情況,采用以下三種方式進行抽查(已知該校高三年級共有20個教學班,并且每個班內(nèi)的學生已經(jīng)按隨機方式編好了學號,假定該校每班學生人數(shù)都相同):
①從全年級20個班中任意抽取一個班,再從該班中任意抽取20人,考察他們的學習成績;
②每個班抽取1人,共計20人,考察這20個學生的成績;
③把學生按成績分成優(yōu)秀、良好、普通三個級別,從中抽取100名學生進行考察(已知:若按成績分,該校高三學生中優(yōu)秀生共150人,良好生共600人,普通生共250人).
根據(jù)上面的敘述,試回答下列問題:
(1)上面三種抽取方式中,其中總體、個體、樣本分別指的是什么?每一種抽取方式抽取的樣本中,其樣本容量分別是多少?
(2)上面三種抽取方式中各自采用何種抽取樣本的方法?
(3)試分別寫出上面三種抽取方式各自抽取樣本的步驟.
思路解析
本題目主要考查數(shù)理統(tǒng)計中的一些基本概念和基本方法.做這種題目時,應該注意敘述的完整性和條理性.
解:(1)這三種抽取方式中,其總體都是指該校高三全體學生本年度的考試成績;個體都是指高三年級每個學生本年度的考試成績.其中第一種抽取方式中樣本為所抽取的20名學生本年度的考試成績,樣本容量為20;第二種抽取方式中樣本為所抽取的20名學生本年度的考試成績,樣本容量為20;第三種抽取方式中樣本為所抽取的100名學生本年度的考試成績,樣本容量為100.
(2)上面三種抽取方式中,第一種方式采用的方法是簡單隨機抽樣法;第二種方式采用的方法是系統(tǒng)抽樣法和簡單隨機抽樣法;第三種方式采用的方法是分層抽樣法和簡單隨機抽樣法.
(3)第一種方式抽樣的步驟如下:
第一步:在這20個班中用抽簽法任意抽取一個班;
第二步:從這個班中按學號用隨機數(shù)表法或抽簽法抽取20名學生,考查其考試成績.
第二種方式抽樣的步驟如下:
第一步:在第一個班中,用簡單隨機抽樣法任意抽取某一個學生,記其學號為a;
第二步:在其余的19個班中,選取學號為a的學生,共計19人.
第三種方式抽樣的步驟如下:
第一步:分層.
因為若按成績分,其中優(yōu)秀生共150人,良好生共600人,普通生共250人,所以在抽取樣本時,應該把全體學生分成三個層次.
第二步:確定各個層次抽取的人數(shù).
因為樣本容量與總體的個體數(shù)比為:100∶1000=1∶10,所以在每個層次抽取的個體數(shù)依次為,,,即15,60,25.
第三步:按層次分別抽取.
在優(yōu)秀生中用簡單隨機抽樣法抽取15人;
在良好生中用簡單隨機抽樣法抽取60人;
在普通生中用簡單隨機抽樣法抽取25人.
綠色通道
弄清考察對象是明確總體、個體、樣本的關(guān)鍵,這里考察的對象指的是數(shù)據(jù).樣本中有多少個個體,樣本容量就是多少.
總體、個體、樣本的考察對象是同一的,所不同的是范圍的大小.樣本容量只是樣本中個體的數(shù)目,不能帶單位.被抽取出來的考生的考試成績,只是總體的一個樣本,抽取樣本的目的,是為了用這個樣本所反映出來的情況去估計總體的情況.
判斷采用何種抽樣方法時,應充分理解三種抽樣方法的定義.
利用抽簽法時一定要體現(xiàn)抽簽的客觀性和公平性.
利用隨機數(shù)表法時,要注意數(shù)字的組合.
采用系統(tǒng)抽樣法時,確定起始號后,一定要按規(guī)則抽取其余的樣本.
采用分層抽樣法時應先將總體按一定的標準分層;接著要計算樣本容量與總體的個體的比,以確定各層中應抽取的樣本容量,最后在每一層進行抽樣,抽樣時根據(jù)各層中個體的個數(shù)選擇適當?shù)某闃臃椒?個體數(shù)較少用簡單隨機抽樣,當個體個數(shù)較多時可采用系統(tǒng)抽樣.
鏈接地址:http://www.820124.com/p-2618963.html