《生物統(tǒng)計學(xué) 第3章第一節(jié) 抽樣與抽樣分布》由會員分享,可在線閱讀,更多相關(guān)《生物統(tǒng)計學(xué) 第3章第一節(jié) 抽樣與抽樣分布(49頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、1統(tǒng)計方法統(tǒng)計方法2描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗3樣樣本本總體總體樣本統(tǒng)計量樣本統(tǒng)計量例如:樣本均值例如:樣本均值 比例、方差比例、方差總體均值、總體均值、比例、方差比例、方差第一節(jié)第一節(jié) 抽樣與抽樣分布抽樣與抽樣分布 第二節(jié)第二節(jié) 參數(shù)估計基本方法參數(shù)估計基本方法第三節(jié)第三節(jié) 總體均值和總體比例的區(qū)間估計總體均值和總體比例的區(qū)間估計第四節(jié)第四節(jié) 兩個總體均值及兩個總體比例之差的估計兩個總體均值及兩個總體比例之差的估計第五節(jié)第五節(jié) 正態(tài)總體方差及兩正態(tài)總體方差比的區(qū)間估計正態(tài)總體方差及兩正態(tài)總體方差比的區(qū)間估計41.1.了解抽樣和抽樣分布的基本概念了解抽樣和抽樣分布的基本概念2.2.理解抽
2、樣分布與總體分布的關(guān)系理解抽樣分布與總體分布的關(guān)系3.3.了解點估計的概念和估計量的優(yōu)良標(biāo)準(zhǔn)了解點估計的概念和估計量的優(yōu)良標(biāo)準(zhǔn)4.4.掌握總體均值、總體比例和總體方差的掌握總體均值、總體比例和總體方差的區(qū)間估計區(qū)間估計5一. 總體、個體和樣本二. 關(guān)于抽樣方法三. 樣本均值的分布與中心極限定理四. 樣本方差的分布五. 兩個樣本方差比的分布六. T 統(tǒng)計量的分布6總體總體(Population)(Population):調(diào)查研究的事物或現(xiàn)象的全體個體個體(Item unit)(Item unit):組成總體的每個元素樣本樣本(Sample)(Sample):從總體中所抽取的部分個體樣本容量樣本容
3、量(Sample size)(Sample size):樣本中所含個體的數(shù)量71.1.概率抽樣:根據(jù)已知的概率選取樣本概率抽樣:根據(jù)已知的概率選取樣本 簡單隨機抽樣:簡單隨機抽樣:完全隨機地抽選樣本完全隨機地抽選樣本 分層抽樣:分層抽樣:總體分成不同的總體分成不同的“層層”,在每一層內(nèi)進行抽樣,在每一層內(nèi)進行抽樣 整群抽樣:整群抽樣:將一組被調(diào)查者(群)作為一個抽樣單位將一組被調(diào)查者(群)作為一個抽樣單位 等距抽樣:等距抽樣:在樣本框中每隔一定距離抽選一個被調(diào)查者在樣本框中每隔一定距離抽選一個被調(diào)查者2.2.非概率抽樣:不是完全按隨機原則選取樣本非概率抽樣:不是完全按隨機原則選取樣本 非隨機抽
4、樣:非隨機抽樣:由調(diào)查人員自由選取被調(diào)查者由調(diào)查人員自由選取被調(diào)查者 判斷抽樣:判斷抽樣:通過某些條件過濾來選擇被調(diào)查者通過某些條件過濾來選擇被調(diào)查者3.3.配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調(diào)查者調(diào)查者891.所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布2.是一種理論概率分布3.隨機變量是 樣本統(tǒng)計量樣本統(tǒng)計量 樣本均值, 樣本比例和樣本方差等4.結(jié)果來自容量相同容量相同的所有所有可能樣本1011設(shè)一個總體,含有4個元素(個體),即總體元素數(shù)N=4。4 個元素分別為X1=1、X2=2、X3=3 、X4=4 總體的均值、方差
5、及分布如下12現(xiàn)從總體中抽取n2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的所有可能的n n = 2 的樣本(共的樣本(共16個)個)13計算出各樣本的均值如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值14式中:M為樣本數(shù)目比較及結(jié)論比較及結(jié)論:1. 樣本均值的均值(數(shù)學(xué)期望)等于總體均值2. 樣本
6、均值的方差等于總體方差的1/n15 = 2.5 2 =1.2516 =10Xn = 4Xn =16當(dāng)總體服從正態(tài)分布N(, 2)時,來自該總體的所有容量為n的樣本的均值 也服從正態(tài)分布, 的數(shù)學(xué)期望為,方差為2/n。即 N(, 2/n)17當(dāng)樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理中心極限定理:設(shè)從均值為,方差為 2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布一個任意分布的總體1819 設(shè)總體服從正態(tài)分布N(, 2 ), X1,X2,Xn為來自該正態(tài)總體的樣本,則樣本方差S2 的分布為將2(n
7、1)稱為自由度為(n-1)的卡方分布卡方分布是統(tǒng)計學(xué)家PearsonPearson于1900年首先提出的??ǚ椒植际侵匾慕y(tǒng)計分布。在假設(shè)檢驗、區(qū)間估計、方差分析、回歸分析和試驗設(shè)計等數(shù)理統(tǒng)計均有重要應(yīng)用。2021 選擇容量為n 的簡單隨機樣本計算樣本方差S2計算卡方值2 = (n-1)S2/2計算出所有的 2值 2 2df=1=1df=4=4df=10=10df=20=20總體1.1.所有可能的樣本均值的標(biāo)準(zhǔn)差,測度所所有可能的樣本均值的標(biāo)準(zhǔn)差,測度所有樣本均值的離散程度有樣本均值的離散程度2.2.小于總體標(biāo)準(zhǔn)差小于總體標(biāo)準(zhǔn)差 ?3.3.計算公式為計算公式為222324設(shè)X1,X2, ,Xn
8、1是來自于一個正態(tài)分布總體X N(1,12 )的一個樣本, Y1,Y2, ,Yn2是來自正態(tài)總體YN(2, 22)的一個樣本,且Xi(i=1,2,,n1),Yi(i=1,2, ,n2)相互獨立,則將F(n1-1 , n2-1 )稱為第一自由度為(n1-1),第二自由度為(n2-1)的F分布25不同自由度的抽樣分布F 分布是統(tǒng)計學(xué)家R. A. FisherR. A. Fisher于1924年首先發(fā)現(xiàn)的。F 分布在假設(shè)檢驗、區(qū)間估計、方差分析、回歸分析和試驗設(shè)計等數(shù)理統(tǒng)計均有重要應(yīng)用。26英國統(tǒng)計學(xué)家威廉西利戈塞特(Willam Sealy Gosset)在1908年提出。2728設(shè)X1,X2,X
9、n是來自正態(tài)總體N(1, 12)的一個樣本, 稱t t 分布分布正態(tài)分布正態(tài)分布不同自由度的不同自由度的t t分布分布一.點估計二.點估計的優(yōu)良性準(zhǔn)則三.區(qū)間估計2930矩估計法矩估計法最小二乘法最小二乘法最大似然法最大似然法順序統(tǒng)計量法順序統(tǒng)計量法估估 計計 方方 法法點點 估估 計計區(qū)間估計區(qū)間估計31321.從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計例如: 用樣本均值作為總體未知均值的估計值就是一個點估計2.點估計沒有給出估計值接近總體未知參數(shù)程度的信息3.點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等331. 用于估計總體某一參數(shù)的隨機
10、變量用于估計總體某一參數(shù)的隨機變量如樣本均值,樣本比例、樣本中位數(shù)等例如: 樣本均值就是總體均值的一個估計量如果樣本均值 x = 3 ,則 3 就是 的估計值2. 2. 理論基礎(chǔ)是抽樣分布理論基礎(chǔ)是抽樣分布34無偏性:無偏性:估計量的數(shù)學(xué)期望等于被估計的總體參數(shù)35無偏無偏有偏有偏36一個方差較小的無偏估計量稱為一個更 有效的估計量。如,與其他估計量相比, 樣本算術(shù)平均值是一個更有效的估計量一致性:一致性:隨著樣本容量的增大,估計量越來越接 近被估計的總體參數(shù)37381.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍2.給出總體參數(shù)落在這一區(qū)間的概率3.例如: 總體均值落在5070之間,置信度為
11、95%39402 已知2 未知 均 值方 差比 例置 信 區(qū) 間41x_XX = Zx1.總體未知參數(shù)落在區(qū)間內(nèi)的概率p1(x1,x2,,xn) 2 (x1,x2,,xn)= 1 - 2. 1 1 - - 為置信度、置信水平或置信概率 為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率 3.常用的置信水平值有 99%, 95%, 90% 相應(yīng)的相應(yīng)的 為0.01,0.05,0.1042431.數(shù)據(jù)的離散程度,用 來測度2.樣本容量3.置信水平 (1 - ),影響 Z 的大小44X = Zx請陳述統(tǒng)計分布的定義和內(nèi)涵陳述中心極限定理的內(nèi)容什么是置信水平47請檢索矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法方法及其在生命科學(xué)領(lǐng)域的具體應(yīng)用示例。兩周后提交。4849