《李春喜《生物統(tǒng)計學》第三版--課后作業(yè)答案》由會員分享,可在線閱讀,更多相關《李春喜《生物統(tǒng)計學》第三版--課后作業(yè)答案(44頁珍藏版)》請在裝配圖網上搜索。
《生物統(tǒng)計學》第三版 課后作業(yè)答案
(李春喜、姜麗娜、邵云、王文林編著)
第一章 概論(P7)
習題1.1 什么是生物統(tǒng)計學?生物統(tǒng)計學的主要內容和作用是什么?
答:(1)生物統(tǒng)計學(biostatistics)是用數理統(tǒng)計的原理和方法來分析和解釋生物界各種現(xiàn)象和實驗調查資料,是研究生命過程中以樣本來推斷總體的一門學科。
(2)生物統(tǒng)計學主要包括實驗設計和統(tǒng)計推斷兩大部分的內容。其基本作用表現(xiàn)在以下四個方面:①提供整理和描述數據資料的科學方法;②確定某些性狀和特性的數量特征;③判斷實驗結果的可靠性;④提供由樣本推斷總體的方法;⑤提供實驗設計的一些重要原則。
習題1.2 解釋以下概念:總體、個體、樣本、樣本容量、變量、參數、統(tǒng)計數、效應、互作、隨機誤差、系統(tǒng)誤差、準確性、精確性。
答:(1)總體(populatian)是具有相同性質的個體所組成的集合,是研究對象的全體。
(2)個體(individual)是組成總體的基本單元。
(3)樣本(sample)是從總體中抽出的若干個個體所構成的集合。
(4)樣本容量(sample size)是指樣本個體的數目。
(5)變量(variable)是相同性質的事物間表現(xiàn)差異性的某種特征。
(6)參數(parameter)是描述總體特征的數量。
(7)統(tǒng)計數(statistic)是由樣本計算所得的數值,是描述樣本特征的數量。
(8)效應(effection)試驗因素相對獨立的作用稱為該因素的主效應,簡稱效應。
(9)互作(interaction)是指兩個或兩個以上處理因素間的相互作用產生的效應。
(10)實驗誤差(experimental error)是指實驗中不可控因素所引起的觀測值偏離真值的差異,可以分為隨機誤差和系統(tǒng)誤差。
(11)隨機誤差(random)也稱抽樣誤差或偶然誤差,它是有實驗中許多無法控制的偶然因素所造成的實驗結果與真實結果之間產生的差異,是不可避免的。隨機誤差可以通過增加抽樣或試驗次數降低隨機誤差,但不能完全消。
(12) 系統(tǒng)誤差(systematic)也稱為片面誤差,是由于實驗處理以外的其他條件明顯不一致所產生的傾向性的或定向性的偏差。系統(tǒng)誤差主要由一些相對固定的因素引起,在某種程度上是可控制的,只要試驗工作做得精細,在試驗過程中是可以避免的。
(13) 準確性(accuracy)也稱為準確度,指在調查或實驗中某一實驗指標或性狀的觀測值與其真值接近的程度。
(14) 精確性(precision)也稱精確度,指調查或實驗中同一實驗指標或性狀的重復觀測值彼此接近程度的大小。
(15)準確性是說明測定值堆真值符合程度的大小,用統(tǒng)計數接近參數真值的程度來衡量。精確性是反映多次測定值的變異程度,用樣本間的各個變量間變異程度的大小來衡量。
習題1.3 誤差與錯誤有何區(qū)別?
答:誤差是指實驗中不可控制因素所引起的觀測值偏離真值的差異,其中隨機誤差只可以設法降低,但不能避免,系統(tǒng)誤差在某種程度上可控制、可克服的;而錯誤是指在實驗過程中,人為的作用所引起的差錯,是完全可以避免的。
第二章 實驗資料的整理與特征數的計算(P22、P23)
習題2.1 什么是次數分布表?什么是次數分布圖?制表和繪圖的基本步驟有哪些?制表和繪圖時應注意些什么?
答:(1)對于一組大小不同的數據劃出等距的分組區(qū)間(稱為組距),然后將數據按其數值大小列入各個相應的組別內,便可以出現(xiàn)一個有規(guī)律的表式,這種統(tǒng)計表稱之為次數分布表。
(2)次數分布圖是指把次數分布資料畫成圖狀,包括條形圖、餅圖、直方圖、多邊形圖和散點圖。
(3)制表和繪圖的基本步驟包括:①求全距;②確定組數和組距;③確定組限和組中值;④分組,編制次數分布表。
(4)制表和繪圖時需要注意的是事先確定好全距、組數、組距、各組上下限,再按觀測值的大小來歸組。
習題2.2 算數平均數與加權數形式上有何不同?為什么說它們的實質是一致的?
答:(1)形式不同在于計算公式的不同:算數平均數的計算公式為M =;
加權平均數的計算公式為M =。
(2)因為它們反映的都是同一組數據的平均水平。
習題2.3 平均數與標準差在統(tǒng)計分析中有什么作用?它們各有哪些特性?
答:(1)平均數(mean)的用處:①平均數指出了一組數據資料內變量的中心位置,標志著資料所代表性狀的數量水平和質量水平;②作為樣本或資料的代表數據與其它資料進行比較。
(2)平均數的特性:①離均差之和等于零;②離均差平方和為最小。
(3)標準差(standard deviation)的用處:①標準差的大小,受實驗或調查資料中多個觀測值的影響,如果觀測值與觀測值之間差異較大,其離均差也大,因而標準差也大,反之則??;②在計算標準差時,如果對各觀測值加上火減去一個常數a,標準差不變;如果給各觀測值乘以或除以一個常數a,則所得的標準差擴大或縮小了a倍;③在正態(tài)分布中,一個樣本變量的分布可以作如下估計: s內的觀測值個數約占觀測值總個數的68.26%,2s內的觀測值個數約占總個數的95.49%,3s內的觀測值個數約占觀測值總個數的99.73%。
(4)標準差的特性: ①表示變量的離散程度,標準差小,說明變量的分布比較密集在平均數附近,標準差大,則說明變量的分布比較離散,因此,可以用標準差的大小判斷平均數代表性的強弱;②標準差的大小可以估計出變量的次數分布及各類觀測值在總體中所占的比例;③估計平均數的標準誤,在計算平均數的標準誤時,可根據樣本標準差代替總體標準差進行計算;④進行平均數區(qū)間估計和變異系數的計算。
習題2.4 總統(tǒng)和樣本的平均數、標準差有什么共同點?又有什么聯(lián)系和區(qū)別?
答:(1)總體和樣本的平均數都等于資料中各個觀測值的總和除以觀測值的個數所得的商。二者區(qū)別在于,總體平均數用表示,=,公式中分母為總體觀測值的個數N,樣本平均數用=,公式中的分分母為樣本觀測值的個數n。樣本平均數是總體平均數的無偏估計值。
(2)總體和樣本的標準差都等于離均差的平方和除以樣本容量。二者的區(qū)別在于,總體標準差用σ表示,σ=(x-x)2N,分母上總體觀測值的個數N;標準差用s表示,s=(x-x)2n-1,分母上是樣本自由度n-1。樣本標準差s是總體標準差σ的無偏估計值。
習題2.5
答:見下圖——
100例30-40歲健康男子血清總膽固醇(mol/L)的次數分布表
組限(mol/L)
組中值(mol/L)
次數
頻率
累積頻率
2.60-
2.870
2
0.02
0.02
3.10-
3.370
8
0.08
0.10
3.60-
3.850
12
0.12
0.22
4.10-
4.375
24
0.24
0.46
4.60-
4.845
20
0.20
0.66
5.10-
5.325
18
0.18
0.84
5.60-
5.825
7
0.07
0.91
6.10-
6.345
8
0.08
0.99
6.60-
0.000
0
0.00
0.99
7.10-
7.220
1
0.01
1.00
習題2.6
答:見下圖——
這100例男子的血清總膽固醇基本呈正態(tài)分布,中間4.1-5.1mol/L的最多,兩邊少,但6.6-7.1 mol/L的沒有。
習題2.7
答:見下圖——
由上表可知:平均數μ=4.7389,標準差s=0.86665,而CV=s /μ* 100% =18%
習題2.8
答:由習題2.7的表可知:中位數Median=4.6600,平均數μ=4.7389,兩數相差0.0789,符合正態(tài)分布。
習題2.9
答:分析見下圖:
由上圖可知:“24號”玉米的平均數Μ=20,標準差s=1.24722,而CV=s /Μ* 100% =6.24%;“金皇后”玉米的平均數Μ=20,標準差s=3.39935,而CV=s /Μ* 100% =17.00%,比較二者的變異系數CV,“24號”玉米的的變異系數CV 比“金皇后”玉米的小得多,說明“24號”玉米的整齊度大于“金皇后”玉米。
習題2.10
答:分析見下圖:
由上圖可知,貽貝單養(yǎng)的平均數μ1=42.46,極差R1=53-25=28.00,標準差s1=6.97579,CV1=s1 /μ1 * 100% =16.43%;貽貝與海帶混養(yǎng)的平均數μ2=52.10,極差R1=69-39=30.00,標準差s2=6.33503,CV2=s2 /μ2* 100% =12.16%,雖然單養(yǎng)的極差較小(28),但貽貝與海帶混養(yǎng)的平均數更大(52.10),且混養(yǎng)的變異系數更小,即其整齊度更有優(yōu)勢,由此得出,貽貝與海帶混養(yǎng)的效果更好。
第三章 概率與概率分布(P48)
習題3.1 試解釋必然事件、不可能事件和隨機事件。舉出幾個隨機事件例子。
答:(1)必然事件(certain event)是指在一定條件下必然出現(xiàn)的事件;相反,在一定條件下必然不出現(xiàn)的事件叫不可能事件(impossible);而在某些確定條件下可能出現(xiàn),也可能不出現(xiàn)的事件,叫隨機事件(random event)。
(2)例如,發(fā)育正常的雞蛋,在39℃下21天會孵出小雞,這是必然事件;太陽從西邊出來,這是不可能事件;給病人做血樣化驗,結果可能為陽性,也可能為陰性,這是隨機事件。
習題3.2 什么是互斥事件?什么是對立事件?什么是獨立事件?試舉例說明。
答:(1)事件A和事件B不能同時發(fā)生,即AB=V,那么稱事件A和事件B為互斥事件(mutually exclusion event),如人的ABO血型中,某個人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。
(2)事件A和事件B必有一個發(fā)生,但二者不能同時發(fā)生即A+B=U,AB=V,則稱事件A與事件B為對立事件(contrary event),如拋硬幣時向上的一面不是正面就是反面。事件A與事件B的發(fā)生毫無關系。
(3)事件B的發(fā)生與事件A的發(fā)生毫無關系,則稱事件A與事件B為獨立事件(independent event),如第二胎生男生女與第一臺生男生女毫無關系。
習題3.3 什么是頻率?什么是概率?頻率如何轉化為概率?
答:(1)事件A在n次重復試驗中發(fā)生了m次,則比值m/n稱為事件A發(fā)生的頻率(frequency),記為W(A)。
(2)事件A在n次重復試驗中發(fā)生了m次,當試驗次數n不斷增加時,事件A發(fā)生的頻率W(A)就越來越接近某一確定值p,則p即為事件A發(fā)生的概率(probability)。
(3)二者的關系是:當試驗次數n充分大時,頻率轉化為概率 。
習題3.4 什么是正態(tài)分布?什么是標準正態(tài)分布?正態(tài)分布曲線有何特點?u和δ 對正態(tài)分布曲線有何影響?
答:(1)正態(tài)分布是一種連續(xù)型隨機變量的概率分布,它的分布特征是大多數變量圍繞在平均數左右,由平均數到分布的兩側,變量數減小,即中間多,兩頭少,兩側對稱。
(2)μ=0,σ=1的正態(tài)分布為標準正態(tài)分布,記為N(0,1)。
(3)正態(tài)分布具有以下特點:①正態(tài)分布曲線是以平均數μ為峰值的曲線,當x=μ時,f(x)取最大值;②正態(tài)分布是以μ為中心向左右兩側對稱的分布 ③的絕對值越大,f(x)值就越小,但f(x)永遠不會等于0,所以正態(tài)分布以x軸為漸近線,x的取值區(qū)間為(-∞,+∞); ④正態(tài)分布曲線完全由參數μ和s來決定 ⑤正態(tài)分布曲線在x=μs處各有一個拐點;⑥正態(tài)分布曲線與x軸所圍成的面積必定等于1。
(4)正態(tài)分布具有兩個參數μ和s,μ決定正態(tài)分布曲線在x軸上的中心位置,μ減小曲線左移,增大則曲線右移;s決定正態(tài)分布曲線的展開程度,s越小曲線展開程度越小,曲線越陡,s越大曲線展開程度越大,曲線越矮寬。
習題3.5
答:查附表1可得:
(1)P=(0.3<μ<1.8)=F(μ=1.8)-F(μ=0.3)=0.96407-0.6107=0.3533
(2)P=(-1<μ<1)=F(μ=1)-F(μ=-1)=0.8413-0.1587=0.6826
(3)P=(-2<μ<2)=F(μ=2)-F(μ=-2)=0.97725-0.02275=0.9545
(4)P=(-1.96<μ<1.96)=F(μ=1.96)-F(μ=-1.96)=0.97500-0.02500=0.9500
(5)P=(-2.58<μ<2.58)=F(μ=2.58)-F(μ=-2.58)=0.99506-0.00494=0.9901
習題3.6
解:因為x服從μ=4,σ=4的正太分布N(4,16),故通過標準化轉換公式u=可轉化為:
(1) P(-3
-1.5)→→ P(μ>-1.375)≈P(μ>-1.38)
P=(μ>-1.38)=1-F(μ= -1.38)=1-0.08379=0.91621
(4) P(x≥-1)→→ P(μ>-1.25)
P=(μ≥-1.25)=1-F(μ= -1.25)=1-0.1056=0.89440
習題3.7
解:(1) 根據基因分離定律和基因自由組合定律可知:F1代非糯稻Ww與糯稻ww回交,F(xiàn)2代糯稻和非糯稻的概率均為1/2,其中糯稻有200*1/2=100株,非糯稻有200*1/2=100株。
(2) 糯稻為2000*1/4=500株,非糯稻為2000*3/4=1500株。
習題3.8
解:由題意可知這種遺傳符合泊松分布,P=0.0036
(1) ∵Px=e-λλxx!, λ= np =200*0.0036=0.72,
∴P (1) =0.721*e-0.45 / 1!= 0.72* e-0.45 =0.4591
(2) 調查的株數n應滿足e-λ=e-np =0.01
因此n = =≈1280 (株)
習題3.9
解:此題符合二項分布,n=5,p=0.425,q=1-0.425=0.575
故 “四死一生”的概率P(4)= p4q1 = 5*0.425 4*0.5751 = 0.09378
習題3.10
解:設x服從這一正態(tài)分布。因為x服從μ=16,σ=2的正太分布N(16,4),故通過標準化轉換公式u=可轉化為:
(1) P(1020)→→ P(μ<-2) 或P(μ>2)
∵P1=(μ<-2)=F(μ=-2)=0.02275
P2=(μ>2)=1-F(μ=2)=1-0.97725=0.02275
∴P1 (μ<-2) 或P2 (μ>2)的總概率P=P1+ P2=0.02275+0.02275=0.04550
∴小于12或大于20的數據的百分數為4.55%。
習題3.11
解:(1)查附表3可知,當df =5時:
① P (t= 2.571)=0.05,故P (t≤-2.571)=0.05/2=0.025
② P (t= 4.032)=0.01,故P (t>4.032)=0.01/2=0.005
(2)查附表4可知,當df =2時:
① P (= 0.05) =0.975,故P (≤0.05) =0.975
② P (= 5.99) =0.05,故P (>5.99) =1-0.05=0.95
③ ∵P (= 0.05) =0.975,故P >0.05) = 1-0.975=0.025
P (= 7.38) = 0.025,故P (<7.38) =0.025
∴P (0.05<<7.38)= P (<7.38) - P (>0.05)=0.025-0.025=0
(3)查附表5可知,當df1 =3,df2 =10時:
① P (F>3.71)=0.05
②P (F>6.55)=0.01
第四章 統(tǒng)計推斷(P78-79)
習題4.1 什么是統(tǒng)計推斷?統(tǒng)計推斷有哪兩種?其含義是什么?
答:(1)統(tǒng)計推斷(statistical inference)是根據總體理論分布由一個樣本或一系列樣本所得的結果來推斷總體特征的過程。
(2)統(tǒng)計推斷主要包括參數估計和假設檢驗兩個方面。
(3)①假設檢驗是根據總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設,然后由樣本的實際結果,經過一定的計算,作出在一定概率水平(或顯著水平)上應該接受或否定的哪種假設的推斷。
②參數估計則是由樣本結果對總體參數在一定概率水平下所做出的估計。參數估計包括點估計(point estimation)和區(qū)間估計(interval estimation)。
習題4.2 什么是小概率原理?它在假設檢驗中有什么作用?
答:(1)小概率原理(little probability)是指概率很小的事件在一次試驗中被認為是幾乎不可能會發(fā)生的,一般統(tǒng)計學中常把概率概率小于0.05或0.01的事件作為小概率事件。
(2) 它是假設檢驗的依據,如果在無效假設H0成立的條件,某事件的概率大于0.05或0.01,說明無效假設成立,則接受H0,否定HA;如果某事件的概率小于0.05或0.01,說明無效假設不成立,則否定H0,接受HA。
習題4.3 假設檢驗中的兩類錯誤是什么?如何才能少犯兩類錯誤?
答:(1)在假設檢驗中如果H0是真實的,檢驗后卻否定了它,就犯了第一類錯誤,即α錯誤或棄真錯誤;如果H0不是真實的,檢驗后卻接受了它,就犯了第二類錯誤,即β錯誤或納偽錯誤。
(3) 假設檢驗中的兩類錯誤是棄真錯誤和取偽錯誤。為了減少犯兩類錯誤的概率要做到:①顯著水平α的取值不可以太高也不可太低,一般去0.05作為小概率比較合適,這樣可以使犯兩類錯誤的概率都比較小;②盡量增加樣本容量,并選擇合理的實驗設計和正確的實驗技術,以減小標準誤,減少兩類錯誤。
習題4.4 什么叫區(qū)間估計?什么叫點估計?置信度與區(qū)間估計有什么關系?
答:(1)區(qū)間估計(interval estimation)指根據一個樣本的觀測值給出總體參數的估計范圍,給出總體參數落在這一區(qū)間的概率。
(2)點估計(point estimation)是指從總體中抽取一個樣本,根據樣本的統(tǒng)計量對總體的未知參數作出一個數值點的估計。
(3)置信度與區(qū)間估計的關系為;對于同一總體,置信度越大,置信區(qū)間就越小,置信度越小,置信區(qū)間越大。
習題4.5
解:(1)①假設,即改變餌料后對蝦體重無顯著變化;
,即改變餌料后對蝦體重顯著變化。
②由于置信度,確定顯著水平。
③計算統(tǒng)計量:
④作出推斷:由于,否定,接受。認為改變餌料后對蝦體重顯著變。
(2)鮮活與人工配餌料各半喂養(yǎng)方式對蝦體重的點估計為:
(3)鮮活與人工配合餌料各半喂養(yǎng)方式下對蝦體重的區(qū)間估計為:
推斷:認為采用鮮活與人工配合餌料各半喂養(yǎng)方式下對蝦體重為19.7648~20.2352g,這個估計置信度為95%。
習題4.6
解: (1)假設H0:該測定結果與常規(guī)枝條含氮量沒有顯著差異;
HA:該測定結果與常規(guī)枝條含氮量有顯著差異。
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS單樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知 P=0.719>α=0.05 ,故接受原假設即接受H0,否定HA認為該測定結果與常規(guī)枝條含氮量沒有顯著差異。
習題4.7
解:本題中,s1=25.4,n1=128,s2=46.8,n2=69
(1)假設 ,即三化螟兩代每卵塊的卵數沒有顯著差異;
,即三化螟兩代每卵數有顯著差異。
(2)確定顯著性水平。
(3)計算統(tǒng)計量:
(4)作出推斷:因為,否定,接受。認為三化螟兩代每卵塊的卵數有極顯著差異。
習題4.8
解: 首先作F檢驗
(1)假設H0:即北方、南方動物鳥翅長變異一樣;
HA:即北方、南方動物鳥翅長變異不一樣。
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS獨立樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知 P=0.561>α=0.05 ,故接受原假設即接受H0,否定HA ,即北方、南方動物鳥翅長具有同質性。
再進行平均值的檢驗:
(1)假設H0:即北方、南方動物鳥翅長沒有顯著差異;
HA:即北方、南方動物鳥翅長有顯著差異。
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS獨立樣本T檢驗得到如下結果:
(4) 作出推斷:由上表可知 P=0.886>α=0.05 ,故接受原假設即接受H0,否定HA,認為 北方、南方的動物鳥翅沒有顯著差異。
習題4.9
解:(1)假設H0:即治療前后血壓沒有顯著差異;
HA:即治療前后血壓有顯著差異。
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS配對樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知:P值為0.000 <α=0.05 ,故否定H0,接受HA認為中草藥青木香治療高血壓的效果達到極顯著水平。
習題4.10
解:(1)假設H0:即兩種病毒的致病力沒有顯著差異;
HA:即兩種病毒的致病力有顯著差異。
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS配對樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知:P=0.034 <α=0.05,故否定H0,接受HA;認為兩種病毒的致病力間的差異達到顯著水平。
習題4.11
解:檢驗該批棉花種子是否合格
(1)假設H0:P≤0.8,即該批棉花種子不合格;
HA:P > 0.8,即該批棉花種子合格
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS獨立樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知 P=0.261 >α=0.05,故接受H0,否定HA;認為該批棉花種子不合格。
習題4.12
解:(1)假設H0:即兩醫(yī)院乳腺癌手術后5年的生存率間沒有顯著差異;
HA:即兩醫(yī)院乳腺癌手術后5年的生存率間有顯著差異。
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS獨立樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知 P=0.296 >α=0.05,故接受H0,否定HA;即兩醫(yī)院乳腺癌手術后5年的生存率間未達著差異。
習題4.13
解:(1)假設H0:即兩種餌料的方差相同;
HA:即兩種餌料的方差不同
(2)確定顯著性水平α=0.05
(3)計算統(tǒng)計量,經SPSS獨立樣本T檢驗得到如下結果:
(4)作出推斷:由上表可知方齊次性檢驗中P=0.523 >α=0.05,故接受H0,否定HA;認為兩種餌料的方差具有同質性。
第五章 χ2 檢驗 (P89-90)
習題5.1 什么是χ2檢驗?什么情況下的假設檢驗?
答:(1)χ2檢驗是對樣本的頻數分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗。即根據樣本的頻數分布來推斷總體的分布。它屬于自由分布的非參數檢驗。它可以處理一個因素分為多種類別,或多種因素各有多種類別的資料。所以,凡是可以應用比率進行檢驗的資料,都可以用χ2檢驗。
(2)χ2檢驗主要有三種用途:一個樣本方差的同質性檢驗,適合性檢驗和獨立性檢驗。一個樣本方差的同質性檢驗用于檢驗一個樣本所屬總體方差和給定總體方差是否差異顯著,適合性檢驗是比較觀測值與理論值是否符合的假設檢驗;獨立性檢驗是判斷兩個或兩個以上因素間是否具有關聯(lián)關系的假設檢驗。
習題5.2 χ2檢驗的主要步驟有哪些?什么情況下需要進行連續(xù)性矯正?
答 :(1)χ2檢驗的步驟為:
①提出無效假設H0:觀測值與理論值的差異由抽樣誤差引起即觀測值=理論值
備擇假設HA:觀測值與理論值的差值不等于0,即觀測值≠理論值
②確定顯著水平α一般可確定為0.05或0.01
③計算樣本的χ2,求得各個理論次數Ei,并根據各實際次數Oi,代入公式,計算出樣本的χ2。
④進行統(tǒng)計推斷。
(2)自由度時,值需進行連續(xù)性矯正,矯正的為:
習題5.3
解:(1)H0:野兔性別比例符合1:1的比例;
HA:野兔性別比例不符合1:1的比例;
(2)選擇顯著水平為0.05
(3)經SPSS卡方分析得到如下結果:
(4)作出推斷:由上表可知 P=0.015 <α=0.05,故否定H0,接受HA認為野兔性別比例不符合1:1的比例。
習題5.4
解:(1)H0:大麥F2代芒性狀表型的其比率符合9:3:4的理論比率;
HA:其比率不符合9:3:4的理論比率;
(2)選擇顯著水平為0.05
(3)經SPSS卡方分析得到如下結果:
(4)作出推斷:由上表可知 P=0.976 >α=0.05,故接受H0,否定HA,認為大麥F2代芒性狀表型比率符合9:3:4的理論比率。
習題5.5
解:(1)H0:這群兒童性別比合理;
HA:這群兒童性別比不合理;
(2)選擇顯著水平為0.05
(3)經SPSS卡方分析得到如下結果:
(4)作出推斷:由上表可知 P=0.001<α=0.05,故否定H0,接受HA,認為這群兒童性別比不合理。
習題5.6
解:(1)H0:兩種蘋果的耐儲性差異不顯著;
HA:兩種蘋果的耐儲性差異顯著;
(2)選擇顯著水平為0.05;
(3)經SPSS卡方分析得到如下結果:
(4)作出推斷:由上表可知 P=0.274>α=0.05,所以接受H0 ,否定HA,即兩種蘋果的耐儲性差異未達顯著。
習題5.7
解: (1)H0:不同小麥品種與赤霉病的發(fā)生無顯著關系;
HA:不同小麥品種與赤霉病的發(fā)生有顯著關系;
(2)選擇顯著水平為0.05;
(3)經SPSS卡方分析得到如下結果
(4)作出推斷:由上表可知 P值為0.000<α=0.05,故否定H0,接受HA,說明不同小麥品種與赤霉病的發(fā)生有極顯著的關系。
習題5.8
解: (1)H0:灌溉方式與葉片衰老無關;
HA:灌溉方式與葉片衰老有關;
(2)選擇顯著水平為0.05;
(3)經SPSS卡方分析得到如下結果
(4)作出推斷:由上表可知 P=0.229>α=0.05,故接受H0,否定HA說明水稻灌溉方式與葉片衰老無關。
第六章 方差分析(P128-129)
習題6.1 什么是方差分析?方差分析的基本思想是什么?進行方差分析一般有哪些步驟?答:(1)方差分析是對兩個或多個樣本平均數差異顯著性檢驗的方法。
(2)方差分析的基本思想是將測量數據的總變異按照變異來源分為處理效應和誤差效應,并作出數量估計,在一定顯著水平下進行比較,從而檢驗處理效應是否顯著。
(3)方差分析的基本步驟如下:
①將樣本數據的總平方和與自由度分解為各變異因素的平方和與自由度。
②列方差分析表進行F檢驗,分析各變異因素在總變異中的重要程度。
③若F檢驗顯著,對個處理平均數進行多重比較。
習題6.2 什么是多重比較?多重比較有哪些方法?多重比較的結果如何表示?
答:(1)多個平均數兩兩間的相互比較稱為多重比較。
(2)多重比較常用的方法有最小顯著差數法(LSD法)和最小顯著極差法(LSR法),其中最小顯著極差法又有新復極差檢驗(SSR法)和q檢驗法。
(3)多重比較的結果常以標記字母法和梯形法表示。
①標記字母法是將全部平均數從大到小依次排列,然后再最大的平均數上標字母a,將該平均數與以下各平均數相比,凡相差不顯著的都標上字母a,直至某個與之相差顯著的則標以字母b。再以該標有b的平均數為標準,與各個比它大的平均數比較,凡差數差異不顯著的在字母a的右邊加標字母b。然后再以標b的最大平均數為標準與以下未曾標有字母的平均數比較,凡差數不顯著的繼續(xù)標以字母b,直至差異顯著的平均數標以字母c,再與上面的平均數比較。如此重復進行,直至最小的平均數有了標記字母,并與上面的平均數比較后為止。這樣各平均數間,凡有一個相同標記的字母即為差異不顯著,凡具不同標記的字母即為差異顯著。差異極顯著標記方法同上,用大寫字母標記。
②梯形法是將各處理的平均數差數按梯形列于表中,并將這些差數進行比較。差數>LSD(LSR)0.05說明處理平均數間的差異達到顯著水平,在差數的右上角標上“*”號;差數>LSD(LSR)0.01,說明處理平均數間的差異達到極顯著水平,在差數的右上角標上“**”號。差數< LSD(LSR)0.05,說明差異不顯著。
習題6.3 方差分析有哪些基本假定?為什么有些數據需經過轉換后才能進行方差分析?
答:(1)方差分析有3個基本假定,即正態(tài)性、可加性和方差同質性。方差分析有效性是建立在3個基本假定的基礎上的。
(2) 在研究中會出現(xiàn)一些樣本,其所來自的總體和方差分析的基本假定相抵觸,這些數據在進行方差分析之前必須經過適當的處理即數據轉換來變更測量標尺。
習題6.4
解:根據題目所給信息可知該題屬于組內觀測次數相等的單因素方差分析,SPSS方差分析,結果如下:
不同濃度氟化鈉溶液處理芽長資料的方差分析結果見下表:
由上述方差分析計算所得到的F值達到極顯著水平,表明不同濃度氟化鈉容易處理種子后,對芽長有極顯著的影響。
用LSD法、SSR法、q法進行多重比較的結果見下列表格:
(1)不同濃度氟化鈉處理芽長資料差異顯著性(LSD檢驗)
(2)不同濃度氟化鈉處理芽長資料差異顯著性(q法及SSR法)
多重比較的結論:用LSD法、SSR法、q法進行多重比較的結果是相同的,多重比較結果表明,用氟化鈉浸種后,與對照相比,芽長降低,其中10μg/g與對照相比,差異不顯著;對照與50μg/g,100μg/g差異達到極顯著水平;10μg/g與50μg/g差異達顯著水平,與100μg/g差異達極顯著水平;50μg/g與100μg/g差異不顯著。
習題6.5
解:根據題目所給信息可知該題屬于組內觀測次數不等的單因素方差分析,SPSS方差分析,結果如下:
方差分析結果見下表:
由上述方差分析計算所得到的F值達到極顯著水平,表明母豬對仔豬體重存在極顯著的影響作用。
多重比較檢驗(LSD檢驗)如下:
多重比較結果表明,母豬對仔豬斷奶時體重有極顯著的影響,參試的3頭母豬彼此之間的差異均達極顯著水平。
習題6.6
解:根據題目所給信息可知該題是兩因素無重復觀測值得方差分析,可以分別對品種、室溫這兩個因素的效應進行分析,且品種、室溫均為固定因素,可依固定模型進行分析。
以家兔品種作為因素A,該因素有4個水平;以室溫作為因素B,該因素有7個水平,經SPSS統(tǒng)計分析結果如下:
經F檢驗結果表明:品種和室溫對家兔血糖值的影響均達極顯著水平。
多重比較(LSD檢驗)
(1)品種間比較:
LSD檢驗結果表明,品種Ⅲ與品種Ⅰ、品種Ⅳ差異達極顯著水平;品種Ⅱ與品種Ⅳ差異達極顯著水平。
(2)室溫間比較
溫度(1=35℃,2=30℃,3=25℃,4=20℃,5=15℃,6=10℃,7=5℃。
LSD檢驗結果表明,35℃與25℃,20℃,15℃的溫度差異均達到極顯著水平,與30℃,10℃,5℃的溫度差異達到顯著水平;30℃與20℃,15℃的溫度差異均達到極顯著水平,與35℃,25℃的溫度差異達到顯著水平,與10℃,5℃的溫度差異不顯著;25℃與35℃的溫度差異達到極顯著水平,與30℃,20℃,15℃,5℃的溫度差異達顯著水平,與10℃的溫度差異不顯著;20℃與35℃,30℃,10℃,5℃的差異達到極顯著水平,與25℃的溫度差異達到顯著水平,與15℃的溫度差異不顯著;15℃與35℃,30℃,5℃的溫度差異達到極顯著水平,與25℃,10℃的溫度差異達到顯著水平,與20C的差異不顯著;10℃與35℃,20℃,15℃的溫度差異達顯著水平,與30℃,25℃,5℃的溫度差異不顯著;5℃與20℃,15℃的溫度差異達極顯著,與35℃,30℃,25℃,10℃的溫度差異不顯著。
習題6.7
解:根據題目所給信息可知本題為有重復觀測值的二因素方差分析,原料和發(fā)酵溫度均為固定因素,可按固定模型進行分析,以原料作為因素A,因素A有3個水平;以發(fā)酵溫度作為因素B,因素B有3個水平;每一個處理均重復4次,實驗共有36個觀測值。經SPSS方差分析,得到如下結果:
經過方差分析可知:原料、溫度間的差異均達極顯著水平,原料X溫度的差異達顯著水平。
多重比較(LSD檢驗)
原料的檢驗:
溫度的檢驗:
經過多重比較可知:該物質比較適宜的條件是:原選A1,溫度選30℃。
習題6.8
解:根據題目所給信息可知,此題為3因素方差分析,且3個因素均為固定因素,可依固定模型進行分析,數據共有60個。經SPSS方差分析,得到如下結果:
由方差分析F值可見:處理時間、濃度、種子,類型、處理時間X濃度、濃度X種子類型和處理時間X濃度X種子類型均達極顯著差異,而處理時間X種子類型未達顯著性差異。
第七章 抽樣原理與方法(P131-142)
習題7.1 什么叫抽樣調查?抽樣調查有什么意義?P131
答:(1)抽樣調查(sampling survey)就是采用科學的方法,從所研究的總體中抽取一定數量的個體構成樣本,通過對樣本的調查研究,進而對總體做出推斷的方法。
(2) 抽樣調查的意義:節(jié)省人力、物力、財力和時間的同時,減少試驗誤差,提高試驗的精確度,取得真實可靠的試驗資料,為統(tǒng)計分析得出正確的推斷和結論打下基礎。
習題7.2 常用的抽樣調查有哪些基本方法?試比較其優(yōu)缺點及適用對象。
答:(1)常用的抽樣調查方法有隨機抽樣,順序抽樣和典型抽樣。
(2)隨機抽樣是指在抽樣過程中,總體內所有個體都具有相同的被抽取的概率。由于抽樣的隨機性,可以正確的估計試驗誤差,從而推出科學合理的結論。隨機抽樣可分為以下幾種方法:簡單隨機抽樣,分層隨機抽樣,整體抽樣和雙重抽樣。
①簡單隨機抽樣的結果可用統(tǒng)計方法進行分析,從而對總體作出推斷,并對推斷的可靠性作出度量。適用于個體間差異較小,所需抽取的樣本單位數較小的情況。對于那些具有某種趨向或差異明顯和點片式差異的總體不宜使用。
②分層隨機抽樣是一種混合抽樣。其特點是將總體按變異原因或程度劃分成若干區(qū)層,然后再用簡單隨機抽樣方法,從各區(qū)層按一定的抽樣分數抽選抽樣單位。分層隨機抽樣具有以下優(yōu)點:①若總體內各抽樣單位間的差異比較明顯,可以把總體分為幾個比較同質的區(qū)層,從而提高抽樣的準確度;②分層隨機抽樣類似于隨機區(qū)組設計,既運用了隨機原理,也運用了局部控制原理,這樣不僅可以降低抽樣誤差,也可以運用統(tǒng)計方法來估算抽樣誤差。
③整體抽樣是把總體分成若干群,以群為單位,進行隨機抽樣,對抽到的樣本作全面調查,因此也稱為整群抽樣。整體抽樣具有以下優(yōu)點:①一個群只要一個編號,因而減少了抽樣單位編號數,且因調查單位數減少,工作方便;②與簡單隨機抽樣相比較,它常常提供較為準確的總體估計值,特別是害蟲危害作物這類不均勻的研究對象,采用整體抽樣更為有利;③只要各群抽選單位相等,整體抽樣也可提供總體平均數的無偏估計。
④雙重抽樣是在抽樣調查時要求隨機抽出兩個樣本,涉及兩個變量。雙重抽樣具有以下兩個優(yōu)點:①對于復雜性狀的調查研究可以通過僅測量少量抽樣單位而獲得相應于大量抽樣單位的精確度;②當復雜性狀必須通過破壞性測定才能調查時,則僅有這種雙重抽樣方法可用。
(2)順序抽樣是按某種既定順序從總體中抽取一定數量的個體構成樣本。抽樣順序的優(yōu)點表現(xiàn)在:①可避免抽樣時受人們主觀偏見的影響,而簡便易行;②容易得到一個按比例分配的樣本;③如果樣本的觀察單位在總體分布均勻,其取樣個體在總體內分布較均勻,這時采用順序抽樣的抽樣誤差較小。其缺點表現(xiàn)在:①如果總體內存在周期性變異或單調增﹙減﹚趨勢時,則很可能會得到一個偏差很大的樣本,產生明顯的系統(tǒng)誤差;②順序抽樣得到的樣本并不是彼此獨立的,因此,對抽樣誤差的估計只是近似的。通過順序抽樣的方法,不能計算抽樣誤差,估計總體平均數的置信區(qū)間。
(3)典型抽樣是根據初步資料或經驗判斷,有意識、有目的的選取一個典型群體作為樣本進行調查記載,以估計總體。這種抽樣方法完全依賴于調查工作者的經驗和技能,結果不穩(wěn)定,且沒有運用隨機原理,因而無法估計抽樣誤差。典型抽樣多用于大規(guī)模社會經濟調查,而在總體相對較小或要求估算抽樣誤差時,一般不采用這種方法。
習題7.3
解:本題為平均數資料樣本量的確定,由題意可知:s=3.3,允許誤差L=0.5
故n====175(頭)
答:該調查方案的樣本容量以175頭仔豬為宜。
習題7.4
解:本題為頻率資料樣本量的確定,由題意可知:p=0.15,q=1-0.15=0.85,允許誤差L=0.03
由于=,以頻率表示的標準誤
故n==567 (只)
答:該調查方案應至少調查567只雞才能達到目的。
習題7.5
解:本題為成對資料樣本量的確定。
由題意可知:,允許誤差 ,≈2
故=(對)
因為按上式計算時,是按n>30的計算所得,求出所需調查6對雞,還得以n=6再做進一步計算,以取得一個穩(wěn)定的n值。
當n=6時,自由度df=n-1=5,=2.571,則:
n=(對)
再以n=10,自由度df=10-1=9,=2.262,計算得:
n=(對)
再以n=8,自由度df=8-1=7,=2.365,計算得:
n=(對)
答:該調查方案應至少調查8對雞才能達到目的。
習題7.6
解:本題為非成對資料樣本量的確定。
由題意可知:,允許誤差。
以α=0.05,n>30,計算,則:
再以n=14,自由度df=14+14-2=26,=2.056,計算得:
再以n=15,自由度df=15+15-2=28,=2.048,計算得:
答:該調查方案中,每組實驗至少應調查15條魚才能達到目的。
習題7.7
解:根據題意可知:n=10,,s=46.59,df=10-1=9,查表得=2.262
故樣本估計標準誤(g)
其95%的置信區(qū)間為:
即這批平菇平均單重有95%的可能性在g范圍內,也就是在區(qū)間(431.474,498.126)內。
第八章 實驗設計及其統(tǒng)計分析(一)(P164-165)
習題8.1 何為試驗設計?生物學試驗的基本要求是什么?
答:(1)試驗設計(experimental design)包括廣義的試驗設計和狹義的試驗設計。廣義的試驗設計是指整個研究課題的設計,包括試驗方案的擬訂,試驗單位的選擇,分組的排列,試驗過程中試驗指標的觀察記載,試驗資料的整理,分析等內容;而狹義的試驗設計則僅是指試驗單位的選擇、分組與排列方法。生物統(tǒng)計學中的試驗設計主要指狹義的試驗設計。
(2)生物學試驗的基本要求是:①試驗目的要明確;②試驗條件要有代表性;③試驗結果要可靠;④試驗結果要能重演。
習題8.2 試解釋什么是處理、處理效應、主效應、互作?
答:(1)處理(treatment)是指對受試對象給予的某種外部干預,是試驗中實施的因子水平的一個組合,又稱為處理因素(treatment factor)。
(2)處理效應(treatment effect)是指處理因素作用于受試對象的反應,是研究結果的最終體現(xiàn)。
(3)主效應(main effect)是指由于因素水平的改變而造成因素效應的改變。
(4)互作(interaction)是指兩個或兩個以上處理因素間的相互作用產生的效應。
習題8.3 簡述試驗誤差的來源及其控制途徑。
答:(1)試驗誤差的來源主要有:①試驗材料固有的差異;②試驗條件不一致;③操作技術不一致;④偶然性因素的影響。
(2)針對試驗誤差來源,控制試驗誤差的途徑主要有:①選擇純合一致的試驗材料;②改進操作管理制度,使之標準化;③精心選擇試驗單位;④采用合適的試驗設計。
習題8.4 試驗設計的基本原理和作用是什么?
答:(1)試驗設計有3項基本原則:重復,隨機和局部控制。
(2)重復原則的主要作用是估計試驗誤差,降低試驗誤差;
隨機原則的主要作用是提供無偏的試驗誤差估計;
局部控制原則的主要作用是降低試驗誤差。
總之,只有遵循重復、隨機、局部控制3項基本原則的試驗設計,才能由試驗獲得真實的處理效應和無偏的、最小的試驗誤差估計,從而對各處理間的比較得出可靠的結論來。
習題8.5 本章講述的常用試驗設計有哪幾種?這些方法各適宜在什么情況下使用?
答:(1)對比設計(comparison design)是一種最簡單的試驗設計方法,適用于單因素試驗。對比設計分為鄰比設計(neighbour comparison design)和間比設計(interphase comparison design)。①鄰比設計的優(yōu)點是簡單易行,精度較高,便于田間觀察評比,缺點是對照小區(qū)太多,一般要占試驗地面積的三分之一,一般處理數為10以內而不宜過多。②間比設計的精度不夠高,但在一個實驗中可以包括較多的處理。
(2)隨機區(qū)組設計(randomized blocks design)既適用于單因素試驗也適用于多因素試驗。該設計不允許處理數太多或太少,太多導致區(qū)組增大,局部控制效率降低,太少誤差的自由度太小,降低假設檢驗的靈敏度,因此最好在10個左右。
(3)平衡不完全區(qū)組設計(balanced incomplete block design, BIB)適用于區(qū)組沒有均一性的時候。平衡不完全區(qū)組設計的優(yōu)點是利用不完全區(qū)組安排試驗處理,而仍可作出各處理間的正確比較。其主要缺點是區(qū)組數必須嚴格按照規(guī)定數目設置,否則各處理間的比較會失去均衡,所以不完全區(qū)組實際的總小區(qū)數較多,即同類試驗的規(guī)模往往比隨機區(qū)組大,因而只有當難以進行隨機區(qū)組試驗時才采用平衡不完全區(qū)組試驗。
習題8.6
解:計算各品種對相鄰CK的百分數
品種
各小區(qū)重復產量Kg/100m2
Ti
對臨近CK的%
Ⅰ
Ⅱ
Ⅲ
CK
20.3
20.0
16.8
57.1
19.03
100.00%
A
20.1
18.4
17.3
55.8
18.60
97.72%
B
19.0
20.0
17.0
56.0
18.67
118.64%
CK
15.7
16.8
14.7
47.2
15.73
100.00%
C
20.7
17.8
16.9
55.4
18.47
117.37%
D
21.6
18.1
15.6
55.3
18.43
114.97%
CK
17.8
16.4
13.9
48.1
16.03
100.00%
E
20.7
14.9
12.8
48.4
16.13
100.62%
F
17.3
14.9
18.6
50.8
16.93
101.40%
CK
19.1
16.2
14.8
50.1
16.70
100.00%
由上表可見:B、C、D三個品種的大豆產量超過對照10%以上,大體上可以認為這三個品種優(yōu)于對照,其他品種A、E、F未超過對照或超過不明顯,即與對照無異。
習題8.6
解:分析見下表:
習題8.7
解:分析見下表:
第十章 直線回歸與相關分析(P204)
習題10.1 什么叫回歸分析?回歸截距和回歸系數的統(tǒng)計意義是什么?
答:(1)回歸分析(regression analysis)是用來研究呈因果關系的相關變量間的關系的統(tǒng)計分析方法,其中表示原因的變量為自變量,表示結果的變量為因變量。
(2)回歸截距是當自變量為零時,因變量的取值,即回歸線在y軸上的截距;
回歸系數是回歸直線的斜率,其含義是自變量改變一個單位,因變量y平均增加或減少的單位數。
習題10.2 直線回歸中總變異可以分解為哪幾部分?每一部分的平方和如何計算?
答:直線回歸中,依變量y是隨機變量,y的總變異()可以分解為兩部分,即由變異引起的變異()和誤差所引起的變異()。。
(1)SSy=y-y2,為依變量的平方和,稱為離均差平方和或者總平方和,記作SSy或SS總。它是的離均差平方和,表示未考慮與的回歸關系時y的變異。
(2),為因變異引起的變異的平方和,稱為回歸平方和(regression sum of squares),記作U 或SS回歸。它反映在的總變異中由于與的直線關系而使變異減小的部分,也就是在總平方和中可以用解釋的部分,即由的變異引起變異的平方和。U越大,說明回歸效果越好。
(3) 為誤差因素引起的平方和,稱為離回歸平方和或殘差平方和(剩余平方和)(residual sum of squares),記作Q、SS離回歸或者SS剩余。它放映了除去與的直線回歸關系外的其余因素引起變化的大小,即反映對的線性影響之外的一切因素對的變異的作用,也就是在總平方和中無法用解釋的部分,即是由誤差因素引起的平方和。
習題10.3 什么叫相關分析?相關系數和決定系數各具有什么意義?
答:(1)相關分析是用來研究呈平行關系的相關變量之間的關系的統(tǒng)計方法。
(2)相關系數(correlation coefficient)表示變量x與變量y相關的程度和性質;
決定系數(coefficient of determination)是相關系數的平方,表示變量x引起y變異的回歸平方和和占y變異總平方和的比率,它只能表示相關的程度而不能表示相關的性質。
習題10.4
鏈接地址:http://www.820124.com/p-10047170.html