11-第8章單因素方差分析
《11-第8章單因素方差分析》由會員分享,可在線閱讀,更多相關(guān)《11-第8章單因素方差分析(35頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、+第八章 單因素方差分析 第一節(jié) 方差分析的基本問題 一、方差分析要解決的問題 t檢驗(yàn)法適用于樣本平均數(shù)與總體平均數(shù)及兩樣本平均數(shù)間的差異顯著性檢驗(yàn);而多個平均數(shù)間的差異顯著性檢驗(yàn),必須用方差分析法。 1、檢驗(yàn)過程繁瑣 一試驗(yàn)包含5個處理,采用t檢驗(yàn)法要進(jìn)行次兩兩平均數(shù)的差異顯著性檢驗(yàn);若有k個處理,則要作k(k-1)/2次類似的檢驗(yàn)。 表8-1:鹽處理對堿蓬整株鮮重的影響 株號 鹽處理濃度(mM NaCl) 0 100 200 300 400 1 4.51 7.98 8.56 8.37 6.98 2 5.06 7.65 8.64 7.
2、46 5.89 3 4.36 7.32 8.97 8.79 6.54 4 4.82 7.54 9.01 8.05 6.27 5 4.93 7.63 8.32 8.22 6.79 6 4.46 7.22 8.48 8.65 6.44 平均值 4.69 7.56 8.66 8.42 6.49 標(biāo)準(zhǔn)差 0.28 0.27 0.27 0.27 0.39 2、無統(tǒng)一的試驗(yàn)誤差,誤差估計的精確性和檢驗(yàn)的靈敏性低 如表8-1,試驗(yàn)有5個處理,每個處理重復(fù)6次,共有30個觀測值。進(jìn)行t檢驗(yàn)時,每次只能利用兩個處理共12個觀測值估
3、計試驗(yàn)誤差,誤差自由度為2(6-1)=10;若利用整個試驗(yàn)的30個觀測值估計試驗(yàn)誤差,顯然估計的精確性高,且誤差自由度為5(6-1)=25??梢娫谟胻檢法進(jìn)行檢驗(yàn)時,由于估計誤差的精確性低,誤差自由度小,使檢驗(yàn)的靈敏性降低,容易掩蓋差異的顯著性。 3、推斷的可靠性低,檢驗(yàn)的I型錯誤率大 用t檢驗(yàn)法進(jìn)行多個處理平均數(shù)間的差異顯著性檢驗(yàn),由于沒有考慮相互比較的兩個平均數(shù)的秩次問題,因而會增大犯I型錯誤的概率,降低推斷的可靠性。假設(shè)每一對檢驗(yàn)接受零假設(shè)的概率都是1-α=0.95,而且這些檢驗(yàn)都是相互獨(dú)立的,那么10對檢驗(yàn)都接受概率是(0.95)10=0.60,犯錯誤的概率α?=1-0.60=0.
4、40犯I型錯誤的概率明顯增加。 由于上述原因,多個平均數(shù)的差異顯著性檢驗(yàn)不宜用t檢驗(yàn),須采用方差分析法。 二、方差分析的幾個概念 方差分析(analysis of variance)是由英國統(tǒng)計學(xué)家R.A.Fisher于1923年提出的。 這種方法是將a個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應(yīng)于不同變異來源的平方和及自由度,進(jìn)而獲得不同變異來源總體方差估計值;通過計算這些總體方差的估計值的適當(dāng)比值,就能檢驗(yàn)各樣本所屬總體平均數(shù)是否相等。 “方差分析法”是一種在若干能相互比較的資料組中,把產(chǎn)生變異的原因加以區(qū)分開來的方法與技術(shù)” ,方差分析實(shí)質(zhì)上是關(guān)于觀
5、測值變異原因的數(shù)量分析。要掌握方差分析的方法,必須先了解以下幾個基本概念。這幾個概念在科學(xué)研究中必須用到,非常重要。 1、試驗(yàn)指標(biāo)(experimental index) 為衡量試驗(yàn)結(jié)果的好壞或處理效應(yīng)的高低,在試驗(yàn)中具體測定的性狀或觀測的項(xiàng)目稱為試驗(yàn)指標(biāo)。由于試驗(yàn)?zāi)康牟煌?,選擇的試驗(yàn)指標(biāo)也不相同。 如研究鹽處理對玉米生長狀況的影響,常用的生長指標(biāo)是植株鮮重、株高等指標(biāo);如發(fā)現(xiàn)鹽處理影響鮮重、株高等,還要分析為什么鹽處理抑制玉米生長?光合速率是否降低?光合速率為什么降低,是否與色素含量下降有關(guān)?鹽處理還會對玉米造成那些傷害?如是否影響膜透性?葉片中Na+含量是否升高,從而對葉片具有毒害等
6、。所以研究鹽處理對玉米生長的影響,不能只研究一個指標(biāo),要研究鮮重、光合速率、色素含量、膜透性、Na+含量等多個指標(biāo)。 再如研究人體心臟功能常用血壓、心率、心電圖等指標(biāo)。 2、試驗(yàn)因素(experimental factor) 試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素叫試驗(yàn)因素。如研究鹽處理對堿蓬生長的影響,土壤中的鹽濃度就是一個因素,此外影響堿蓬生長的因素還有水分、溫度、光照等,均可作為試驗(yàn)因素。研究不同品系小麥的株高,品系也是一個影響株高的因素,如表8-2就是研究5個小麥品種株高的差異,因?yàn)樾←溨旮邔ζ洚a(chǎn)量影響很大。 當(dāng)試驗(yàn)中考察的因素只有一個時,稱為單因素試驗(yàn); 若同時研究兩個或兩個以
7、上的因素對試驗(yàn)指標(biāo)的影響時,則稱為兩因素或多因素試驗(yàn)。 表8-2:5個小麥品系株高調(diào)查結(jié)果 株號 品 系 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 1 64.6 64.5 67.8 71.8 69.2 2 65.3 65.3 66.3 72.1 68.2 3 64.8 64.6 67.1 70.0 69.8 4 66.0 63.7 66.8 69.1 68.3 5 65.8 63.9 68.5 71.0 67.5 平均值 65.3 64.4 67.3 70.8 68.6 3、因素水平(level of factor)
8、 因素的具體表現(xiàn)或數(shù)量等級稱為因素水平,簡稱水平。如鹽處理濃度這一因素有0、100、200、300、400 mM NaCl等5個水平。小麥品系這一因素也有Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ等5個水平。 4、試驗(yàn)處理(treatment) 在實(shí)驗(yàn)對象上實(shí)施的事先設(shè)計好的具體項(xiàng)目叫試驗(yàn)處理,簡稱處理。進(jìn)行單因素試驗(yàn)時,試驗(yàn)因素的一個水平就是一個處理。如表8-1中鹽處理共有0、100、200、300、400 mM NaCl等5個處理。表8-2中也是5個處理。對于雙因素試驗(yàn)時,處理的個數(shù)等于兩個因素的水平個數(shù)的乘積。表8-3研究的是溫度和原料這兩個因素對酒精產(chǎn)量的影響,是雙因素試驗(yàn),每個因素都又有3個水平,共有3
9、×3=9個處理。 每一個處理可以看作一個總體,每個處理得到的一組數(shù)據(jù)可以看作是從這個處理總體中抽取的一個樣本的數(shù)據(jù)。 表8-3:不同原料和不同酒曲對發(fā)酵酒精產(chǎn)量(kg/100kg)的影響 酒曲種類 原料種類 玉米 高梁 水稻 A 41 43 43 45 47 49 50 45 43 45 43 40 B 31 33 35 34 43 38 35 36 35 38 37 34 C 36 32 33 28 28 32 34 34 30 33 26 29 5、試驗(yàn)單位(experimental unit)
10、 在試驗(yàn)中能接受不同試驗(yàn)處理的獨(dú)立的試驗(yàn)載體叫試驗(yàn)單位。如植物試驗(yàn)中的一株玉米、一株堿蓬;在畜禽、水產(chǎn)試驗(yàn)中, 一只家禽、一只小白鼠、一位病人,即一個動物、植物或人。有時也用一組實(shí)驗(yàn)材料作為一個實(shí)驗(yàn)單位,如研究肥料對產(chǎn)量的影響,每種肥料選5塊地,每塊地是一個試驗(yàn)單位。試驗(yàn)單位是獲得觀測數(shù)據(jù)的單位。 6、重復(fù)(repetition) 在試驗(yàn)中,將一個處理實(shí)施在兩個或兩個以上的試驗(yàn)單位上,稱為處理有重復(fù);處理實(shí)施的試驗(yàn)單位數(shù)目稱為處理的重復(fù)數(shù)。 例如,用100 mMNaCl處理了6株堿蓬,那么這個處理有6個重復(fù);用某種飼料喂4頭豬,就說這個處理(飼料)有4次重復(fù)。 但要注意,并非每一個
11、測量結(jié)果都是一個重復(fù),重復(fù)數(shù)是實(shí)驗(yàn)單位數(shù),是每一個試驗(yàn)對象從頭開始完整的做一遍得到的結(jié)果。如測定葉綠素含量,從一瓶葉綠素提取液中取出5小管提取液,分別測定葉綠素含量得到的5個觀測數(shù)不是5個重復(fù),而是一個,因?yàn)閷?shí)驗(yàn)對象是一個??茖W(xué)的方法是將5個實(shí)驗(yàn)對象(葉片)分別提取,分別測定,不能將5個實(shí)驗(yàn)對象的葉片混在一起提取。再如研究飼料的營養(yǎng),將1頭豬稱重5次和5頭豬各稱重1次是完全不一樣的:1頭豬稱重5次得到的5個結(jié)果是1個重復(fù),5頭豬各稱重1次,才是5個重復(fù)。 以重復(fù)測定代替重復(fù)實(shí)驗(yàn)會減小誤差均方,會使本來差異并不顯著的因素變得顯著,從而得出錯誤的結(jié)論。 以上幾個基本概念是科學(xué)實(shí)驗(yàn)中幾個最重要的
12、常識之一,希望初學(xué)者認(rèn)真體會。方差分析的原理看似復(fù)雜,其實(shí)很簡單。Excel給我們提供了“數(shù)據(jù)分析”函數(shù),下面要講的所有運(yùn)算過程,用Excel函數(shù)都可以快速全自動的得出,我們只需要將我們的原始數(shù)據(jù)輸入Excel工作表就可以了。同樣,后面要講的相關(guān)和回歸分析也完全可以自動運(yùn)算。 三、方差分析的數(shù)學(xué)模型(以單因素試驗(yàn)為例) (一)單因素試驗(yàn)的數(shù)據(jù)描述 假設(shè)某單因素試驗(yàn)有a個處理,每個處理有n次重復(fù),共有an個觀測值。其單因素方差分析試驗(yàn)數(shù)據(jù)的表示方法見表8-4: 表8-4:單因素試驗(yàn)的典型數(shù)據(jù)表 試驗(yàn)次數(shù)或重復(fù)數(shù) 實(shí)驗(yàn)處理數(shù) X1 X2 X3 …… Xi …… Xa
13、 1 x11 x21 x31 …… xi1 …… xa1 2 x12 x22 x32 …… xi2 …… xa2 3 x13 x23 x33 …… xi3 …… xa3 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? j x1j x2j x3j …… xij …… xaj ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? n x1n x2n
14、 x3n …… xin …… xan 總計 …… …… 平均值 …… …… 表中數(shù)據(jù)xij表示第i個處理的第j次觀測值,其中的幾個符號做如下說明: ,表示第i個處理所有數(shù)據(jù)的和; ;(i=1,2,…a;j=1,2,…n),表示第i個處理所有數(shù)據(jù)的平均值。 ,表示所有處理中全部數(shù)據(jù)的總和; ,全部數(shù)據(jù)的總平均值; (二)觀測值的描述 對于上表中的每一個觀測值可用線性統(tǒng)計模型描述: 其中:xij是在第i水平(處理)下的第j次觀測值;μ為所有觀測值的總平均數(shù);αi是第i水平的處理效應(yīng),即因?yàn)榇颂幚矶鸬臄?shù)據(jù)的變異;ε
15、ij是隨機(jī)誤差,即隨機(jī)抽樣誤差。方差分析的目的就是要檢驗(yàn)處理效應(yīng)的大小或有無。 (三)因素處理效應(yīng)和實(shí)驗(yàn)?zāi)P偷姆诸? 1、固定效應(yīng)模型 如果處理效應(yīng)是由固定因素所引起的效應(yīng),就稱為固定效應(yīng)。固定因素是指因素的水平可以嚴(yán)格地人為控制,水平固定后,它的效應(yīng)值αi也是固定的;實(shí)驗(yàn)重復(fù)時可以得到相同的結(jié)果。 如表8-1的試驗(yàn)結(jié)果發(fā)現(xiàn),鹽處理顯著促進(jìn)了堿蓬生長,最適鹽濃度為200 mM NaCl,別人重復(fù)這個試驗(yàn)也會得到同樣的結(jié)果。再如我們調(diào)查上海、北京、廣州、深圳四個城市市的居民收入,調(diào)查結(jié)果發(fā)現(xiàn),四個城市的居民收入顯著不同,上海>深圳>北京≈廣州,其他人調(diào)查也會得到同樣的結(jié)果。可嚴(yán)格人為控制的
16、因素如:幾種不同實(shí)驗(yàn)溫度、幾種不同的化學(xué)藥物濃度、幾個不同的小麥品種、幾個城市等都屬于固定因素。 處理固定因素所用的模型稱為固定效應(yīng)模型,簡稱為固定模型。固定模型的假設(shè)是關(guān)于xij的假設(shè),固定模型的方差分析所得到的結(jié)論只適合于選定的那幾個水平,并不能將其結(jié)論推廣到其他未考慮的水平上。如表8-1的試驗(yàn)結(jié)論“鹽處理顯著促進(jìn)堿蓬的生長”只使用于0、100、200、300、400 mM NaCl這5個濃度,不能說“任何鹽濃度都可以促進(jìn)堿蓬生長”。研究北京、上海、廣州和深圳的居民收入,發(fā)現(xiàn)這四個城市的居民收入有差異,不能說“任意四個城市的居民收入都有差異”。 2、隨機(jī)效應(yīng)模型 如果處理效應(yīng)是由隨機(jī)
17、因素所引起的效應(yīng),就稱為隨機(jī)效應(yīng)。若因素的a個水平是從該因素水平總體中隨機(jī)抽出的樣本,那么各個水平的處理效應(yīng)值αi不是固定的數(shù)值,不能嚴(yán)格的人為控制,實(shí)驗(yàn)重復(fù)時很難得到相同的結(jié)果,這種因素稱為隨機(jī)因素。處理隨機(jī)因素所用的模型稱為隨機(jī)效應(yīng)模型,簡稱為隨機(jī)模型。隨機(jī)效應(yīng)模型的方差分析所得到的結(jié)論可推廣到總體水平上,因?yàn)檫@類實(shí)驗(yàn)是通過樣本對所屬總體作出的推斷。 如探討不同窩的家兔出生重量是否存在差異,隨機(jī)選取了4窩家兔,每窩家兔中均隨機(jī)選了4只幼兔。窩別就是隨機(jī)因素,任何人都不能再得到完全相同的4窩家兔。調(diào)查結(jié)果見表8-5:這4窩幼兔中第I窩出生重最大,別人再隨機(jī)選擇4窩家兔,并不一定還是第I窩出
18、生重最大。表8-5的實(shí)驗(yàn)結(jié)論是:不同窩別的4窩家兔的體重差異顯著,別人調(diào)查任何4窩家兔也會得到同樣的結(jié)論。 表8-5:4窩家兔的出生重(g) 動物號 窩別 Ⅰ Ⅱ Ⅲ Ⅳ 1 34.7 33.2 27.1 32.9 2 33.3 26.0 23.3 31.4 3 26.2 28.6 27.8 25.7 4 31.6 32.3 26.7 28.0 平均值 31.450 30.025 26.225 29.500 再如調(diào)查山東女大學(xué)生身高,隨機(jī)調(diào)查了5所大學(xué),每所大學(xué)隨機(jī)調(diào)查100名,發(fā)現(xiàn)山東各大學(xué)女生身高差異不顯著。其他人隨機(jī)調(diào)查山
19、東5所大學(xué)的女生身高,也會得出同樣的結(jié)論。 從隨機(jī)因素的a個水平的方差分析所得到的結(jié)論,可以推廣到這個因素的所有水平上。這里αi是一個隨機(jī)變量,所檢驗(yàn)的是關(guān)于αi的變異性假設(shè)。 有時隨機(jī)因素和固定因素很難區(qū)分,簡單的說固定因素可以嚴(yán)格的人為控制,固定因素的各水平固定以后,其效應(yīng)值也是固定的,如溫度、鹽濃度等,其結(jié)論只適合固定的這幾個水平。隨機(jī)因素的水平不能嚴(yán)格的人為控制,在各水平固定以后,其效應(yīng)值并不固定,其統(tǒng)計結(jié)論可推廣到總體水平上。 3、混合模型 在多因素試驗(yàn)中,若即包括固定因素,又包括隨機(jī)因素,那么該實(shí)驗(yàn)應(yīng)該用混合實(shí)驗(yàn)?zāi)P瓦M(jìn)行統(tǒng)計分析。如研究生科院男生和女生學(xué)習(xí)成績的差異,男
20、女各選50名同學(xué),隨機(jī)選擇了5門課程成績做比較。那么,課程是隨機(jī)選取的,屬于隨機(jī)因素;男生、女生是人為確定的,屬于固定因素。所以這個實(shí)驗(yàn)屬于混合模型。 由于固定模型、隨機(jī)模型和混合模型在設(shè)計思想上有明顯不同,因此在統(tǒng)計推斷的方法上也有明顯區(qū)別。另外,不同實(shí)驗(yàn)?zāi)P头治龅膫?cè)重點(diǎn)也不完全相同,固定效應(yīng)模型側(cè)重于處理效應(yīng)的估計和檢驗(yàn);隨機(jī)模型側(cè)重于效應(yīng)方差(αi的變異性)的估計和檢驗(yàn)。但對于單因素方差來說,固定模型和隨機(jī)模型的統(tǒng)計方法完全相同,只是統(tǒng)計推斷的假設(shè)和推論不同。 四、方差分析的原理 在一個多處理實(shí)驗(yàn)中,得到的一系列觀察值數(shù)據(jù)變異的原因是多方面的。數(shù)據(jù)的變異可能是處理不同造成的,稱為系
21、統(tǒng)誤差或處理效應(yīng);也可能是隨機(jī)因素造成的,既抽樣的隨機(jī)性造成的,稱為隨機(jī)誤差或試驗(yàn)誤差。方差分析的基本思想就是將測量數(shù)據(jù)的總變異分解為處理效應(yīng)和試驗(yàn)誤差。 (一)兩類誤差 1、隨機(jī)誤差 在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異,稱為隨機(jī)誤差。比如,同一鹽濃度下的不同堿蓬植株鮮重的差異就是受隨機(jī)因素的影響,或者說是由于抽樣的隨機(jī)性所造成的。 2、系統(tǒng)誤差 在因素的不同水平(不同總體)下,各觀察值之間的存在差異。比如,不同鹽濃度處理的堿蓬的植株鮮重不同,這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于鹽處理所造成的,鹽處理效應(yīng)所造成的誤差是由系統(tǒng)因素造成的,稱為系統(tǒng)
22、誤差。 (二)兩類方差 1、處理內(nèi)方差 處理內(nèi)方差指因素的同一水平(同一個總體)下,樣本數(shù)據(jù)的方差。處理內(nèi)方差只包含隨機(jī)誤差。 2、處理間方差 處理間方差指因素的不同水平(不同總體)下,各樣本之間的方差。處理間方差既包括隨機(jī)誤差和系統(tǒng)誤差。 (三)方差的比較 如果不同鹽濃度對植株鮮重沒有影響,那么在處理間方差中只包含有隨機(jī)誤差,而沒有系統(tǒng)誤差。這時,處理間方差與處理內(nèi)方差就應(yīng)該很接近,兩種方差的比值就會接近1。 如果不同的水平對結(jié)果有影響,在處理間方差中除了包含隨機(jī)誤差外,還會包含有系統(tǒng)誤差,這時處理間方差就會大于處理內(nèi)方差,處理間方差與處理內(nèi)方差的比值就會大于1。 當(dāng)這個比
23、值大到某種程度時,就可以說不同水平之間存在著顯著差異。 m1=m2 =m2 =m4 f(X) X 圖8-1:方差分析原假設(shè)圖示 (四)方差分析的假設(shè)(以固定效應(yīng)模型為例) 1、原假設(shè) H0:μ1=μ2=μ3=……=μi或者α1=α2=……=αi=0 接受H0表示每個樣本都來自均值為μ,方差為σ2的同一正態(tài)總體,各水平間不存在處理效應(yīng),每個觀測值都是由總平均數(shù)加上隨機(jī)誤差造成的。 例如研究平均每日食物中肉類比重(0、50、100、250、500克/天)與人的智商的關(guān)系?發(fā)現(xiàn)吃肉多少對智商影響不大。如圖8-1表示,4個總體差異不顯著。 2、備擇假設(shè) HA:mi (i=1,
24、2,3,4)不全相等或者αi至少有一個不等于0。 如果備擇假設(shè)成立,表示各水平間有系統(tǒng)誤差,四個樣本分別來自均值不同的正態(tài)總體。如圖8-2所示,4個總體差異顯著。 例如調(diào)查上海、北京、廣州、深圳四個城市市的居民收入,調(diào)查結(jié)果發(fā)現(xiàn),四個城市的居民收入顯著不同。如圖8-2表示,4個總體差異顯著。 μ11μ21μ31μ4 f(X) X 圖8-2:方差分析備擇假設(shè)圖示 方差分析比較的是兩類誤差(隨機(jī)誤差和系統(tǒng)誤差),以檢驗(yàn)均值是否相等。比較的基礎(chǔ)是方差比,即各部分的誤差占總誤差的比例。如果系統(tǒng)誤差(處理效應(yīng))顯著地不等于隨機(jī)誤差,則幾個總體(處理)均值就是不相等的;反之,均值就是相等
25、的。方差分析的顯著性檢驗(yàn)是F檢驗(yàn)。 五、方差分析的檢驗(yàn)程序(以單因素試驗(yàn)為例) (一)假設(shè) H0:μ1=μ2=μ3=……=μi或者α1=α2=……=αi=0 HA:mi (i=1,2,3,4)不全相等或者αi至少有一個不等于0。 (二)確定顯著性水平α (三)計算統(tǒng)計量 方差是離差平方和除以n-1,即S2=,方差分析就是要把一個試驗(yàn)的總變異依據(jù)變異來源分解為處理間變異和處理內(nèi)變異。 分解的方法是通過將總均方的分子──稱為總離均差平方和,簡稱為總平方和(SST),分解成處理間平方(SSA)和與處理內(nèi)平方和(SSe)兩部分;將總均方的分母──稱為總自由度(dft),剖分成處理間自由
26、度(dfA)與處理內(nèi)自由度(dfe)兩部分。 1、平方和的計算和分解——三種平方和的簡便計算公式 總平方和,SST=SSA+SSe 處理間平方和 處理內(nèi)平方和 這里C稱為矯正項(xiàng), 2、總自由度的計算和分解 總自由度記為dfT=an-1。 處理間自由度記為dfA=a-1。 處理內(nèi)自由度記為dfe=an-a。 dfT=dfA+dfe 3、方差(均方)的計算 各部分平方和除以各自的自由度便得到總均方、處理間均方和處理內(nèi)均方,分別記為MST(或)、MSA(或)和MSe(或)。MSA也稱為處理均方,MSe也稱為誤差均方。 總均方: 處理間均方: 處理內(nèi)均方: 4、顯著性檢
27、驗(yàn)——F檢驗(yàn) 檢驗(yàn)統(tǒng)計量,F(xiàn)值具dfA、dfe自由度。 用F分布的上尾檢驗(yàn),拒絕域?yàn)镕>Fα。 方差分析的方法結(jié)合例子很容易理解,本節(jié)先對方差分析的程序進(jìn)行簡單介紹。方差分析在科研和社會生活中非常重要。 第二節(jié) 固定模型的方差分析 一、固定模型的方差分析程序 (一)提出固定效應(yīng)模型的假設(shè) 在固定模型中,αi是處理平均數(shù)與總平均數(shù)的離差,是個常量,因而:。 原假設(shè)H0:μ1=μ2=μ3=……=μi;或者α1=α2=……=αi=0 備擇假設(shè)HA:μi至少有一個不相等;或至少有一個αi不等于0 (二)平方和與自由度的分解 第一章就介紹過標(biāo)準(zhǔn)差或方差是數(shù)據(jù)變異程度的度量
28、,這里詳細(xì)介紹方差的分解方法,這也是本章的核心內(nèi)容。 方差:離差平方和除以n-1,S2= 在方差分析中是用樣本方差也稱均方(mean squares)來度量資料的變異程度。全部觀測值的總變異可以用總均方來度量。 將總變異分解為處理間變異和處理內(nèi)變異,就是要將總均方分解為處理間均方和處理內(nèi)均方。 分解方法是通過將總均方的分子──稱為總離均差平方和,簡稱為總平方和,分解成處理間平方和與處理內(nèi)平方和兩部分;將總均方的分母──稱為總自由度,分解成處理間自由度與處理內(nèi)自由度兩部分。 1、總平方和的分解 全部觀測值xij與總平均數(shù)的離均差平方和,稱為總平方和,它反映的是全部觀測值的離散或變異
29、狀況,記為SST。 其計算公式為: 可以將總平方和SST做如下分解: 對于每個固定的,, 所以: 上式中右邊第一項(xiàng)為各處理平均數(shù)與總平均數(shù)的離均差平方和與重復(fù)數(shù)n的乘積,反映了重復(fù)n次的處理間變異,稱為處理間平方和或處理平方和,記為SSA。 上式中右邊第二項(xiàng)為各處理內(nèi)離均差平方和之和,反映了各處理內(nèi)的變異即隨機(jī)誤差的大小,稱為處理內(nèi)平方和或誤差平方和,記為SSe。 于是有:SST=SSA+SSe 三種平方和的簡便計算公式如下: 總平方和;處理間平方和;處理內(nèi)平方和 這里C稱為矯正項(xiàng),,簡便公式的證明略! 在方差分析中,為了簡化計算,同樣可以使用編碼法,即將全
30、部數(shù)據(jù)均減去同一個數(shù)。所得的平方和不變。以表8-2試驗(yàn)結(jié)果為例計算三種平方和,表8-2中的數(shù)據(jù)都減去65得到下表。 表8-6:5個小麥品系株高調(diào)查結(jié)果方差分析表(編碼后) 株號 品 系 總和 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 1 -0.4 -0.5 2.8 6.8 4.2 —— —— —— —— —— 2 0.3 0.3 1.3 7.1 3.2 3 -0.2 -0.4 2.1 5.0 4.8 4 1.0 -1.3 1.8 4.1 3.3 5 0.8 -1.1 3.5 6.0 2.5 1.5 -3.0 11
31、.5 29.0 18.0 57 2.25 9 132.25 841.0 324.0 1308.5 1.93 3.4 29.43 174.46 68.06 277.28 先求校正項(xiàng)C,=129.96 =277.28-129.96=147.32 =147.32-131.74=15.58 2、總自由度的剖分 在計算總平方和時,資料中的各個觀測值要受這一條件的約束,故總自由度等于資料中觀測值的總個數(shù)減1,即an-1??傋杂啥扔洖閐fT,即dfT=an-1。 因素共有a個水平,所以處理間自由度為處理數(shù)減1,處理間自由度記為dfA,即dfA=a-1。
32、 在計算處理內(nèi)平方和時,因?yàn)槊總€處理均有n-1自由度,共有a個處理,所以處理內(nèi)自由度為資料中觀測值的總個數(shù)減a,處理內(nèi)自由度記為dfe,即dfe=an-a=a(n-1)。 因?yàn)椋篴n-1=an-a+a-1=a(n-1)+(a-1) 所以:dfT=dfA+dfe 表8-2數(shù)據(jù)的dfA=5-1=4;dfe= 5(5-1)=20 3、各個均方的計算 各部分平方和除以各自的自由度便得到總均方、處理間均方和處理內(nèi)均方,分別記為MST(或)、MSA(或)和MSe(或)。MSA也稱為處理均方,MSe也稱為誤差均方。 總均方:;處理間均方:;處理內(nèi)均方: 表8-2數(shù)據(jù)的三個均方分別為: ;;
33、
(三)檢驗(yàn)統(tǒng)計量
,具dfA、dfe自由度。
當(dāng)F
34、這5個品種小麥的株高至少有兩種間差異極顯著。 注意:方差分析結(jié)論是至少有兩個處理不同,各處理兩兩之間是否有差異還要用第四節(jié)的內(nèi)容分析。 例8-1:比較5個小麥品系株高差異(表8-2),方差分析過程簡要整理如下 解:(1)原假設(shè)H0:μ1=μ2=μ3=……=μi;備擇假設(shè)HA:μi至少有一個不相等; (2)方差分析 將表8-2中的數(shù)據(jù)編碼,都減去65得到表8-6。 計算、、、、、 先求校正項(xiàng)C,=129.96 =277.28-129.96=147.32, =147.32-131.74=15.58 dfA=a-1=5-1=4;dfe= a(n-1)=5(5-1)=20 所
35、以,; (3)檢驗(yàn)統(tǒng)計量: (4)拒絕域:拒絕域?yàn)镕>Fα,F(xiàn)4,20,0.05=2.87;F4,20,0.01=4.43;F=42.23>F0.01,落在拒絕域內(nèi)。 (5)結(jié)論:這5個品種小麥的株高差異極顯著。 二、期望均方與檢驗(yàn)統(tǒng)計量F 方差分析的一個基本條件是要求各處理觀測值總體的方差相等,即,(i=1,2,…,a)表示第i個處理觀測值總體的方差。如果所分析的資料滿足這個方差同質(zhì)性的要求,那么各處理的樣本方差都是σ2的無偏估計量。是由試驗(yàn)資料中第i個處理的n個觀測值算得到的方差。 顯然,各的合并方差(以各處理內(nèi)的自由度n-1為權(quán)的加權(quán)平均數(shù))也是σ2的無偏估計量,且估計的精確
36、度更高。很容易推證處理內(nèi)均方MSe就是各的合并。 其中SSi、dfi(i=1,2,…,a)分別表示由試驗(yàn)資料中第i個處理的n個觀測值算得的平方和與自由度。這就是說,處理內(nèi)均方MSe是誤差方差σ2的無偏估計量。 試驗(yàn)中各處理所屬總體的本質(zhì)差異體現(xiàn)在處理效應(yīng)的差異上。我們把稱為效應(yīng)方差,它也反映了各處理觀測值總體平均數(shù)的變異程度,記為。 因?yàn)楦魑粗?,所以無法求得的確切值,只能通過試驗(yàn)結(jié)果中各處理均數(shù)的差異去估計。然而,并非的無偏估計量。這是因?yàn)樘幚碛^測值的平均數(shù)間的差異實(shí)際上包含了兩方面的內(nèi)容:一是各處理本質(zhì)上的差異即間的差異,二是抽樣誤差。統(tǒng)計學(xué)證明是的無偏估計量。因而,我們前面所計算
37、的處理間均方MSA實(shí)際上是的無偏估計量。
所以,固定模型中σ2為MSe的數(shù)學(xué)期望,是MSA的數(shù)學(xué)期望。只有當(dāng)處理效應(yīng)的方差=0,亦即各處理觀測值總體平均數(shù)μi(i=1,2,…,a)相等時,處理間均方MSA與處理內(nèi)均方MSe一樣,也是誤差方差σ2的估計值。因此比較MSA和MSe就可以反映出αi的大小。方差分析就是通過MSA與MSe的比值來推斷是否為零,亦即μi是否相等的。
可以證明:E(MSe)=,
E(MSA)=E()=
在固定模型中,αi是個常量,,因此=0。所以,E(MSA)=
令:,E(MSA)=,E(MSe)=
檢驗(yàn)統(tǒng)計量:
當(dāng)F 38、生的變異是由隨機(jī)誤差造成的,等于0,接受零假設(shè);就可以認(rèn)為各αi與0相差不大,或者說各處理平均數(shù)μi間差異不大。反之,μi間差異是顯著的。因此用F分布的上尾檢驗(yàn)。
三、不等重復(fù)時平方和和均方的計算
前面所講的例子都是不同處理的重復(fù)數(shù)相同的。若不同處理的觀測數(shù)不同,以上方差分析方法仍然可用,只是在計算平方和時,計算公式稍做改動,自由度稍有變化。
設(shè)第i次處理做了ni次觀測,總的觀測數(shù)不再是an,而是個。
計算SST和SSA的公式變?yōu)椋海?
自由度的變化:dfA=a-1(不變);dfe=N-a
例8-2:用方差分析的方法比較4種病人的血糖含量是否有顯著差異,實(shí)驗(yàn)結(jié)果見表8-7。
39、
表8-7:4種病人的血清中脫水葡萄糖醇含量調(diào)查表(μmol/L)
病人編號
病人類型
正常人
糖尿病患者
腎衰患者
肝病患者
1
82.31
30.82
49.41
90.89
2
54.67
56.83
32.96
71.16
3
68.80
32.01
42.83
82.99
4
80.57
47.85
57.32
5
77.66
84.47
方差分析方法參照例1進(jìn)行整理,本節(jié)略!
第三節(jié) 隨機(jī)效應(yīng)模型
一、觀測值的描述
在單因素試驗(yàn)中,若用于試驗(yàn)的a個水平是從該因素的水平總體中隨機(jī)選出的,那么這一因素稱為隨機(jī) 40、因素。其方差分析是通過隨機(jī)選取的a個水平對該因素的水平總體做推斷。單因素隨機(jī)效應(yīng)模型中的每一個觀測值的描述與固定模型相同。
。
其中:xij是在第i水平(處理)下的第j次觀測值;μ為所有觀測值的總平均數(shù);αi是第i水平的處理效應(yīng);εij是隨機(jī)誤差。其中αi和εij都是隨機(jī)變量,且二者相互獨(dú)立。
如果αi的方差為,觀測值的總變異為var(xij),那么var()=+。
因?yàn)棣羒是獨(dú)立的隨機(jī)變量,所以固定效應(yīng)模型中的零假設(shè)H0:α1=α2=……=αi=0在隨機(jī)效應(yīng)模型中就不再適用。
隨機(jī)模型的零假設(shè)為:H0:;備擇假設(shè)HA:。
二、隨機(jī)模型的方差分析程序
若參加實(shí)驗(yàn)的a個水平是從該因 41、素的水平總體中隨機(jī)選出的,那么這一因素稱為隨機(jī)因素,如動物的窩別。其方差分析是通過隨機(jī)選取的a個水平對該因素的水平總體做推斷。所要檢驗(yàn)的是αi的變異性。所以,隨機(jī)效應(yīng)模型方差分析的檢驗(yàn)假設(shè)與固定效應(yīng)模型不同。
隨機(jī)效應(yīng)得零假設(shè)H0:=0;備擇假設(shè)HA:>0。
接受零假設(shè)表示處理之間無差異,接受備擇假設(shè)表示處理之間有顯著差異。
隨機(jī)效應(yīng)模型的方差分析檢驗(yàn)程序與固定效應(yīng)模型的程序完全相同。只是假設(shè)和檢驗(yàn)所得的結(jié)論不同。以表8-5中的數(shù)據(jù)來介紹一下隨機(jī)效應(yīng)模型的方差分析方法。
例8-3:調(diào)查不同窩別家兔出生重量差異,數(shù)據(jù)見表8-5。
解:(1)假設(shè):零假設(shè)H0:=0;備擇假設(shè)HA: 42、>0
(2)將數(shù)據(jù)進(jìn)行編碼(每一個數(shù)據(jù)都減去30),列成表8-8,并計算三個均方。
先求校正項(xiàng)C,=7.84
=185.36-7.84=177.52
SSe=SST-SSA=177.52-58.575=118.945
dfA=a-1=4-1=3;dfe=a(n-1)=4×3=12
所以:;
,F(xiàn)0.05,3,12=3.490,F(xiàn) 43、-4.0
-6.7
1.4
3
-3.8
-1.4
-2.2
-4.3
4
1.6
2.3
-3.3
-2.0
5.8
0.1
-15.1
-2.0
-11.2
33.64
0.01
228.01
4.00
265.66
49.98
33.49
69.03
32.86
185.36
三、期望均方與檢驗(yàn)統(tǒng)計量F
隨機(jī)模型中的總平方和與自由度的分解方法與固定效應(yīng)相同:SST=SSA+SSe;dfT=dfA+dfe
可以證明:E(MSe)=,E(MSA)=E()=
因?yàn)椤?,令,所以E(MSA)=。
固定模型中:E(MSA) 44、=,,=0;
檢驗(yàn)統(tǒng)計量:
當(dāng)F 45、的相互比較稱為多重比較(multiple comparisons)。
多重比較的方法甚多,常用的有最小顯著差數(shù)法(LSD法)和最小顯著極差法(LSR法)。
一、最小顯著差數(shù)法(LSD法,least significant difference)
最小顯著差數(shù)法(LSD法)是統(tǒng)計學(xué)家Fisher提出的,是最早用于檢驗(yàn)多個平均數(shù)兩兩間差異顯著性的方法,其實(shí)質(zhì)是兩個平均數(shù)的t檢驗(yàn)。
(一)LSD法的基本原理
此法的基本作法是:在F檢驗(yàn)顯著的前提下,先計算出顯著水平為α的最小顯著差數(shù)LSDα,然后將任意兩個處理平均數(shù)的差數(shù)的絕對值與其比較。
若>LSDα?xí)r,則與在α水平上差異顯著;反之, 46、則在α水平上差異不顯著。
(二)最小顯著差數(shù)LSDα的計算
1、先計算平均數(shù)差異標(biāo)準(zhǔn)誤
(1)當(dāng)各處理重復(fù)數(shù)n1=n2=…=n時,
式中:MSe為F檢驗(yàn)中的誤差均方;n各處理的重復(fù)數(shù)。
(2)當(dāng)各處理的重復(fù)次數(shù)不同時,需先計算各ni的平均數(shù)n0:
n0=,a為處理數(shù)。
此時,平均數(shù)差異標(biāo)準(zhǔn)誤:
2、LSDα的計算:
式中:為在F檢驗(yàn)中誤差自由度下,顯著水平為α的臨界t值。從t分布表中查出和,代入得:;
將任意兩個處理平均數(shù)的差數(shù)的絕對值與LSD0.05和LSD0.01比較:
小于LSD0.05者,兩個處理平均數(shù)差異不顯著,在差數(shù)的右上方標(biāo)記“ns”,或者不標(biāo)記符號;
介 47、于LSD0.05和LSD0.01之間者,兩個處理平均數(shù)差異顯著,在差數(shù)的右上方標(biāo)記“*”;
大于LSD0.01者,兩個處理平均數(shù)差異極顯著,在差數(shù)的右上方標(biāo)記“**”。
(三)LSD法進(jìn)行多重比較的檢驗(yàn)程序
例8-4:仍以表8-2中的數(shù)據(jù)為例,比較5個小麥品系株高的差異顯著性。方差分析結(jié)論是不同品種小麥的株高差異極顯著(見例8-1),檢驗(yàn)品種間的兩兩差異。
表8-2:5個小麥品系株高調(diào)查結(jié)果
株號
品 系
Ⅰ
Ⅱ
Ⅲ
Ⅳ
Ⅴ
1
64.6
64.5
67.8
71.8
69.2
2
65.3
65.3
66.3
72.1
68.2 48、
3
64.8
64.6
67.1
70.0
69.8
4
66.0
63.7
66.8
69.1
68.3
5
65.8
63.9
68.5
71.0
67.5
平均值
65.3
64.4
67.3
70.8
68.6
解:(1)列出方差分析表,進(jìn)行F檢驗(yàn)。
檢驗(yàn)方法見第二節(jié)例8-1,檢驗(yàn)結(jié)論差異顯著。
(2)列出平均數(shù)的多重比較表,表中各處理按其平均數(shù)從大到小的順序自上而下、自右而左排列;求兩兩之差的絕對值。
表8-9:5個小麥品系株高調(diào)查結(jié)果多重比較表(LSD法)
處理
平均數(shù)
Ⅱ=64.4
Ⅰ=65.3
Ⅲ=67.3
49、Ⅴ=68.6
Ⅳ
70.8
6.4**
5.5**
3.5**
2.2**
Ⅴ
68.6
4.2**
3.3**
1.3*
Ⅲ
67.3
2.9**
2.0**
Ⅰ
65.3
0.9ns
Ⅱ
64.4
(3)計算最小顯著差數(shù)LSD0.05和LSD0.01;例8-1中已知MSe=0.78,dfe=20,n=5。
所以:
(4)將平均數(shù)多重比較表中兩兩平均數(shù)的差數(shù)與LSD0.05和LSD0.01比較,作出統(tǒng)計推斷,并做出標(biāo)記符號。差異顯著的差數(shù)右上方標(biāo)記“*”; 差異極顯著的差數(shù)右上方標(biāo)記“**”。
LSD 50、法計算簡便,也容易比較,但也有難以克服的缺點(diǎn),如前所述,這種比較方法會加大犯I型錯誤的概率。
(四)關(guān)于LSD 法的應(yīng)用有以下幾點(diǎn)說明
1、LSD法實(shí)質(zhì)上就是成組數(shù)據(jù)t檢驗(yàn)。
(1)成組數(shù)據(jù)t檢驗(yàn)的回顧
檢驗(yàn)統(tǒng)計量為:
我們把,表示抽樣誤差。
公式的簡化形式為:,這里加上絕對值,用上側(cè)檢驗(yàn)。
當(dāng)n1=n2=n時 ,上式可以進(jìn)一步簡化為:
當(dāng)t>t0.05時,差異顯著;當(dāng)t>t0.01時,差異極顯著。
即當(dāng)差異顯著時:>tα
此時:
(2)LSD法與t檢驗(yàn)的區(qū)別
LSD法將t檢驗(yàn)中由所求得t值的絕對值與臨界tα值的比較,轉(zhuǎn)化為將各對平均數(shù)差值的絕對值與最小顯著差數(shù)的比較 51、而作出統(tǒng)計推斷的。
LSD法是利用F檢驗(yàn)中的誤差自由度dfe查臨界tα值,利用誤差均方MSe來計算均數(shù)差異標(biāo)準(zhǔn)誤。
因而LSD法又不同于每次利用兩組數(shù)據(jù)進(jìn)行多個平均數(shù)兩兩比較的檢驗(yàn)法。它解決了本章開頭指出的檢驗(yàn)法檢驗(yàn)過程繁瑣,無統(tǒng)一的試驗(yàn)誤差且估計誤差的精確性和檢驗(yàn)的靈敏性低這兩個問題。但LSD法并未解決t檢驗(yàn)推斷的可靠性降低、犯I型錯誤的概率大的問題。
2、LSD法的適用范圍
有人提出,LSD法適用于各處理組與對照組比較,而處理組間不進(jìn)行比較的比較形式。
也有人指出其最適宜的比較形式是:在進(jìn)行試驗(yàn)設(shè)計時就確定各處理只是固定的兩兩相比,每個處理平均數(shù)在比較中只比較一次。例如,在一個試 52、驗(yàn)中共有4個處理,設(shè)計時已確定只是處理1與處理2、處理3與處理4(或1與3、2與4;或1與4、2與3)比較,而其它的處理間不進(jìn)行比較。因?yàn)檫@種比較形式實(shí)際上不涉及多個均數(shù)的極差問題,所以不會增大犯I型錯誤的概率。
綜上所述,對于多個處理平均數(shù)所有可能的兩兩比較,LSD法的優(yōu)點(diǎn)在于方法比較簡便,克服一般檢驗(yàn)法所具有的某些缺點(diǎn),但是由于沒有考慮相互比較的處理平均數(shù)依數(shù)值大小排列上的秩次。秩次越大,實(shí)驗(yàn)誤差越大;秩次相同,才可采取相同的標(biāo)準(zhǔn)。故LSD法仍有推斷可靠性低、犯I型錯誤概率增大的問題。為克服此弊病,統(tǒng)計學(xué)家提出了其他方法。
二、最小顯著極差法(LSR法,Least significan 53、t ranges)
(一)最小顯著極差法LSR法的基本原理
第一章中講過:范圍(range,R)也叫極差,R=最大值-最小值。LSR法的特點(diǎn)是把平均數(shù)的差數(shù)看成是平均數(shù)的極差,根據(jù)極差范圍內(nèi)所包含的處理數(shù)(稱為秩次距,用k表示)k的不同而采用不同的檢驗(yàn)尺度,以克服LSD法的不足。這些在顯著水平α上依秩次距k的不同而采用的不同的檢驗(yàn)尺度叫做最小顯著極差(LSR)。
例如有5個要相互比較,先將5個依其數(shù)值大小順次排列(如表8-9),兩極端平均數(shù)的差數(shù)(極差)的顯著性,由其差數(shù)是否大于秩次距k=5時的最小顯著極差決定(>為顯著,<為不顯著);而后是秩次距k=4的平均數(shù)的極差的顯著性,則由極差是 54、否大于k=4時的最小顯著極差決定;直到任何兩個相鄰平均數(shù)的差數(shù)的顯著性由這些差數(shù)是否大于秩次距k=2時的最小顯著極差決定為止。因此,有k個平均數(shù)相互比較,就有k-1種秩次距(k,k-1,k-2,…,2),因而需求得k-1個最小顯著極差(LSRα,k),分別作為判斷具有相應(yīng)秩次距的平均數(shù)的極差是否顯著的標(biāo)準(zhǔn)。
因?yàn)長SR法是一種極差檢驗(yàn)法,所以當(dāng)一個平均數(shù)大集合的極差不顯著時,其中所包含的各個較小集合極差也應(yīng)一概作不顯著處理。
LSR法克服了LSD法的不足,但檢驗(yàn)的工作量有所增加。常用的LSR法有q檢驗(yàn)法和新復(fù)極差法兩種。1973年,統(tǒng)計學(xué)家Carmer和Swanson證明:在檢驗(yàn)各平均數(shù)對 55、子之間的真正差異時,新復(fù)極差法優(yōu)于q檢驗(yàn)法。
這里我們只介紹新復(fù)極差法,此法是由鄧肯(Duncan)于1955年提出,故又稱“Duncan檢驗(yàn)”或“鄧肯氏檢驗(yàn)”。還稱SSR法(shortest significant ranges)
(二)Duncan檢驗(yàn)的程序
1、將需要比較的a個平均數(shù)按照大小順序依次排列好,并將每一對平均數(shù)之間的差列成表格。
這與LSD法一樣,表格見表8-9,這里不再列出。
2、計算最小顯著極差LSR
Duncan檢驗(yàn)與LSD法主要區(qū)別是:Duncan檢驗(yàn)中不同平均數(shù)的差有不同的最小顯著極差LSR。而LSD法,不同平均數(shù)的差都用同一個最小顯著差數(shù)LSDα檢驗(yàn)。 56、
其中稱為標(biāo)準(zhǔn)誤,表示抽樣誤差;可以從附表14查出。
(1)當(dāng)各處理重復(fù)數(shù)n1=n2=…=n時,
式中:MSe為F檢驗(yàn)中的誤差均方;n各處理的重復(fù)數(shù)。
(2)當(dāng)各處理的重復(fù)數(shù)不同時,需先計算各ni的平均數(shù)n0,n0的計算于LSD法中相同。
此時,標(biāo)準(zhǔn)誤
當(dāng)顯著水平α=0.05和0.01時,從附表14(r值表也稱SSR值表)中根據(jù)自由度dfe及秩次距k查出和,代入下式得:
;
仍以例8-1的數(shù)據(jù)為例,各處理平均數(shù)多重比較表與LSD法相同,見表8-11。
表中極差0.9、2.0、1.3、2.2的秩次距為2;極差2.9、3.3、3.5的秩次距為3;極差4.2、5.5的秩次距為4 57、。極差6.4的秩次距為5。
例8-1中已知MSe=0.78,故標(biāo)準(zhǔn)誤為:
根據(jù)dfe=20,k=2,3,4,5由附表14查出α=0.05、0.01水平下臨界r值,乘以標(biāo)準(zhǔn)表8-9:5個小麥品系株高調(diào)查結(jié)果多重比較表(LSD法)
處理
平均數(shù)
Ⅱ=64.4
Ⅰ=65.3
Ⅲ=67.3
Ⅴ=68.6
Ⅳ
70.8
6.4**
5.5**
3.5**
2.2**
Ⅴ
68.6
4.2**
3.3**
1.3*
Ⅲ
67.3
2.9**
2.0**
Ⅰ
65.3
0.9ns
Ⅱ
64.4
誤,求得各最小顯 58、著極差LSR,所得結(jié)果列于下表。
表8-10:平均數(shù)秩次距和平均數(shù)差值表
dfe
秩次距k
r0.05
r0.01
LSR0.05
LSR0.01
20
2
2.95
4.02
1.165
1.588
3
3.10
4.22
1.225
1.667
4
3.18
4.33
1.256
1.710
5
3.25
4.40
1.284
1.738
3、將平均數(shù)多重比較表中的各極差與相應(yīng)的最小顯著極差LSR0.05,k,LSR0.01,k比較,作出統(tǒng)計推斷。
先從左到右比較第一行,6.4是70.8與64.4的差,秩次距k為5,與LSR0 59、.05, 5=1.165和LSR0.01, 5=1.588比較。6.4>1.588,兩平均數(shù)之間差異極顯著,標(biāo)記上“**”;
小于LSR0.05者,兩個處理平均數(shù)差異不顯著,在差數(shù)的右上方標(biāo)記“ns”,或者不標(biāo)記符號;
介于LSR0.05和LSD0.01之間者,兩個處理平均數(shù)差異顯著,在差數(shù)的右上方標(biāo)記“*”;
大于LSR0.01者,兩個處理平均數(shù)差異極顯著,在差數(shù)的右上方標(biāo)記“**”。
比較結(jié)果見表8-11
表8-11:5個小麥品系株高平均數(shù)多重比較結(jié)果(LSR法)
處理
平均數(shù)
Ⅱ=64.4
Ⅰ=65.3
Ⅲ=67.3
Ⅴ=68.6
Ⅳ
70.8
6.4**
60、5.5**
3.5**
2.2**
Ⅴ
68.6
4.2**
3.3**
1.3*
Ⅲ
67.3
2.9**
2.0**
Ⅰ
65.3
0.9ns
Ⅱ
64.4
例8-4中的最小顯著差數(shù)LSD0.05=0.964,LSD0.01=1.412,由表8-10可以看出,最小顯著極差法比最小差數(shù)法精確。
三、q檢驗(yàn)法(q test)
在對多組平均數(shù)的逐對差異檢驗(yàn)方法中,Newman-Keul提出的q檢驗(yàn)法(或稱N-K法),也較為常用,檢驗(yàn)效果與最小顯著極差法很類似。
此法是以統(tǒng)計量q的概率分布為基礎(chǔ)的。q值由下式求得:
61、,
式中,LSR為最小顯著極差,為標(biāo)準(zhǔn)誤。q值的分布依賴于誤差自由度dfe及秩次距k。
利用q檢驗(yàn)法進(jìn)行多重比較時,為了比較的簡便起見,不是將由算出的q值與臨界q值比較,而是將極差(R)與LSR比較:
q檢驗(yàn)法與Duncan法的檢驗(yàn)步驟完全相同,唯一不同的是計算最小顯著極差時需查q值表(附表15)而不是查SSR表。
當(dāng)顯著水平α=0.05和0.01時,從q值表中根據(jù)自由度dfe及秩次距k查出和,代入上式得:,
四、多重比較結(jié)果的表示法
各平均數(shù)經(jīng)多重比較后,應(yīng)以簡明的形式將結(jié)果表示出來,常用的表示方法有以下兩種。
1、三角形法
本節(jié)表8-9和表8-11就是三角形法,它是將各處理 62、的平均數(shù)差按三角形列于表中,并將平均數(shù)的差數(shù)與LSD0.05和LSD0.01比較:
小于LSD0.05者,兩個處理平均數(shù)差異不顯著,在差數(shù)的右上方標(biāo)記“ns”,或者不標(biāo)記符號;
介于LSD0.05和LSD0.01之間者,兩個處理平均數(shù)差異顯著,在差數(shù)的右上方標(biāo)記“*”;
大于LSD0.01者,兩個處理平均數(shù)差異極顯著,在差數(shù)的右上方標(biāo)記“**”。
此法是將多重比較結(jié)果直接標(biāo)記在平均數(shù)多重比較表上。此法的優(yōu)點(diǎn)是簡便直觀,缺點(diǎn)是占的篇幅較大。
2、標(biāo)記字母法
此法是先將各處理平均數(shù)由大到小自上而下排列;然后在最大平均數(shù)上標(biāo)記字母a,并將該平均數(shù)與以下各平均數(shù)依次相比,凡差異不顯著標(biāo)記同 63、一字母a,直到某一個與其差異顯著的平均數(shù)標(biāo)記字母b;再以標(biāo)有字母b的平均數(shù)為標(biāo)準(zhǔn),與下面各未標(biāo)記字母的平均數(shù)相比,凡差異不顯著者,一律都加標(biāo)b,直至某一個與其差異顯著的平均數(shù)標(biāo)記c;如此重復(fù)下去,直至最小一個平均數(shù)被標(biāo)記、比較完畢為止。這樣,各平均數(shù)間凡有一個相同字母的即為差異不顯著,凡無相同字母的即為差異顯著。
用小寫拉丁字母表示顯著水平α=0.05,用大寫拉丁字母表示顯著水平α=0.01。
在利用字母標(biāo)記法表示多重比較結(jié)果時,常在三角形法的基礎(chǔ)上進(jìn)行。此法的優(yōu)點(diǎn)是占篇幅小,在科技文獻(xiàn)中常見,統(tǒng)計結(jié)果可以用下表表示。
株號
品 系
Ⅰ
Ⅱ
Ⅲ
Ⅳ
Ⅴ
平均值
65 64、.3D
64.4D
67.3c
70.8a
68.6B
第五節(jié) 方差分析的基本條件
一、方差分析的基本條件
1、被檢驗(yàn)每個總體都應(yīng)服從正態(tài)分布,也稱為分布的正態(tài)性。
2、被檢驗(yàn)的各個總體的方差必須具有齊性,即方差的同質(zhì)性。
3、觀察值是獨(dú)立的,每個處理效應(yīng)與誤差效應(yīng)是可加的,即效應(yīng)的可加性,。只有效應(yīng)是可加的,觀測值的總變異才能分解為處理效應(yīng)和實(shí)驗(yàn)誤差。
在上述條件中,正態(tài)總體是最常見的,最普遍的;效應(yīng)的可加性也是比較容易滿足的,二者對分析結(jié)果影響也都小于方差的齊性。雖然樣本含量相等時可以降低不齊性的影響,但在做方差分析之前應(yīng)首先要做多個方差的齊性檢驗(yàn),尤其是在各 65、個樣本含量不等時。
二、多個方差的齊性檢驗(yàn)
上述三個基本條件中,方差是否具齊性對統(tǒng)計分析結(jié)果影響最大。因此,做方差分析前,首先要做多個方差的齊性檢驗(yàn)。多個方差的齊性檢驗(yàn)方法最廣泛使用的是Bartlett檢驗(yàn)(Bartlett test)。
(一)假設(shè)
1、原假設(shè)
2、備擇假設(shè)HA:至少有兩個不相等。
(二)檢驗(yàn)統(tǒng)計量
當(dāng)處理重復(fù)數(shù)ni≥3時,檢驗(yàn)統(tǒng)計量K2的抽樣分布近似具有a-1自由度的χ2分布。
檢驗(yàn)統(tǒng)計量K2的計算公式為:
其中:
(i=1,2,???,a)是第i個總體的樣本方差。當(dāng)樣本方差變異很大時,q值也很大,當(dāng)相等時,q值等于零。
所以Bartlett檢 66、驗(yàn)的拒絕域?yàn)椋?
例8-5:仍然以表8-2的數(shù)據(jù)檢驗(yàn)5種小麥株高方差的齊性。
表8-12:5個小麥品系株高方差齊性檢驗(yàn)
株號
品 系
Ⅰ
Ⅱ
Ⅲ
Ⅳ
Ⅴ
1
64.6
64.5
67.8
71.8
69.2
2
65.3
65.3
66.3
72.1
68.2
3
64.8
64.6
67.1
70.0
69.8
4
66.0
63.7
66.8
69.1
68.3
5
65.8
63.9
68.5
71.0
67.5
平均值
65.3
64.4
67.3
70.8
68.6
方差
0.370
0.400
0.745
1.565
0.815
解:(1)計算每個處理的方差
,df=5-1=4
,,接受H0,方差具齊性。
(三)當(dāng)各處理樣本含量相同時,K2計算可簡化為:
經(jīng)Bartlett檢驗(yàn)發(fā)現(xiàn)各個處理之間的方差不具齊性時需經(jīng)適當(dāng)變換,使之滿足方差齊性這一條件,然后再做方差分析。變換方法將在下一章中介紹。
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中政治必修2政治生活易錯易混點(diǎn)歸納
- 如何對待壓力及壓力管理知識
- 九年級道德與法治上冊 第4單元 熔鑄民族魂魄 第9課 凝聚民族之魂 第1站培育社會主義核心價值觀優(yōu)質(zhì)課件 北師大版
- 創(chuàng)業(yè)管理-商業(yè)計劃
- 關(guān)節(jié)炎之我們不應(yīng)放過的早期關(guān)節(jié)炎征兆
- 二年級下冊克和千克的認(rèn)識練習(xí)課-課件
- 職業(yè)技能鑒定命題與國家題庫建設(shè)
- 幼兒園發(fā)展規(guī)劃設(shè)計與診斷
- 關(guān)稅與保稅制度
- 外匯基礎(chǔ)知識培訓(xùn)
- 深圳證券交易所上市公司董事培訓(xùn)班
- (北京專用)2019版高考化學(xué)一輪復(fù)習(xí) 第25講 弱電解質(zhì)的電離優(yōu)質(zhì)課件
- 中途接班-第一次家長會
- 高三修改病句課件PPT
- 電阻的串聯(lián)電路說課PPT