《單因素方差分析 課件》由會員分享,可在線閱讀,更多相關《單因素方差分析 課件(15頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、單因素方差分析 最新第八章第八章 單因素方差分析單因素方差分析單因素方差分析 最新引言、單因素方差分析的概念引言、單因素方差分析的概念 前面我們學習了單樣本和雙樣本的顯著性檢驗方法。在前面我們學習了單樣本和雙樣本的顯著性檢驗方法。在科研活動中,有很多情況是要檢驗的不止兩個樣本,比如:科研活動中,有很多情況是要檢驗的不止兩個樣本,比如:例例8.1 某學者培育了一個小麥新品種,為了掌握該新品種與某學者培育了一個小麥新品種,為了掌握該新品種與現(xiàn)有其他現(xiàn)有其他4個品種的株高之間是否有顯著差異,做了個品種的株高之間是否有顯著差異,做了5個品種個品種的比較試驗,結果見表的比較試驗,結果見表8-1,問,問5
2、個小麥品種間是否有差異?個小麥品種間是否有差異?正確的檢驗結果正確的檢驗結果是差異顯著。是差異顯著。假如我們用一對一的假如我們用一對一的 t 檢驗檢驗, 共需檢驗共需檢驗 對對 。1025=C 假設每一對檢驗接受零假設的概率都是假設每一對檢驗接受零假設的概率都是1-=0.95,而且,而且這些檢驗都是獨立的,這些檢驗都是獨立的, 那么那么10對接受的概率(對接受的概率(0.95)10=0.60, =1-0.60=0.40,顯然,犯顯然,犯型錯誤的概率明顯增加。型錯誤的概率明顯增加。 那么,如何解決這類問題的檢驗呢?最好的方法就是那么,如何解決這類問題的檢驗呢?最好的方法就是今天所講的今天所講的方
3、差分析方差分析。 R. A. Fisher(1928)創(chuàng)造出)創(chuàng)造出方差分析方差分析方法(方法(analysis variance,ANOVA),也就是前面我們所學的),也就是前面我們所學的F檢驗檢驗。方差。方差分析為一類特定情況下的統(tǒng)計假設檢驗,它是兩樣本平均數(shù)分析為一類特定情況下的統(tǒng)計假設檢驗,它是兩樣本平均數(shù)差異顯著性檢驗的一種延伸。差異顯著性檢驗的一種延伸。對于一個因素不同處理間的對于一個因素不同處理間的F檢驗,我們稱作單因素方差分析檢驗,我們稱作單因素方差分析(One-way ANOVA)。方差分析與方差分析與t檢驗的區(qū)別:檢驗的區(qū)別: t檢驗檢驗判斷兩組數(shù)據(jù)判斷兩組數(shù)據(jù)平均數(shù)間的差
4、異顯著性;方差分析平均數(shù)間的差異顯著性;方差分析可同時可同時判斷多組數(shù)據(jù)判斷多組數(shù)據(jù)平均數(shù)間的差異顯著性。平均數(shù)間的差異顯著性。單因素方差分析 最新 在一個多處理試驗中,可以得出一系列不同的觀測值。造成觀測值不同的原因是多方面的,有的是處理不同引起的,處理效應或條件變異,有的是試驗過程中偶然性因素的干擾和測量誤差所致,既試驗誤差。方差分析的基本思想是將測量數(shù)據(jù)的總變異按照變異原因不同分解為處理效應和試驗誤差,并作出其數(shù)量估計。 通過方差比較以確定各種原因在總變異中所占的重要程度,即用處理效應和試驗誤差在一定意義下進行比較,如二者相差不大,說明試驗處理對指標影響不大,如二者相差較大,處理效應比試
5、驗誤差大得多,說明試驗處理影響是很大的,不可忽視。從而作為統(tǒng)計推斷。方差分析的基本原理單因素方差分析 最新單因素方差分析 最新(一)平方和的分解(一)平方和的分解 一、平方和的分解與自由度的分解一、平方和的分解與自由度的分解=njijixx1.1iixnx =( (i=1, ,2, ,3, ,,a) ) =ainjijxx11.1xanx =“.”表示對一個下標的表示對一個下標的和和 可驗證如下可驗證如下3 3定理:定理:=aniijxx1.0)(=ajixx1.0)(=ainjiijxx11.0)(.xxij.xxxxiiij=)()(.xxxxiiij=ainjijxx112.)(211.
6、 )()(=ainjiiijxxxx=ainjiijxx112.)(=ainjiiijxxxx11.)(2=ainjixx112.)(0)(11.=ainjiijxx因為:0)(211.=ainjiiijxxxx所以:=ainjijxx112.)(由此,=ainjiijxx112.)(=ainjixx112.)(這就是平方和的可分割性,即:這就是平方和的可分割性,即:總變異平方和總變異平方和=誤差變異平方和誤差變異平方和+處理變異平方和處理變異平方和 =ainjijTxxSS112.)(=aiiAxxnSS12.)(ATeSSSSSS=用用SST表示總平方和表示總平方和: 用用SSA表示處理平
7、方和:表示處理平方和: 用用SSe表示誤差平方和:表示誤差平方和: 單因素方差分析 最新(二)自由度的分解(二)自由度的分解 一、平方和的分解與自由度的分解一、平方和的分解與自由度的分解如平方和的最后分割公式:如平方和的最后分割公式: 因為在計算平方和時,資料中的全部數(shù)據(jù)受到一個條因為在計算平方和時,資料中的全部數(shù)據(jù)受到一個條件限制,即件限制,即 =aniijxx1.0)( ,所以總自由度應等于數(shù)據(jù),所以總自由度應等于數(shù)據(jù) 總個數(shù)減去總個數(shù)減去1,即:,即: 1= andfT 對于樣本間的自由對于樣本間的自由dfA而言,由于用而言,由于用 計算樣本間平方計算樣本間平方和時,和時, 也受到一個條
8、件限制,即也受到一個條件限制,即 ,所以,所以樣本間的自由度為樣本總數(shù)減去樣本間的自由度為樣本總數(shù)減去1,即:,即: 。 . ix. ix=ajixx1.0)(1= adfA 對于樣本內的自由度對于樣本內的自由度dfe而言,由于在計算樣本內平而言,由于在計算樣本內平方和時,要受到方和時,要受到a個條件限制,即:個條件限制,即: ,所,所以樣本內的自由度就等于數(shù)據(jù)總個數(shù)減去樣本總數(shù),即:以樣本內的自由度就等于數(shù)據(jù)總個數(shù)減去樣本總數(shù),即: 。 =ainjiijxx11.0)() 1( =naaandfe那么,總自由度的分割為:那么,總自由度的分割為: eATdfdfnaaandf=) 1() 1(
9、1為了估計為了估計2,用用SSe除以相應的自由度得誤差均方除以相應的自由度得誤差均方MSe: aanSSMSee=用用SSA除以相應的自由度得處理均方除以相應的自由度得處理均方MSA: 1=aSSMSAA單因素方差分析 最新二、效應模型及其均方期望二、效應模型及其均方期望(一)固定效應模型與隨機效應模型的概念(一)固定效應模型與隨機效應模型的概念 對于單因素方差分析而言,常用如下線性統(tǒng)計模型對于單因素方差分析而言,常用如下線性統(tǒng)計模型(linear statistical model)描述每一觀測值:)描述每一觀測值: ijiijx= = =njai, 2 , 1, 2 , 1式中:式中:xi
10、j第第i處理(水平)下的第處理(水平)下的第j次觀測值;次觀測值; 所有觀測值的總平均數(shù);所有觀測值的總平均數(shù); i第第i次處理效應;次處理效應; ij隨機誤差成分。隨機誤差成分。 方差分析的目的就是要檢驗處理效應的有無。要求模方差分析的目的就是要檢驗處理效應的有無。要求模型中的隨機誤差成分型中的隨機誤差成分ij服從正態(tài)分布服從正態(tài)分布N(0,2)的獨立隨)的獨立隨機變量,并要求各處理的方差機變量,并要求各處理的方差2相等。相等。 上述模型中,包括兩類不同的處理效應:固定效應(上述模型中,包括兩類不同的處理效應:固定效應(fixed effect)和隨機效應()和隨機效應(random eff
11、ect)。固定效應是由固定因)。固定效應是由固定因素(素(fixed factor)所引起的效應,隨機效應是由隨機因素)所引起的效應,隨機效應是由隨機因素(random factor)所引起的效應。處理固定因素所用的模型)所引起的效應。處理固定因素所用的模型稱為固定效應模型(稱為固定效應模型(fixed effect model),處理隨機因素所),處理隨機因素所用的模型稱為隨機效應模型(用的模型稱為隨機效應模型(random effect model)。)。那么,那么,什么屬固定因素?什么屬隨機因素?什么屬固定因素?什么屬隨機因素? 一言以蔽之,不同屬性的處理或同一屬性不同量級的處一言以蔽之
12、,不同屬性的處理或同一屬性不同量級的處理屬固定因素;而同一屬性無不同量級之分的組別屬隨機因理屬固定因素;而同一屬性無不同量級之分的組別屬隨機因素。素。固定因素如:幾個作物品種、幾種不同治療方案、幾種固定因素如:幾個作物品種、幾種不同治療方案、幾種不同化學藥物,幾種不同的實驗溫度、幾種不同的實驗濃度不同化學藥物,幾種不同的實驗溫度、幾種不同的實驗濃度等;隨機因素如:動物的若干窩組、農(nóng)家肥的若干分組等。等;隨機因素如:動物的若干窩組、農(nóng)家肥的若干分組等。 為什么要區(qū)分固定因素和隨機因素呢?這是由于固定因為什么要區(qū)分固定因素和隨機因素呢?這是由于固定因素和隨機因素方差分析的效應模型及其均方期望不同。
13、素和隨機因素方差分析的效應模型及其均方期望不同。 單因素方差分析 最新(二)效應模型及其均方期望(二)效應模型及其均方期望 二、效應模型及其均方期望二、效應模型及其均方期望效應模型:效應模型: 如上所述,對于所有觀測值都可用下述線性模型描述:如上所述,對于所有觀測值都可用下述線性模型描述: ijiijx= = =njai, 2 , 1, 2 , 1 然而,然而,對于固定效應模型而言對于固定效應模型而言,只有一個隨機變量只有一個隨機變量ij ,處理平均數(shù)與總平均數(shù)的離差處理平均數(shù)與總平均數(shù)的離差i是個常量是個常量。因而:。因而: =aiaiiixx11.0)( 而而對于隨機效應模型而言對于隨機效
14、應模型而言,有兩個隨機變量有兩個隨機變量i和和ij,處理,處理平均數(shù)與總平均數(shù)的離差平均數(shù)與總平均數(shù)的離差i不再是個常量不再是個常量(因重復來自于無(因重復來自于無限的總體,總體在變,限的總體,總體在變, i也在變),而是一個獨立隨機變量也在變),而是一個獨立隨機變量。如果如果i具有具有方差方差2 2并且獨立于并且獨立于ij ,那么觀測值的方差為:,那么觀測值的方差為:var(xij)= 2 + 2 方差方差2和和2稱為方差分量(稱為方差分量(variance component)。在)。在這個模型中,要求這個模型中,要求ij為為NID(0, 2 )變量,變量, i為為NID(0, 2 ) 變
15、變量,量,NID表示獨立正態(tài)分布表示獨立正態(tài)分布。 單因素方差分析 最新二、效應模型及其均方期望二、效應模型及其均方期望(二)效應模型及其均方期望(二)效應模型及其均方期望 均方期望:均方期望: 對于固定效應模型而言對于固定效應模型而言,可以證明,可以證明MSe是是2的無偏估計的無偏估計量。推導如下:量。推導如下: )(1)(eeeSSEanaanaSSEMSE=ainjiijxxEana112.)(1=ainjiiijiEana112.)(1=ainjiijEana112.)(1=ainjaiiijnEana1112.21222)(1=anaana用類似方法可求得:用類似方法可求得: =ai
16、iAnanMSE122221,021= =i,0=i,=aiian1201,2)(=AMSE,即2)()(=eAMSEMSE對于固定效應模型零假設對于固定效應模型零假設H0:可以看出,只有當可以看出,只有當說明各處理平均數(shù)間差異不顯著。說明各處理平均數(shù)間差異不顯著。 對于隨機效應模型而言對于隨機效應模型而言,處理平均數(shù)與總平均數(shù)的離差處理平均數(shù)與總平均數(shù)的離差i不再是一個常量,而是服從不再是一個常量,而是服從N(0,2 )的隨機變量。)的隨機變量。因因而,盡管而,盡管 ,但,但 ,而不是固定,而不是固定效應的效應的 。因此,對于隨機效。因此,對于隨機效應模型,只有當應模型,只有當 , ,即,即
17、 ,說明各處理平均數(shù)間差異不顯著。說明各處理平均數(shù)間差異不顯著。 2)(=eMSE22)(nMSEA=aiiAnanMSE12222102=2)(=AMSE2)()(=eAMSEMSE 從上面分析可以看出,由于隨機模型和固定模型在從上面分析可以看出,由于隨機模型和固定模型在設計設計思想和統(tǒng)計推斷上有明顯不同思想和統(tǒng)計推斷上有明顯不同,因此進行方差分析時的公式,因此進行方差分析時的公式推導也有所不同,推導也有所不同,所推導的平方和及自由度的分解公式?jīng)]有所推導的平方和及自由度的分解公式?jīng)]有區(qū)別區(qū)別,但,但在進行統(tǒng)計推斷時假設檢驗構成的統(tǒng)計數(shù)是不同的在進行統(tǒng)計推斷時假設檢驗構成的統(tǒng)計數(shù)是不同的。另外
18、,模型分析的側重點也不完全相同,方差期望值也不一另外,模型分析的側重點也不完全相同,方差期望值也不一佯,佯,固定模型主要側重于效應值的估計和比較,而隨機模型固定模型主要側重于效應值的估計和比較,而隨機模型則側重效應方差的估計和檢驗則側重效應方差的估計和檢驗。因此,在進行分析及試驗設。因此,在進行分析及試驗設計之前就要明確關于模型的基本假設。計之前就要明確關于模型的基本假設。對于單因素方差分析對于單因素方差分析來說,兩種模型無多大區(qū)別。來說,兩種模型無多大區(qū)別。 單因素方差分析 最新(一)方差分析的檢驗程序(一)方差分析的檢驗程序 三、單因素方差分析的檢驗及例題驗算三、單因素方差分析的檢驗及例題
19、驗算1 1、正規(guī)檢驗程序、正規(guī)檢驗程序 方差分析檢驗方差分析檢驗 (1) 假設假設 固定效應模型:固定效應模型: 0:210= =aH0:iAH隨機效應模型:隨機效應模型: 0:20=H0:2AH (2)計算統(tǒng)計量;)計算統(tǒng)計量; (3)判斷假設判斷假設 固定模型:固定模型: 當當F0.05,接受,接受H0、拒絕、拒絕 ; 當當FF0.05,P0.05,拒絕,拒絕H0、接受、接受 。 隨機模型:隨機模型: 當當F0.05,接受,接受H0、拒絕、拒絕 ; 當當FF0.05,P0.05,拒絕,拒絕H0、接受、接受 。 0:iAH0:2AH0:iAH0:2AH 、若拒絕若拒絕H0時進行平均數(shù)成對檢驗
20、時進行平均數(shù)成對檢驗 方差齊性檢驗方差齊性檢驗 2、單因素方差分析的、單因素方差分析的實戰(zhàn)檢驗程序實戰(zhàn)檢驗程序 (1) 零假設:零假設:假設樣本間平均數(shù)差異不顯著;假設樣本間平均數(shù)差異不顯著; (2) 方差齊性檢驗方差齊性檢驗 (3) 計算統(tǒng)計量計算統(tǒng)計量 (4) 判斷假設判斷假設 當當F0.05,接受假設;,接受假設;當當FF0.05,P F4,20,0.05=2.87 F4,20,0.01=4.43,拒絕假設。,拒絕假設。24147.32總和總和0.782025.58誤差誤差42.23*32.944131.74處理處理F均方均方自由度自由度平方和平方和變差來源變差來源單因素方差分析 最新三
21、、單因素方差分析的檢驗及例題驗算三、單因素方差分析的檢驗及例題驗算(二)例題驗算(二)例題驗算 例例8.2 隨機選取隨機選取4窩動物,每窩中均有窩動物,每窩中均有4只幼仔,問不同窩別只幼仔,問不同窩別動物出生重是否存在差異?動物出生重是否存在差異? 解:假設不同窩別解:假設不同窩別動物出生重沒有差異。動物出生重沒有差異。每個觀測值減去每個觀測值減去30SST=185.36-7.84=177.52SSA=(265.66/4)-7.84=58.575SSe=177.52-58.575=118.945變差來源變差來源平方和平方和自由度自由度均方均方F處理處理58.575319.5251.97誤差誤差
22、118.945129.912總和總和177.5215判斷:判斷:F=1.97 3 ),), K2的抽樣分布非常接近于的抽樣分布非常接近于a-1自由度的自由度的x2分布。分布。iainnmin1=方差齊性檢驗的程序:方差齊性檢驗的程序:1、假設:、假設:222210:= =H不相等至少有兩個2:iAHcqK3026. 22=aiiipsnsaNq122lg) 1(lg)(=aiiaNnac111)() 1() 1( 311aNsnsaiiip=122) 1(2、計算統(tǒng)計量、計算統(tǒng)計量為重復數(shù)為處理數(shù);為處理方差;nasi2=aiinNnanaNna1;時:時:3、判斷:、判斷:2, 12axK拒絕拒絕H0