《單因素方差分析》PPT課件.ppt
《《單因素方差分析》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《單因素方差分析》PPT課件.ppt(62頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第10章單因素方差分析One-factoranalysisofvariance,用6種培養(yǎng)液培養(yǎng)紅苜蓿,每一種培養(yǎng)液做5次重復(fù),測定5盆苜蓿的含氮量,結(jié)果如下表(單位:mg).問用6種不同培養(yǎng)液培養(yǎng)的紅苜蓿含氮量差異是否顯著?,方差分析(analysisofvariance-ANOVA)是由英國統(tǒng)計(jì)學(xué)家R.A.Fisher于1923年提出的。方差分析是一種特殊的假設(shè)檢驗(yàn),是用來判斷多組數(shù)據(jù)之間平均數(shù)差異顯著性的.它不同于t檢驗(yàn)之處在于:它把所有數(shù)據(jù)放在一起,一次比較就對所有各組間是否有差異做出判斷,如果沒有顯著性差異,則認(rèn)為各組平均數(shù)相同;如果發(fā)現(xiàn)有差異,再進(jìn)一步比較是哪組數(shù)據(jù)與其它數(shù)據(jù)不同.,在多組數(shù)據(jù)的平均數(shù)之間做比較時(shí),可以在平均數(shù)的所有對之間做t檢驗(yàn),但這樣做會(huì)提高犯I型錯(cuò)誤的概率,因而是不可取的。方差分析可以防止該問題的出現(xiàn)。如對5個(gè)平均數(shù)進(jìn)行檢驗(yàn),若做t檢驗(yàn),則需做10次,假設(shè)每一次檢驗(yàn)接受零假設(shè)的概率為0.95,那么10次都接受零假設(shè)的概率為(0.95)10=0.60,(至少有1次)拒絕零假設(shè)的概率為0.40,犯I型錯(cuò)誤的概率明顯平加,方差分析中常用基本概念(一)試驗(yàn)指標(biāo)(experimentalindex)為衡量試驗(yàn)結(jié)果的好壞或處理效應(yīng)的高低,在試驗(yàn)中具體測定的性狀或觀測的項(xiàng)目。(二)試驗(yàn)因素(experimentalfactor)試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素叫試驗(yàn)因素。當(dāng)試驗(yàn)中考察的因素只有一個(gè)時(shí),稱為單因素試驗(yàn);若同時(shí)研究兩個(gè)或兩個(gè)以上的因素對試驗(yàn)指標(biāo)的影響時(shí),則稱為兩因素或多因素試驗(yàn)。按是否可控制因素可分為:固定因素和隨機(jī)因素.,固定因素:可準(zhǔn)確控制且其水平固定后效應(yīng)也固定,比如:溫度、化學(xué)藥物濃度等.隨機(jī)因素:因素水平不能嚴(yán)格控制或者說即使其水平可控制但其效應(yīng)也不固定.比如:動(dòng)物的窩別、農(nóng)家肥的效果等.試驗(yàn)因素常用大寫字母A、B、C、…等表示。(三)因素水平(leveloffactor)試驗(yàn)因素所處的某些特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平。比如:不同的溫度;溶液不同濃度等.(四)重復(fù)(repeat)在試驗(yàn)中,將一個(gè)處理實(shí)施在兩個(gè)或兩個(gè)以上的試驗(yàn)單位上,稱為處理有重復(fù);一處理實(shí)施的試驗(yàn)單位數(shù)稱為處理的重復(fù)數(shù)。,第一節(jié)單因素方差分析的基本原理,一、線性模型二、固定線性模型三、隨機(jī)線性模型四、多重比較五、基本假定,(一)線性模型假設(shè)某單因素試驗(yàn)有a個(gè)處理,每個(gè)處理有n次重復(fù),共有na個(gè)觀測值。這類試驗(yàn)資料的數(shù)據(jù)模式如表7-1所示。,一、線性模型,表7-1單因素方差分析的典型數(shù)據(jù)模式,各處理總和、平均數(shù)、大總和、總平均數(shù)是計(jì)算的一級數(shù)據(jù),在本章我們采用了黑點(diǎn)符號體系法表示,要注意熟悉和掌握。,可以分解為表示第i個(gè)處理觀測值總體的平均數(shù)。為了看出各處理的影響大小,將再進(jìn)行分解,其中μ表示全試驗(yàn)觀測值的總體平均數(shù)(overallmean),是第i個(gè)處理的效應(yīng)(treatmenteffect),表示處理i對試驗(yàn)結(jié)果產(chǎn)生的影響。是試驗(yàn)誤差,相互獨(dú)立,且服從正態(tài)分布N(0,σ2)。,上式就稱為單因素試驗(yàn)的線性統(tǒng)計(jì)模型(linearstatisticalmodel)亦稱數(shù)學(xué)模型。方差分析的目的就是要檢驗(yàn)處理效應(yīng)的大小和有無。(二)方差分析的基本思路將總的變差分解為構(gòu)成總變差的各個(gè)部分。即將a個(gè)處理的觀測值作為一個(gè)整體看待,把觀察值總變異的平方和及自由度分解為相應(yīng)于不同變異來源的平方和及自由度,進(jìn)而獲得不同變異來源的總體方差估計(jì)值;通過這些估計(jì)值的適當(dāng)比值,就能檢驗(yàn)各樣本所屬總體均值是否相等。方差分析實(shí)質(zhì)上是關(guān)于觀測值變異原因的數(shù)量分析。,二固定模型fixedmodel:因素固定、效應(yīng)也固定反應(yīng)到線性模型中即為常數(shù).可要求1.假設(shè)固定模型的零假設(shè)為:備擇假設(shè)為:,故an個(gè)觀察值的總變異可分解為處理間的變異和處理內(nèi)的變異兩部分。全部觀察值的總變異可以用總均方來度量,處理間變異和處理內(nèi)變異分別用處理間均方和處理內(nèi)均方來度量。,2.平方和與自由度的剖分,總均方的拆分是通過將總均方的分子──稱為總離均差平方和,簡稱為總平方和(totalsumofsquares,SST),剖分成處理間平方和(sumofsquaresbetweentreatments,SSA)與處理內(nèi)平方和(sumofsquareswithintreatment,SSe)兩部分;將總均方的分母──稱為總自由度,剖分成處理間自由度與處理內(nèi)自由度兩部分來實(shí)現(xiàn)的。處理間均方(處理均方,MSA)處理內(nèi)均方(誤差均方,MSe),總平方和的拆分,三種平方和的簡便計(jì)算公式如下:①等重復(fù)時(shí):,②不等重復(fù)時(shí):,?在計(jì)算總平方和時(shí),資料中的各個(gè)觀察值要受這一條件約束,總自由度等于資料中觀察值的總個(gè)數(shù)減1,即an-1??傋杂啥扔洖閐fT,則dfT=an-1。?在計(jì)算處理間平方和時(shí),各處理均數(shù)要受這一條件的約束,故處理間自由度為處理數(shù)減1,即a-1。處理間自由度記為dfA,則dfA=a-1。,總自由度的拆分,?在計(jì)算處理內(nèi)平方和時(shí),要受a個(gè)條件的約束,即,i=1,2,...a。故處理內(nèi)自由度為資料中觀察值的總個(gè)數(shù)減a,即an-a。處理內(nèi)自由度記為dfe,則dfe=an-a=a(n-1)。因?yàn)閚a-1=(a-1)+(na-a)=(a-1)+a(n-1)所以dfT=dfA+dfe綜合以上各式得:,各部分平方和除以各自的自由度便得到總均方、處理間均方和處理內(nèi)均方(誤差均方),分別記為:MST(或ST2)、MSA(或SA2)和MSe(或Se2),即MST=ST2=SST/dfT;MSt=St2=SSt/dft;MSe=Se2=SSe/dfe注意:?在方差分析中不涉及總均方的數(shù)值,所以一般不必計(jì)算;?總均方一般不等于處理間均方加處理內(nèi)均方。,,3.期望均方(expectedmeansquaresEMS)若A是B的無偏估計(jì),則稱B是A的數(shù)學(xué)期望。處理內(nèi)均方MSe是誤差方差?2的無偏估計(jì)值,即?2稱為MSe的數(shù)學(xué)期望。,4.統(tǒng)計(jì)量當(dāng)零假設(shè)成立時(shí),處理效應(yīng)的方差為零,亦即各處理觀察值總體均數(shù)?i(i=1,2,…,a)相等時(shí),處理間均方MSA與處理內(nèi)均方一樣,也是誤差方差?2的估計(jì)值。方差分析就是通過MSA與MSe的比較來推斷各處理平均數(shù)間差異的大?。瓼=MSA/MSeF具有兩個(gè)自由度:df1=dfA=a-1;df2=dfe=a(n-1)。,查附表7:?若F<,即P>0.05,不能否定H0,可認(rèn)為各處理間差異不顯著;?若≤F<,即0.01<P≤0.05,否定H0,接受HA,認(rèn)為各處理間差異顯著,標(biāo)記“*”;?若F≥,即P≤0.01,否定H0,接受HA,認(rèn)為各處理間差異極顯著,標(biāo)記“**”。,【例10.2】某試驗(yàn)研究不同藥物對腹水癌的治療效果,將患腹水癌的25只小白鼠隨機(jī)分為5組,每組5只。其中A1組不用藥作為對照,A2、A3為兩個(gè)不同的用中藥組,A4、A5為兩個(gè)不同的西藥組。各組小白鼠的存活天數(shù)如表7—2所示。表10—2用不同藥物治療腹水癌小白鼠的結(jié)果,這是一個(gè)單因素試驗(yàn),處理數(shù)a=5,重復(fù)數(shù)n=5。第一步:計(jì)算一級數(shù)據(jù)(見表);第二步:計(jì)算SSe、SSA、dfe、dfA矯正項(xiàng)C=x2../an總平方和處理間平方和=248274-2291.96=1905.44處理內(nèi)平方和SSe=SST-SSA=2183.04-1905.44=277.60,總自由度dfT=an-1=25-1=24處理間自由度dfA=a-1=5-1=4處理內(nèi)自由度dfe=dfT-dfA=24-4=20處理間均方MSA=SSt/dfA=1905.44/4=476.36處理內(nèi)均方MSe=SSe/dfe=277.60/20=13.88第三步:提出假設(shè)零假設(shè)為:H0:各處理組小鼠存活天數(shù)差異不顯著備擇假設(shè)為:HA:各處理組小鼠存活天數(shù)差異顯著,第四步:計(jì)算統(tǒng)計(jì)量F=MSA/MSe=476.36/13.88=34.32**第五步:查表根據(jù)df1=dft=4,df2=dfe=20查附表7,得F0.01(4,20)=4.43第六步:做出推斷及生物學(xué)解釋:F>F0.01(4,20)=4.43,P<0.01。說明五個(gè)處理小白鼠存活天數(shù)差異極顯著,用不同藥物治療小白鼠腹水癌的療效是不同的。,在方差分析中,通常將變異來源、平方和、自由度、均方和F值歸納成一張方差分析表。表10—3例10.2資料的方差分析表,F值應(yīng)與相應(yīng)的被檢驗(yàn)因素齊行;在表的左下方注出顯著水平α。,應(yīng)用舉例:例4調(diào)查了5個(gè)不同小麥品系的株高,結(jié)果見下表,問該5個(gè)小麥品系株高間的差異是否顯著?,為了簡化計(jì)算,將每一個(gè)原始數(shù)據(jù)均減去65,列成下表,1.提出假設(shè):H0:HA:2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F:=147.32=131.74SSe=SST-SSA=15.58MSA=SSA/(a-1)=32.72MSe=SSe/(an-a)=0.78F=MSA/MSe=41.953.查附表3得:F4,20,0.05=2.87,F(xiàn)4,20,0.01=4.43。F>F4,20,0.01,拒絕H0,說明5個(gè)不同小麥品系的株高差異極顯著。,,,,,,,將以上結(jié)果列為方差分析表:,三、隨機(jī)模型Randommodel:因素隨機(jī)、效應(yīng)不固定是試驗(yàn)誤差,相互獨(dú)立,且服從正態(tài)分布不再為常數(shù),且服從正態(tài)分布1.假設(shè)隨機(jī)模型的零假設(shè)為:備擇假設(shè)為:,2.總平方和與總自由度的剖分:同固定模型3.數(shù)學(xué)期望:4.統(tǒng)計(jì)量F:注意:在做生物學(xué)解釋時(shí),固定模型中的結(jié)論只適用于檢查的那幾個(gè)因素水平;隨機(jī)模型中的結(jié)論可推廣到這一因素的各個(gè)水平,四、多重比較(multiplecomparisons)(一)為什么要進(jìn)行多重比較?F值顯著或極顯著,否定了無效假Ho,表明試驗(yàn)的總變異主要來源于處理間的變異,試驗(yàn)中各處理平均數(shù)間存在顯著或極顯著差異。但并不意味著每兩個(gè)處理平均數(shù)間的差異都顯著或極顯著,也不能具體說明哪些處理平均數(shù)間有顯著或極顯著差異,哪些沒有顯著差異。因而,有必要進(jìn)行兩兩處理平均數(shù)間的比較,以具體判斷兩兩處理平均數(shù)間的差異顯著性。,(二)概念統(tǒng)計(jì)上把多個(gè)平均數(shù)兩兩間的相互比較稱為多重比較。(三)常用的多重比較方法多重比較的方法甚多,常用的有最小顯著差數(shù)法(LSD法)和最小顯著極差法(LSR法)。1、最小顯著差數(shù)法(LSD法,Leastsignificantdifference)此法的基本原理是:在處理間F檢驗(yàn)顯著的前提下,先計(jì)算出顯著水平為α的最小顯著差數(shù)LSDα,然后將任意兩個(gè)處理平均數(shù)的差數(shù)的絕對值與其比較,作出結(jié)論。,最小顯著差數(shù)由下式計(jì)算:式中為在F檢驗(yàn)中誤差自由度下,顯著水平為α的臨界t值,均數(shù)差異標(biāo)準(zhǔn)誤則下式算得。其中MSe為F檢驗(yàn)中的誤差均方,n為各處理內(nèi)的重復(fù)數(shù)。,顯著水平取0.05和0.01時(shí),從t值表查出代入,即可求得LSD0.05和LSD0.01利用LSD法進(jìn)行多重比較時(shí),步驟如下:?列出平數(shù)的多重比較表,比較表中各處理按其平均數(shù)從大到小自上而下排列;?計(jì)算最小顯著差數(shù)LSD0.05和LSD0.01;?將平均數(shù)多重比較表中兩兩平均數(shù)的差數(shù)與計(jì)算出的LSD0.05、LSD0.01比較,作出統(tǒng)計(jì)推斷。,【例10.2】dfe=20,n=5,MSe=13.88查t值表得t0.05(dfe)=t0.05(20)=2.086,t0.01(dfe)=t0.01(20)=2.845所以顯著水平為0.05與0.01的最小的顯著差數(shù)為:表10-4五個(gè)處理小鼠平均存活天數(shù)多重比較表(LSD法)),將表10—4中的10個(gè)差數(shù)與LSD0.05、LSD0.01比較:小于LSD0.05者不顯著;介于LSD0.05與LSD0.01之間者顯著,標(biāo)記“*”;大于LSD0.01者極顯著,標(biāo)記“**”。檢驗(yàn)結(jié)果除差數(shù)1.6不顯著、5.2顯著外,其余各差數(shù)極顯著。表明所用的藥物不論中西藥對小白鼠腹水癌都有一定療效,除中藥A3與西藥A4的療效差異不顯著外,其余藥物間的療效都有顯著或極顯著差異。,說明:LSD實(shí)質(zhì)上就是t檢驗(yàn)法:它是將t檢驗(yàn)中由所求得的t的絕對值與臨界值的比較轉(zhuǎn)化為將各對均數(shù)差值的絕對值與最小顯著差數(shù)的比較,從而做出統(tǒng)計(jì)推斷的.,2、最小顯著極差法(LSR法,Leastsignificantranges)LSR法的特點(diǎn):把平均數(shù)的差數(shù)看成是平均數(shù)的極差,根據(jù)極差范圍內(nèi)所包含的處理數(shù)(稱為秩次距)k的不同而采用不同的檢驗(yàn)尺度,以克服LSD法的不足。這些在顯著水平α上依秩次距k的不同而采用的不同的檢驗(yàn)尺度叫做最小顯著極差。因此,若有k個(gè)平均數(shù)相互比較,就有k-1種秩次距(k,k-1,k-2,…,2),因而需求得k-1個(gè)最小顯著極差R(α,k),以作為判斷各秩次距(k)平均數(shù)的極差是否顯著的標(biāo)準(zhǔn)。,常用的LSR法為Duncan法。檢驗(yàn)步驟:?列出平均數(shù)多重比較表;?由自由度dfe、秩次距k查“多重比較中的Duncan表”(附表7),計(jì)算最小顯著極差R0.05,k和R0.01,k;?將平均數(shù)多重比較表中的各極差與相應(yīng)的最小顯著極差R0.05,k和R0.01,k比較,作出統(tǒng)計(jì)推斷。,對于【例10.1】,已算出=1.67,依dfe=20,k=2,3,4,5,由附表6查臨界r0.05(20,k)和r0.01(20,k)值,乘以,求得各最小顯著極差。所得結(jié)果列于表10—5。表10—5r值與R值,表10-6五個(gè)處理小鼠平均存活天數(shù)多重比較表(Duncan法)),五、基本假定①效應(yīng)的可加性(additivity)②分布的正態(tài)性(normality)③方差的同質(zhì)性(homogeneity),方差分析的基本步驟1.計(jì)算各項(xiàng)平方和與自由度。2.列出方差分析表,進(jìn)行F檢驗(yàn)。3.若F檢驗(yàn)顯著,則進(jìn)行多重比較。多重比較的方法有最小顯著差數(shù)法(LSD法)和最小顯著極差法(LSR法)。,第二節(jié)單因素方差分析的基本步驟,一、各處理重復(fù)數(shù)相等的方差分析【例10.2】為了研究小白鼠患白血病后脾組織中DNA含量的變化,測定四組,每組各8只(即a=4,n=8)小白鼠脾組織中DNA的含量;第1組為正常脾,第2組為患自發(fā)性白血病的脾;第3組為患移植性白血病AK4的脾;第4組為患移植性白血病9421的脾。測定結(jié)果見表10—7。試檢驗(yàn)各組DNA含量差異是否顯著。,表10—7四組小白鼠脾組織中DNA含量1.計(jì)算各項(xiàng)平方和與自由度C=x2../an=398.12/(48)=4952.61,SSe=SST–SSA=133.40-89.72=43.68dfT=an-1=48-1=31dfA=a-1=4-1=3dfe=dfT-dfA=31-3=282.列出方差分析表,進(jìn)行F檢驗(yàn),見表(10—8)。表10—8四組小白鼠脾中DNA含量方差分析表,根據(jù)df1=dfA=3,df2=dfe=28查臨界F值得:F0.05(3,28)=2.95,F0.01(3,28)=4.57因?yàn)镕>F0.01(3,28),即P<0.01,表明處理間DNA含量的差異達(dá)到1%顯著水平。3.多重比較采用Duncan法。各處理平均數(shù)多重比較表,見表10—9。因?yàn)镸Se=1.56,n=8,所以根據(jù)dfe=28,秩次距k=2,3,4由附表9查出α=0.05和α=0.01的各臨界r值,各r值乘以,即得各最小顯著極差。所得結(jié)果列于表10—9。,表10—9r值及LSR值表10—10各組DNA含量平均數(shù)多重比較表(Duncun法),檢驗(yàn)結(jié)果表明:正常脾中DNA含量極顯著高于患有各類白血病脾中DNA含量;患自發(fā)性白血病脾中DNA含量極顯著高于患移植性白血病9421,顯著高于患移植性白血病AK4;第三組第四組之間差異不顯著。四組中以正常脾DNA含量最高,第二組次之,第三、四組最低。也就是說各類白血病都將導(dǎo)致小白鼠脾中DNA含量明顯降低。,二、各處理重復(fù)數(shù)不相等的方差分析這種情況下方差分析步驟與各處理重復(fù)數(shù)相等的情況相同,只是在有關(guān)計(jì)算公式上略有差異。設(shè)處理數(shù)為a;各處理重復(fù)數(shù)為n1,n2,…,na;試驗(yàn)觀察值總數(shù)為N=Σni。則,【例10.3】五個(gè)不同品種豬的育肥試驗(yàn),30天后增重(kg)如表10—11所示。試比較品種間增重有無差異。表10—11五個(gè)品種豬30天增重,此例處理數(shù)a=5,各處理重復(fù)數(shù)不等?,F(xiàn)對此試驗(yàn)結(jié)果進(jìn)行方差分析:1.計(jì)算各項(xiàng)平方和及其自由度,2、列出方差分析表,進(jìn)行F檢驗(yàn)表10—12五品種育肥豬增重方差分析表臨界F值為F0.05(4,20)=2.87,F(xiàn)0.01(4,20)=4.43,因?yàn)?.99>4.43,故P<0.01,表明品種間差異極顯著。3.多重比較采用Duncan法,各處理平均數(shù)多重比較表見表10—12。,因各處理重復(fù)數(shù)不等,應(yīng)先計(jì)算出平均重復(fù)次數(shù)no,此例中:于是,標(biāo)準(zhǔn)誤為:根據(jù)dfe=20,秩次距k=2,3,4,5從附表6中查出α=0.05及α=0.01的臨界r值,并計(jì)算出最小顯極差,所得結(jié)果列于表10—13。,表10—13r值及R值表,表10—14五品種育肥豬平均增重多重比較表(Duncan法),多重比較結(jié)果表明:B1、B4品種的平均增重極顯著或顯著地高于B2、B5品種的平均增重,其余不同品種之間差異不顯著。可以認(rèn)為B1、B4品種增重最快,B2、B5品種增重較差,B3品種居中。,方差分析與兩樣本平均數(shù)t-test有何異同?,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 單因素方差分析 因素 方差分析 PPT 課件
鏈接地址:http://www.820124.com/p-11503032.html