《《單因素方差分析》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《單因素方差分析》PPT課件.ppt(63頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、第六章 方差分析,第一節(jié) 單因素方差分析,第二節(jié) 雙因素方差分析,方差分析(analysis of variance)就是采用數(shù)理統(tǒng)計(jì)方法對數(shù)據(jù)進(jìn)行分析,以鑒別各種因素及因素間的交互作用對研究對象某些試驗(yàn)指標(biāo)的影響大小的一種有效方法.,第一節(jié) 方差分析,一、問題的提出,注:方差分析簡記為ANOVA.,例1 檢驗(yàn)不同飼料對雞增重的效應(yīng)。選用三種飼料:A1 以魚粉為主,A2 以槐樹粉為主,A3 以苜蓿粉為主。特選 24 只相似雛雞隨機(jī)分三組,每組各喂一種飼料, 60 天后觀察其重量,試驗(yàn)結(jié)果如下,幾個(gè)概念:(1)所考察的試驗(yàn)結(jié)果(如產(chǎn)品質(zhì)量、數(shù)量、銷量、成本等)稱為試驗(yàn)指標(biāo),簡稱指標(biāo)。例中為雞的
2、重量。,(2)在試驗(yàn)中對所關(guān)心的“指標(biāo)”有影響的、要加以考察改變狀態(tài)的原因稱為因子, 用 A,B,C 等大寫英文字母表示。例中為飼料。,(3)因素在試驗(yàn)中所取的各種不同狀態(tài)稱為因子的水平. 因素 A 的 r 個(gè)水平常用 A1,A2,,Ar 表示,其中 r 稱為因素 A 的水平數(shù)。例中有 1 個(gè)因素,3 個(gè)水平。,(4)若只考察一個(gè)因素對指標(biāo)的影響,這種試驗(yàn)稱為單因素試驗(yàn),相應(yīng)的方差分析就稱為單因素方差分析; 例中為單因素試驗(yàn)。 若一個(gè)試驗(yàn)中同時(shí)考察兩個(gè)因素,則這時(shí)對試驗(yàn)所作的方差分析稱為雙因素方差分析;因素多于兩個(gè),相應(yīng)的稱為多因素方差分析.,試驗(yàn)中,使用配方 Ai下第 j 只雞的重量記為
3、 yij, i=1,2,3; j =1,2,8. 我們的目的是研究不同飼料對雞增重的影響是否相同。,例1(續(xù)) 對原始數(shù)據(jù)作如下變換:每個(gè)數(shù)-1000 (為了處理更加簡便),(圖形分析散點(diǎn)圖),二、單因素方差分析的統(tǒng)計(jì)模型,考慮的因素記為 A,假定它有 r 個(gè)水平,記為 A1,A2, , Ar . 在每一水平下考察的指標(biāo)可看成一個(gè)總體,共有 r 個(gè)總體. 作如下假定:,(1)每一總體服從正態(tài)分布 N(i , i2), i=1, 2,, r ; (2)各總體同方差, 即 12 =22==r2= 2; (3)從每個(gè)總體中抽取的樣本是相互獨(dú)立的, 即所有試驗(yàn)結(jié)果
4、 yij 都獨(dú)立.,簡而言之, 每一總體獨(dú)立地服從同方差的正態(tài)分布. 且這些假定的成立與否都可用統(tǒng)計(jì)方法進(jìn)行驗(yàn)證.,單因素方差分析(single factor analysis of variance)是要判斷因素對指標(biāo)是否有顯著影響,歸結(jié)為判斷不同總體是否有相同分布的問題.,因?yàn)楦骺傮w方差相同,所以要判斷因素對指標(biāo)是否有顯著影響,就化為比較各水平下的均值是否相同即檢驗(yàn),其備擇假設(shè)為:,2 ,,r 不全相同.(常省略不寫),對水平 Ai 作了 m 次觀察,第 i 水平的第 j 次觀察為yij ,這樣可得觀察資料(若各水平觀察次數(shù)不同時(shí),略有不同,后敘),稱第 i 水平下的均值與總均值的差
5、 為因子 A 的第 i 水平的主效應(yīng), 簡稱 Ai 的效應(yīng). 易見,記總均值為,設(shè) 是來自總體 的簡單隨機(jī)樣本,則單因子方差分析的統(tǒng)計(jì)模型為,其中ij = yij -i稱為 隨機(jī)誤差,單因子方差分析的統(tǒng)計(jì)模型可改寫為:,可改寫為,方差分析是通過對誤差的分析研究來檢驗(yàn)具有相同方差的多個(gè)正態(tài)總體均值是否相等的一種統(tǒng)計(jì)方法.,對水平 Ai 作了 m 次觀察,第 i 水平的第 j 次觀察為yij ,這樣可得觀察資料(若各水平觀察次數(shù)不同時(shí),略有不同,后敘),記總觀察次數(shù) ,組平均值 ,,三. 平方和分解,總平均值 及,1. 組內(nèi)
6、偏差與組間偏差,與,(圖形分析散點(diǎn)圖),,,,,組間偏差:,反映了組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差,組內(nèi)偏差:,反映了隨機(jī)誤差和第 i 個(gè)水平的效應(yīng),則,2. 偏差平方和與自由度,設(shè)有 k 個(gè)數(shù)據(jù) x1, x2 , .,xk ,且 ,,偏差平方和:,反映了數(shù)據(jù)的集中或分散程度,即數(shù)據(jù)波動(dòng)的大小,自由度:平方和中獨(dú)立的隨機(jī)變量的個(gè)數(shù).,均方和:,反映了每個(gè)自由度上數(shù)據(jù)的離散程度,排除了自由度的干擾,3. 總平方和分解公式,總偏差平方和:,它反映了觀測數(shù)據(jù) 總的變異程度,組間(因子A的)偏差平方和:,反映因子A的不同水平效應(yīng)間的差異,組內(nèi)(誤差)偏差平方和:,反映了隨機(jī)誤差ij對 試驗(yàn)結(jié)果影響
7、的總和,ST =SA +Se , f T = f A +f e 平方和分解公式,定理1:,(1) Se /2 2 (n - r), 從而 E(Se)=(n-r),進(jìn)一步,若0成立,則,定理2:,(2),SA /2 2 (r-1),,(3) SA 與 Se 獨(dú)立.,對水平 Ai 作了 m 次觀察,第 i 水平的第 j 次觀察為yij ,這樣可得觀察資料(若各水平觀察次數(shù)不同時(shí),略有不同,后敘),4. 檢驗(yàn)方法,若SA顯著地大于Se,說明 間的差異顯著地大于隨機(jī)誤差,那么 H0 可能不成立.,取檢驗(yàn)統(tǒng)計(jì)量,當(dāng) H0 成立時(shí),,因此拒絕域?yàn)?5、方差分析表 (analysis of varianc
8、e table):,注:數(shù)據(jù)復(fù)雜時(shí),采用EXCEL軟件可得到分析結(jié)果,并可給出檢驗(yàn)的 p 值即 p=P(XF), 其中X F(r-1,n-r),判斷:,例1(續(xù)1) 試驗(yàn)結(jié)果如下,試檢驗(yàn)不同飼料對雞增重的效應(yīng)。,解(1)列出數(shù)據(jù)計(jì)算表(對原始數(shù)據(jù)作一個(gè)線性變換(yij-1000)),,,,,,,,,合計(jì),48,29,32,22,21,80,29,93,A3,1,122,74,90,109,-10,92,107,A2,28,9,12,2,1,60,9,73,1,數(shù)據(jù)(原始數(shù)據(jù)-1000),水平,,,,,,,,,,,線性變換不影響方差分析的結(jié)果,,,,取=0.05.得0.95(2,21)=3.47
9、, 而F=3.5953.47.拒絕 0.,故認(rèn)為因子A是顯著的,即三種飼料對雞的增重有明顯差別.,四. 數(shù)據(jù)結(jié)構(gòu)式及其參數(shù)估計(jì),1. 數(shù)據(jù)結(jié)構(gòu)式,其中為總體均值,i為第 i 個(gè)水平的效應(yīng), 且,ij 為試驗(yàn)誤差,,在上述結(jié)構(gòu)式下,,i=1,,r, j=1, ,m 且獨(dú)立,2. 點(diǎn)估計(jì),用最大似然估計(jì)法可求出一般平均,各主效應(yīng)i 和誤差方差2的估計(jì).,總平均的估計(jì):,主效應(yīng)i 的估計(jì):,誤差方差2 的估計(jì):,各水平均值i 的估計(jì):,由于它不是2 的無偏估計(jì), 實(shí)用中采用:,MSe,,,置信區(qū)間,由于,且兩者獨(dú)立, 故,故,各水平均值i 的1- 置信區(qū)間為,, Se /2 2 (n - r),,注
10、:單因子試驗(yàn)的統(tǒng)計(jì)分析可得如下三個(gè)結(jié)果:,(1) 因子 A 是否顯著.,(2) 試驗(yàn)的誤差方差 2 的估計(jì).,(3)各水平均值i 的點(diǎn)估計(jì)與區(qū)間估計(jì). (此項(xiàng)在因子A不顯著時(shí)無需進(jìn)行),五. 重復(fù)數(shù)不等情形下的方差分析,1. 數(shù)據(jù)略有不同,設(shè)因素 A 有 r 個(gè)水平A1,A2, , Ar . 且第 i 水平Ai下重復(fù)進(jìn)行mi 次試驗(yàn), i=1, ,r, 獲如下數(shù)據(jù):,2. 基本假定、平方和分解、方差分析及判斷準(zhǔn)則相同 計(jì)算公式稍有不同。特別注意 SA 的計(jì)算公式!,統(tǒng)計(jì)模型為:,記,則各平方和公式為:,例2 茶是一種飲料,它含有葉酸(folacin),這是一種維他命B。如今要比較各種茶葉中的葉
11、酸含量?,F(xiàn)選定綠茶,這是一個(gè)因子,用A表示。又選定四個(gè)產(chǎn)地的綠茶,記為A1, A2, A3, A4,它是因子A的四個(gè)水平。測定試驗(yàn)誤差,需要重復(fù)。選用不平衡設(shè)計(jì),即A1, A2, A3, A4分別制作了7,5,6,6個(gè)樣品,共有24個(gè)樣品。試對之進(jìn)行方差分析,從中可得到什么結(jié)果?,若取顯著性水平=0.05查表可得,由于F3.10,故應(yīng)拒絕原假設(shè),即認(rèn)為四種綠茶的葉酸平均含量有顯著差異,從方差分析表上還可以獲得,諸均值的參數(shù)估計(jì),,故均值,的95%的置信區(qū)間是7.13,9.41,,思考: 方差分析中的檢驗(yàn)與兩個(gè)獨(dú)立正態(tài)總體(方差未知且相等)中均值差的檢驗(yàn)有何異同?,補(bǔ)充一:多重比較,在確認(rèn)因子
12、 A 的 r 個(gè)水平均值間有顯著差異的情況下,進(jìn)一步要問:哪些水平均值間確有顯著差異,那些水平均值間無顯著差異,這就要進(jìn)行多重比較,同時(shí)比較任意兩個(gè)水平間有無顯著差異的問題稱為多重比較問題,譬如,r=3 時(shí),同時(shí)檢驗(yàn)如下三個(gè)假設(shè),若r較大,要同時(shí)檢驗(yàn) 個(gè)假設(shè),即:,多重比較,因此拒絕域形式:,同時(shí)考慮,考察因子A的r個(gè)水平,每個(gè)水平下重復(fù)數(shù)為mi .假設(shè)諸試驗(yàn)數(shù)據(jù),下面討論臨界值 cij 的確定:(分兩種情況),(1)重復(fù)數(shù)相等情況的多重比較 (Tukey 法),經(jīng)計(jì)算,對給定顯著性水平,,拒絕域形式:,在各水平試驗(yàn)次數(shù)相同時(shí),諸臨界值可認(rèn)為相同,記為c,例(第一節(jié)中例續(xù))檢驗(yàn)不同飼料對雞增重
13、的效應(yīng)中,飼料因子顯著試進(jìn)行多重比較,,,,,,,,,,,,,,,,,,,,()重復(fù)數(shù)不等情況的多重比較(Scheffe法),考察因子A的r 個(gè)水平均值,每個(gè)水平下的重復(fù)數(shù)分別為,且有,當(dāng) 成立時(shí),有,且Fij不應(yīng)過大,過大應(yīng)拒絕 .,在各mi不同時(shí),諸臨界值也不相同,但可要求,拒絕域形式:,同時(shí)考察r2個(gè)假設(shè)時(shí),至少有一個(gè)假設(shè)不成立就構(gòu)成該多重比較的拒絕域:,Scheffe證明了,則對給定顯著性水平 ,取定臨界值,從而,,(這里為近似分布,不是漸近分布),補(bǔ)充:方差齊性檢驗(yàn),方差齊性是進(jìn)行方差分析的三個(gè)基本假定之一,需要確認(rèn) 實(shí)際確定:如,兩個(gè)車間的設(shè)備相同,操作技術(shù)水平相當(dāng),可確認(rèn)兩車間生產(chǎn)的產(chǎn)品的誤差近似相等 統(tǒng)計(jì)確定:要對如下的假設(shè)作出判斷:,(齊性,即相等),,,,,,