模式識別-4-概率密度函數(shù)的估計.ppt
《模式識別-4-概率密度函數(shù)的估計.ppt》由會員分享,可在線閱讀,更多相關(guān)《模式識別-4-概率密度函數(shù)的估計.ppt(50頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第四章概率密度函數(shù)的估計,概率密度估計的基礎(chǔ)知識參數(shù)估計理論極大似然估計(MLE)貝葉斯估計(或稱最大后驗估計)貝葉斯學習非參數(shù)估計理論密度估計Parzen窗估計K近鄰估計(KNE),4-1概率密度估計的基礎(chǔ)知識貝葉斯分類器中只要知道先驗概率、條件概率或后驗概概率P(ωi),P(x/ωi),P(ωi/x)就可以設計分類器了。現(xiàn)在來研究如何用已知訓練樣本的信息去估計P(ωi),P(x/ωi),P(ωi/x)一.參數(shù)估計與非參數(shù)估計參數(shù)估計:先假定研究的問題具有某種數(shù)學模型,如正態(tài)分布,二項分布,再用已知類別的學習樣本估計里面的參數(shù)。非參數(shù)估計:不假定數(shù)學模型,直接用已知類別的學習樣本的先驗知識直接估計數(shù)學模型。,二.監(jiān)督參數(shù)估計與非監(jiān)督參數(shù)估計監(jiān)督參數(shù)估計:樣本所屬的類別及類條件總體概率概率密度函數(shù)的形式已知,而表征概率密度函數(shù)的某些參數(shù)是未知的。目的在于:由已知類別的樣本集對總體分布的某些參數(shù)進行統(tǒng)計推斷,此種情況下的估計問題稱為監(jiān)督參數(shù)估計。非監(jiān)督參數(shù)估計:已知總體概率密度函數(shù)形式但未知樣本所屬類別,要求推斷出概率密度函數(shù)的某些參數(shù),稱這種推斷方法為非監(jiān)督情況下的參數(shù)估計。注:監(jiān)督與非監(jiān)督是針對樣本所屬類別是已知還是未知而言的。,三.參數(shù)估計得基本概念1.統(tǒng)計量:樣本中包含著總體的信息,總希望通過樣本集把有關(guān)信息抽取出來。也就是說,針對不同要求構(gòu)造出樣本的某種函數(shù),該函數(shù)稱為統(tǒng)計量。2.參數(shù)空間:在參數(shù)估計中,總假設總體概率密度函數(shù)的形式已知,而未知的僅是分布中的參數(shù),將未知參數(shù)記為,于是將總體分布未知參數(shù)的全部可容許值組成的集合稱為參數(shù)空間,記為。3.點估計、估計量和估計值:點估計問題就是構(gòu)造一個統(tǒng)計量作為參數(shù)的估計,在統(tǒng)計學中稱為的估計量。若是屬于類別的幾個樣本觀察值,代入統(tǒng)計量d就得到對于第i類的的具體數(shù)值,該數(shù)值就稱為的估計值。,4.區(qū)間估計:除點估計外,還有另一類估計問題,要求用區(qū)間作為可能取值范圍得一種估計,此區(qū)間稱為置信區(qū)間,該類估計問題稱為區(qū)間估計。5.參數(shù)估計方法:參數(shù)估計是統(tǒng)計學的經(jīng)典問題,解決方法很多,在此只考慮兩種常用方法:一種是最大似然估計方法,另一種是貝葉斯估計方法。(1)最大似然估計:把參數(shù)看作是確定而未知的,最好的估計值是在獲得實際觀察樣本的最大的條件下得到的。(2)貝葉斯估計:把未知的參數(shù)當作具有某種分布的隨機變量,樣本的觀察結(jié)果使先驗分布轉(zhuǎn)化為后驗分布,再根據(jù)后驗分布修正原先對參數(shù)的估計。6.參數(shù)估計的評價:評價一個估計的“好壞”,不能按一次抽樣結(jié)果得到的估計值與參數(shù)真值的偏差大小來確定,而必須從平均和方差的角度出發(fā)進行分析,即關(guān)于估計量性質(zhì)的定義。,4-2參數(shù)估計理論一.極大似然估計假定:①待估參數(shù)θ是確定的未知量②按類別把樣本分成M類X1,X2,X3,…XM其中第i類的樣本共N個Xi=(X1,X2,…XN)T并且是獨立從總體中抽取的③Xi中的樣本不包含(i≠j)的信息,所以可以對每一類樣本獨立進行處理。④第i類的待估參數(shù)根據(jù)以上四條假定,我們下邊就可以只利用第i類學習樣本來估計第i類的概率密度,其它類的概率密度由其它類的學習樣本來估計。,1.一般原則:第i類樣本的類條件概率密度:P(Xi/ωi)=P(Xi/ωi﹒θi)=P(Xi/θi)原屬于i類的學習樣本為Xi=(X1,X2,…XN,)Ti=1,2,…M求θi的極大似然估計就是把P(Xi/θi)看成θi的函數(shù),求出使它極大時的θi值?!邔W習樣本獨立從總體樣本集中抽取的∴N個學習樣本出現(xiàn)概率的乘積取對數(shù):,對θi求導,并令它為0:有時上式是多解的,上圖有5個解,只有一個解最大即.,P(Xi/θi),2.多維正態(tài)分布情況①∑已知,μ未知,估計μ服從正態(tài)分布所以在正態(tài)分布時,代入上式得,,所以,有,這說明未知均值的極大似然估計正好是訓練樣本的算術(shù)平均。,②∑,μ均未知A.一維情況:n=1對于每個學習樣本只有一個特征的簡單情況:(n=1)由上式得即學習樣本的算術(shù)平均樣本方差,討論:1.正態(tài)總體均值的極大似然估計即為學習樣本的算術(shù)平均2.正態(tài)總體方差的極大似然估計與樣本的方差不同,當N較大的時候,二者的差別不大。B.多維情況:n個特征(推導過程,作為練習)估計值:結(jié)論:①μ的估計即為學習樣本的算術(shù)平均②估計的協(xié)方差矩陣是矩陣的算術(shù)平均(nⅹn陣列,nⅹn個值),二.貝葉斯估計極大似然估計是把待估的參數(shù)看作固定的未知量,而貝葉斯估計則是把待估的參數(shù)作為具有某種先驗分布的隨機變量,通過對第i類學習樣本Xi的觀察,通過貝葉斯準則將概率密度分布P(Xi/θ)轉(zhuǎn)化為后驗概率P(θ/Xi),進而求使得后驗概率分布最大的參數(shù)估計,也稱最大后驗估計。估計步驟:①確定θ的先驗分布P(θ),待估參數(shù)為隨機變量。②用第i類樣本xi=(x1,x2,….xN)T求出樣本的聯(lián)合概率密度分布P(xi|θ),它是θ的函數(shù)。③利用貝葉斯公式,求θ的后驗概率④,下面以正態(tài)分布的均值估計為例說明貝葉斯估計的過程:一維正態(tài)分布:已知σ2,估計μ假設概率密度服從正態(tài)分布P(X|μ)=N(μ,σ2),P(μ)=N(μ0,σ02)第i類學習樣本xi=(x1,x2,….xN)T,i=1,2,…M第i類概率密度P(x|μi,xi)=P(x|xi)所以由貝葉斯公式,則可得后驗概率:,因為N個樣本是獨立抽取的,所以上式可以寫成其中為比例因子,只與x有關(guān),與μ無關(guān)∵P(Xk|μ)=N(μ,σ2),P(u)=N(μ0,σ02)其中a’,a’’包含了所有與μ無關(guān)的因子,∴P(μ|Xi)是u的二次函數(shù)的指數(shù)函數(shù)∴P(μ|Xi)仍然是一個正態(tài)函數(shù),P(μ|Xi)=N(μN,σN2)另外后驗概率可以直接寫成正態(tài)形式:比較以上兩個式子,對應的系數(shù)應該相等∴,解以上兩式得將μN,代入P(μ|Xi)可以得到后驗概率,再用公式,∴對μ的估計為若令P(μ)=N(μ0,σ02)=N(0,1),即為標準正態(tài)分布,且總體分布的方差也為1,則此時估計與極大似然估計相似,只是分母不同。,∵,三.貝葉斯學習1.貝葉斯學習的概念:通過已有的概率分布和觀測數(shù)據(jù)推理求出μ的后驗概率之后,直接去推導總體分布,即當觀察一個樣本時,N=1就會有一個μ的估計值的修正值;當觀察N=4時,對μ進行修正,向真正的μ靠近;當觀察N=9時,對μ進行修正,向真正的μ靠的更近;當觀察N個樣本后,μN就反映了觀察到N個樣本后對μ的最好推測,而σN2反映了這種推測的不確定性。N↑,σN2↓,σN2隨觀察樣本增加而單調(diào)減小,且當N→∞,σN2→0;當N↑,P(μ|xi)越來越尖峰突起,于是N→∞,P(μ|xi)→函數(shù),即收斂于一個以真實參數(shù)為中心的函數(shù),這個過程成為貝葉斯學習。,2.類概率密度的估計在求出u的后驗概率P(μ|xi)后,可以直接利用式推斷類條件概率密度。即P(x|xi)=P(x|ωi,xi)⑴一維正態(tài):已知σ2,μ未知∵μ的后驗概率為,結(jié)論:①把第i類的先驗概率P(ωi)與第i類概率密度P(x|xi)相乘可以得到第i類的后驗概率P(ωi|x),根據(jù)后驗概率可以分類。②對于正態(tài)分布P(x|xi),用樣本估計出來的μN代替原來的μ,用代替原來的方差即可。③把估計值μN作為μ的實際值,那么使方差由原來的變?yōu)?使方差增大;也就是說:用μ的估計值μN代替真實值μ,將引起不確定性增加。,⑵多維正態(tài)(已知Σ,估計μ)設P(x|μ)=N(μ,∑)P(μ)=N(μ0,∑0).根據(jù)Bayes公式,仿上面步驟可以得到:ΣN,μN有以下關(guān)系,其中a與μ無關(guān),這就是在多維情況下,對μ的估計。,4-3非參數(shù)估計參數(shù)估計要求密度函數(shù)的形式已知,但這種假定有時并不成立,常見的一些函數(shù)形式很難擬合實際的概率密度,經(jīng)典的密度函數(shù)都是單峰的,而在許多實際情況中卻是多峰的,因此用非參數(shù)估計。非參數(shù)估計:直接用已知類別樣本去估計總體密度分布,方法有:①用樣本直接去估計類概率密度p(x|ωi)以此來設計分類器,如窗口估計②用學習樣本直接估計后驗概率p(ωi|x)作為分類準則來設計分類器,如KN近鄰法。1.密度估計原理:一個隨機變量X落在區(qū)域R的概率為PP(X’)為P(X)在R內(nèi)的變化值,P(X)就是要求的總體概率密度,假設有N個樣本X=(X1,X2,…XN)T都是按照P(X)從總體中獨立抽取的,若N個樣本中有k個落入在R內(nèi)的概率符合二項分布其中,P是樣本X落入R內(nèi)的概率,Pk是k個樣本落入R內(nèi)的概率數(shù)學期望:E(k)=k=NP∴對概率P的估計:。是P的一個比較好的估計設P(x’)在R內(nèi)連續(xù)變化,當R逐漸減小的時候,小到使P(x)在其上幾乎沒有變化時,則其中是R包圍的體積,∴∴條件密度的估計:(V足夠小)討論:①當V固定的時候N增加,k也增加,當時只反映了P(x)的空間平均估計而反映不出空間的變化②N固定,體積變小當時,k=0時時所以起伏比較大,噪聲比較大,需要對V進行改進.,對體積V進行改進:為了估計X點的密度,我們構(gòu)造一串包括X的區(qū)域序列:R1,R2,...RN。對R1采用一個樣本進行估計,對R2采用二個樣本進行估計,...設VN是RN的體積,KN是N個樣本落入VN的樣本數(shù)則:密度的第N次估計:其中:VN是RN的體積,KN是N個樣本落入VN的樣本數(shù)∴PN(x)是P(x)的第N次估計,若PN(x)收斂于P(x)應滿足三個條件:①,當N↑時,VN↓,N→∞,VN→0這時雖然樣本數(shù)多,但由于VN↓,落入VN內(nèi)的樣本KN也減小,所以空間變化才反映出來;②,N↑,KN↑,N與KN同向變化;③,KN的變化遠小于N的變化。因此盡管在R內(nèi)落入了很多的樣本,但同總數(shù)N比較,仍然是很小的一部分。,如何選擇VN滿足以上條件:①使體積VN以N的某個函數(shù)減小,如(h為常數(shù)),窗口法。②使KN作為N的某個函數(shù),例VN的選擇使RN正好包含KN個近鄰V1→K1,V2→K2,…,VR→KR→KN近鄰法,2.Parzen窗口估計假設RN為一個d維的超立方體,hN為超立方體的長度∴超立方體體積為:,d=1,窗口為一線段d=2,窗口為一平面d=3,窗口為一立方體d>3,窗口為一超立方體窗口的選擇:,方窗函數(shù),指數(shù)窗函數(shù),正態(tài)窗函數(shù),Φ(u),Φ(u),Φ(u),,,,hN,正態(tài)窗函數(shù),∵ф(u)是以原點x為中心的超立方體?!嘣趚i落入方窗時,則有在VN內(nèi)為1不在VN內(nèi)為0落入VN的樣本數(shù)為所有為1者之和∴密度估計,討論:①每個樣本對估計所起的作用依賴于它到x的距離,即|x-xi|≤hN/2時,xi在VN內(nèi)為1,否則為0。②稱為的窗函數(shù),取0,1兩種值,但有時可以取0,0.1,0.2,…多種數(shù)值,例如隨xi離x接近的程度,取值由0,0.1,0.2,…到1。,③要求估計的PN(x)應滿足:為滿足這兩個條件,要求窗函數(shù)滿足:④窗長度hN對PN(x)的影響若hN太大,PN(x)是P(x)的一個平坦,分辨率低的估計,有平均誤差若hN太小,PN(x)是P(x)的一個不穩(wěn)定的起伏大的估計,有噪聲誤差為了使這些誤差不嚴重,hN應很好選擇。,例1:對于一個二類(ω1,ω2)識別問題,隨機抽取ω1類的6個樣本X=(x1,x2,….x6)ω1=(x1,x2,….x6)=(x1=3.2,x2=3.6,x3=3,x4=6,x5=2.5,x6=1.1)估計P(x|ω1)即PN(x)解:選正態(tài)窗函數(shù),,,,,,,,,0,1,2,3,4,5,6,,,,,,,x6,x5,x3,x1,x2,x4,x,∵x是一維的上式用圖形表示是6個分別以3.2,3.6,3,6,2.5,1.1為中心的丘形曲線(正態(tài)曲線),而PN(x)則是這些曲線之和。,由圖看出,每個樣本對估計的貢獻與樣本間的距離有關(guān),樣本越多,PN(x)越準確。,例2:設待估計的P(x)是個均值為0,方差為1的正態(tài)密度函數(shù)。若隨機地抽取X樣本中的1個、16個、256個作為學習樣本xi,試用窗口法估計PN(x)。解:設窗口函數(shù)為正態(tài)的,σ=1,μ=0hN:窗長度,N為樣本數(shù),h1為選定可調(diào)節(jié)的參數(shù)。,討論:由圖看出,PN(x)隨N,h1的變化情況①當N=1時,PN(x)是一個以第一個樣本為中心的正態(tài)形狀的小丘,與窗函數(shù)差不多。②當N=16及N=256時h1=0.25曲線起伏很大,噪聲大h1=1起伏減小h1=4曲線平坦,平均誤差③當N→∞時,PN(x)收斂于一平滑的正態(tài)曲線,估計曲線較好。,例3:待估的密度函數(shù)為兩個均勻分布密度的混合密度解:此為多峰情況的估計設窗函數(shù)為正態(tài),-2.5- 1.請仔細閱讀文檔,確保文檔完整性,對于不預覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 模式識別 概率 密度 函數(shù) 估計
鏈接地址:http://www.820124.com/p-11540652.html