《模式識別緒論》PPT課件.ppt
《《模式識別緒論》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《模式識別緒論》PPT課件.ppt(47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
,,,,,,,,,,,,,,,模式識別,2012年2月22日,自動化學(xué)院袁立,1,出勤:10%實驗:4學(xué)時,兩個實驗,10%考試:80%,開卷,課程要求,11:02,2,教材:張學(xué)工等編,《模式識別》清華大學(xué)出版社,2010年,第3版,參考書:RuchardO.Duda等模式分類(PatternClassification)機械工業(yè)出版社,2004年,課程要求,11:02,3,模式與模式識別的概念模式識別的主要方法監(jiān)督模式識別與非監(jiān)督模式識別模式識別系統(tǒng)的典型構(gòu)成模式識別系統(tǒng)應(yīng)用舉例,第一章緒論,4,一、模式識別,1.1模式與模式識別的概念,直觀,無所不在兒童認(rèn)數(shù)字:數(shù)字符號的識別讀書看報:文字識別汽車、火車,狗叫、人語:聲音識別人群中尋找一個人:根據(jù)面像、形體或其他特征進(jìn)行識別人類的模式識別能力是極其平常的,時刻在完成某種模式識別的任務(wù)。隨著社會活動以及生產(chǎn)科研的發(fā)展,需要識別的對象種類越來越多,內(nèi)容越來越復(fù)雜和深入,要求越來越高。為了減輕工作強度,希望計算機代替人來完成識別工作;有些場合環(huán)境惡劣、存在危險或人類不能接近,需要借助機器、運用分析算法進(jìn)行識別。,11:02,5,,第一章緒論,11:02,6,1.模式識別(PatternRecognition):使計算機模仿人的感知能力,從感知數(shù)據(jù)中提取信息(判別物體和行為)的過程。模式識別作為一門學(xué)科,是研究用機器完成自動識別事物的工作;研究內(nèi)容:使計算機做以前只能由人類才能做的事,具備人所具有的、對各種事物或現(xiàn)象進(jìn)行分析、描述與判斷的部分能力。模式識別學(xué)科形成于50~60年代,與眾多學(xué)科有聯(lián)系,尤其與人工智能和圖像處理關(guān)系密切。,,1.1模式與模式識別的概念,2.模式與模式類:模式:需要識別且可測量的對象的描述。這些對象與實際的應(yīng)用有關(guān),如:字符識別的模式——每個字符圖像人臉識別的模式——每幅人臉圖像模式類:當(dāng)用一定的度量來衡量兩個模式,而找不出它們之間的差別時,它們在這種度量條件下屬于同一等價類,就說它們是同一模式類。例如:數(shù)字識別有10個類別,每個數(shù)字就是一個類。不同模式類之間是可以區(qū)分的,應(yīng)有明確界限。,11:02,7,,1.1模式與模式識別的概念,3.識別最基本的方法:計算計算機根據(jù)已研制的識別算法,把輸入的未知模式劃入正確類別中,從而實現(xiàn)自動分類。識別算法中的關(guān)鍵環(huán)節(jié)就是要對待識別事物與標(biāo)準(zhǔn)“模板”的相似程度進(jìn)行計算。,特征向量表示法:將對事物進(jìn)行度量的指標(biāo)排成向量的形式。一維表示X1=1.5X2=3二維表示X1=(x1,x2)T=(1,2)TX2=(x1,x2)T=(2,1)T三維表示X1=(x1,x2,x3)T=(1,1,0)TX2=(x1,x2,x3)T=(1,0,1)T蘋果(重量,直徑,顏色),4.模式描述方法,,圖像的向量表示方法:在計算機里分析的稱為數(shù)字圖像,它由排列整齊的二維網(wǎng)格組成,分為若干行與若干列,相當(dāng)于一個二維數(shù)組,或稱矩陣。我們稱每個元素為像素。,左圖為57的數(shù)字圖像;一個數(shù)字就用57共35個網(wǎng)格是黑是白來表示;如令是黑為“1”,是白為“0”,那么一個數(shù)字就可用35維的二進(jìn)制向量表示。這就是典型的特征向量表示法,,1.1模式與模式識別的概念,結(jié)構(gòu)表示法:由事物的組成成分與相互關(guān)系表示在右側(cè)的圖中八個基元分別表示0,1,2,3,4,5,6,7,八個方向和基元線段長度。則右側(cè)樣本可以表示為X1=006666這種方法將在句法模式識別中用到。,二、模式識別簡史1929年G.Tauschek發(fā)明閱讀機,能夠閱讀0-9的數(shù)字。30年代Fisher提出統(tǒng)計分類理論,奠定了統(tǒng)計模式識別的基礎(chǔ)。統(tǒng)計模式識別是模式識別的主要理論。50年代NoamChemsky提出形式語言理論——傅京蓀提出句法結(jié)構(gòu)模式識別。60年代L.A.Zadeh提出了模糊集理論,模糊模式識別方法得以發(fā)展和應(yīng)用。80年代以Hopfield網(wǎng)、BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)復(fù)活,并在模式識別得到較廣泛的應(yīng)用。90年代小樣本學(xué)習(xí)理論,支持向量機受到了很大的重視。2000年,流形學(xué)習(xí)(manifoldlearning):流形學(xué)習(xí)就是從高維采樣數(shù)據(jù)中恢復(fù)低維流形結(jié)構(gòu),即找到高維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實現(xiàn)維數(shù)約簡或者數(shù)據(jù)可視化.2005年,稀疏表示(sparserepresentation):近年來有關(guān)生理學(xué)的研究成果表明:人類的視覺系統(tǒng)具有對圖像的稀疏表示特性,神經(jīng)元對于輸入圖像的激活機制具有高度的稀疏性.,,1.1模式與模式識別的概念,三.關(guān)于模式識別的國內(nèi)、國際學(xué)術(shù)組織,1973年IEEE發(fā)起了第一次關(guān)于模式識別的國際會議“ICPR”,成立了國際模式識別協(xié)會---“IAPR”,每2年召開一次國際學(xué)術(shù)會議。1977年IEEE的計算機學(xué)會成立了模式分析與機器智能(PAMI)委員會,每2年召開一次模式識別與圖象處理學(xué)術(shù)會議。國內(nèi)組織:中國自動化學(xué)會:模式識別與機器智能(PRMI)專業(yè)委員會,1981年成立,IAPR成員組織;人工智能與模式識別專業(yè)委員會;中國人工智能學(xué)會國內(nèi)學(xué)術(shù)機構(gòu):中科院模式識別國家重點實驗室,中科院計算所,微軟研究院,清華大學(xué)等。,11:02,10,,1.1模式與模式識別的概念,模式識別學(xué)科位置,模式識別:計算機科學(xué)與電子工程交叉學(xué)科中國:“控制科學(xué)與工程”一級學(xué)科二級學(xué)科:控制理論與控制工程、模式識別與智能系統(tǒng)、系統(tǒng)工程等西方:沒有自動控制系自動控制:電子工程系、機械工程系模式識別:電子工程系、計算機科學(xué)系,四、模式識別的應(yīng)用多媒體數(shù)據(jù)檢索(文檔、圖像、視頻、音樂檢索)字符識別(印刷體字符的識別;手寫體字符的識別(脫機/聯(lián)機),信函分揀、支票查對、自動排板、稿件輸入等)醫(yī)療診斷(心電圖,腦電圖,染色體,癌細(xì)胞識別,疾病診斷等)工程(產(chǎn)品缺陷檢測、自動導(dǎo)航系統(tǒng)、污染分析)軍事(航空攝像分析、雷達(dá)和聲納信號檢測和分類、自動目標(biāo)識別等)安全監(jiān)控(基于生物特征的身份識別、視頻監(jiān)控、交通監(jiān)控、音視頻監(jiān)聽),,1.1模式與模式識別的概念,現(xiàn)有生物特征識別類型,11:02,12,,1.1模式與模式識別的概念,,1.2模式識別的主要方法,基于知識的方法(Knowledge-based)AI、專家系統(tǒng)(ExpertSystems)句法(結(jié)構(gòu))模式識別(SyntaxPRorStructuralPR)(基于結(jié)構(gòu)性描述)基于數(shù)據(jù)的方法(Data-based)統(tǒng)計模式識別方法(StatisticalPR)(基于特征向量表示方法)人工神經(jīng)網(wǎng)絡(luò)(ANN)支持向量機(SVM),統(tǒng)計模式識別方法:在確定了描述樣本所采用的特征之后,收集一定數(shù)量的已知樣本,用這些樣本作為訓(xùn)練集來訓(xùn)練一定的模式識別機器,使之在訓(xùn)練后能夠?qū)ξ粗獦颖具M(jìn)行分類。這是基于數(shù)據(jù)的機器學(xué)習(xí)中研究最多的一個方向。,統(tǒng)計模式識別用函數(shù)表示:Y=F(X)X的定義域取自特征集Y的值域為類別的標(biāo)號集F是模式識別的判別方法有監(jiān)督模式識別——分類(classification)給出若干已知答案的樣本(訓(xùn)練樣本trainingsamples)由機器從這些樣本中進(jìn)行學(xué)習(xí)(訓(xùn)練training/learning)學(xué)習(xí)的目的在于從這些樣本中總結(jié)規(guī)律,使之能夠?qū)π碌臉颖具M(jìn)行判斷無監(jiān)督模式識別——聚類(clustering)所面對的只有未知答案的樣本由機器從這些樣本中進(jìn)行學(xué)習(xí)(自學(xué)習(xí))學(xué)習(xí)的目的在于從這些樣本中發(fā)現(xiàn)規(guī)律,這種規(guī)律應(yīng)該是某種固有的關(guān)系,或者依據(jù)這種規(guī)律對對象的分類有某種功用,,1.3監(jiān)督模式識別與非監(jiān)督模式識別,1.模式識別系統(tǒng):執(zhí)行模式識別的計算機系統(tǒng)。,1.4模式識別系統(tǒng)的典型構(gòu)成,,2.模式識別系統(tǒng)組成:信息獲取與預(yù)處理,特征提取與選擇、分類或聚類、后處理等四個部分。,,第一章緒論,1.4模式識別系統(tǒng)的典型構(gòu)成,,1.4模式識別系統(tǒng)的典型構(gòu)成,,1.4模式識別系統(tǒng)的典型構(gòu)成,,監(jiān)督模式識別系統(tǒng)組成:數(shù)據(jù)獲取,預(yù)處理,特征提取選擇、分類器設(shè)計以及分類決策五部分。,訓(xùn)練過程:對作為訓(xùn)練樣本的量測數(shù)據(jù)進(jìn)行特征選擇與提取,得到它們在特征空間的分布,依據(jù)這些分布決定分類器的具體參數(shù),也就是設(shè)計分類器的過程。識別過程:分類決策的過程,則是在特征空間中用統(tǒng)計方法把被識別對象歸為某一類別。,,3.監(jiān)督模式識別系統(tǒng)構(gòu)成及功能,,(1)信息獲?。河貌煌问降膫鞲衅鳂?gòu)成,實現(xiàn)信息獲取與信息在不同媒體之間的轉(zhuǎn)換,非電信號轉(zhuǎn)換成電信號。,,用話筒將聲音信號轉(zhuǎn)換成電信號,表現(xiàn)出電壓(電流)隨時間變化的復(fù)雜波形。景物信息在攝像機靶面成像并轉(zhuǎn)換成二維的象素矩陣,每個像素(矩陣元素)的電信號與物體表面反射的光強或顏色信息呈現(xiàn)函數(shù)關(guān)系,一般輸入對象的信息有三種類型:二維圖象,如文字、指紋、地圖、照片等一維波形,如腦電圖、心電圖、機械震動波形等物理參量和邏輯值,如疾病診斷中病人體溫,各種化驗數(shù)據(jù);或?qū)ΠY狀有無描述,如疼與不疼(0/1),1.4模式識別系統(tǒng)的典型構(gòu)成,,(2)預(yù)處理去除所獲取信息中的噪聲,增強有用的信息,及一切必要的使信息純化的處理過程。預(yù)處理這個環(huán)節(jié)內(nèi)容很廣泛,與要解決的具體問題有關(guān),例如,從圖象中將汽車車牌的號碼識別出來,就需要先將車牌從圖像中找出來,再對車牌進(jìn)行劃分,將每個數(shù)字分別劃分開。做到這一步以后,才能對每個數(shù)字進(jìn)行識別。以上工作都應(yīng)該在預(yù)處理階段完成。,(3)特征選擇和提取功能:對所獲取的信息實現(xiàn)從測量空間到特征空間的轉(zhuǎn)換。將所獲取的原始量測數(shù)據(jù)轉(zhuǎn)換成能反映事物本質(zhì),并將其最有效分類的特征表示。輸入:原始的量測數(shù)據(jù)(經(jīng)過必要的預(yù)處理),例如由聲波變換成的電信號,表現(xiàn)為電壓電流幅度隨時間的變化,二維圖像每個像素所具有的灰度值等。輸出:將原始量測數(shù)據(jù)轉(zhuǎn)換成有效方式表示的信息,從而使分類器能根據(jù)這些信息決定樣本的類別。,1.4模式識別系統(tǒng)的典型構(gòu)成,,特征選擇和提取:選擇什么樣的方法來描述事物,從而可以有效、牢靠地把事物正確地區(qū)分開。,,,,如令是黑為“1”,是白為“0”,那么一個數(shù)字就可用35維的二進(jìn)制向量表示。這就是典型的特征向量表示法。,另一種方法則是將數(shù)字用筆劃表示,也就是將它分成一橫加上一斜杠表示。這種表示方法屬于結(jié)構(gòu)表示法范疇。這種方法沒有前一種方法的缺點,但提取這種結(jié)構(gòu)信息也不是一件容易方便的事。,缺點:這種表示與網(wǎng)格的尺寸有關(guān),與字的筆劃粗細(xì)有關(guān),更主要的是字在網(wǎng)格中的不同位置與轉(zhuǎn)向有關(guān)。這個字在網(wǎng)格中略為偏一點,其特征向量表示就會有很大的不一樣。這就說明了這種表示的穩(wěn)定性差。,例:印刷體數(shù)字大多通過掃描儀輸入,或從圖像中獲取。這樣,一個數(shù)字往往用一個NM的數(shù)組表示。如果N=5,M=7,則一個數(shù)字就用57共35個網(wǎng)格是黑是白來表示。,1.4模式識別系統(tǒng)的典型構(gòu)成,,(4)分類器設(shè)計與分類決策分類器設(shè)計:將該特征空間劃分成由各類占據(jù)的子空間,確定相應(yīng)的決策分界和判決規(guī)則,使按此類判決規(guī)則分類時,錯誤率最低。把這些判決規(guī)則建成標(biāo)準(zhǔn)庫。分類決策:分類器在分界形式及其具體參數(shù)都確定后,用相應(yīng)的決策分界對待分類樣本進(jìn)行分類決策的過程。,,,,1.4模式識別系統(tǒng)的典型構(gòu)成,1.5模式識別系統(tǒng)實例,19名男女同學(xué)進(jìn)行體檢,測量了身高和體重,但事后發(fā)現(xiàn)其中有4人忘記填寫性別,試問(在最小錯誤的條件下)這4人是男是女?體檢數(shù)值如下:,11:02,24,,待識別的模式:性別(男或女)測量的特征:身高和體重訓(xùn)練樣本:15名已知性別的樣本特征,模式識別系統(tǒng)實例(一),目標(biāo):希望借助于訓(xùn)練樣本的特征建立判別函數(shù)(即數(shù)學(xué)模型)由訓(xùn)練樣本得到的特征空間分布圖:,11:02,25,,從圖中訓(xùn)練樣本的分布情況,找出男、女兩類特征各自的聚類特點,從而求取一個判別函數(shù)(直線或曲線)。只要給出待分類的模式特征的數(shù)值,看它在特征平面上落在判別函數(shù)的哪一側(cè),就可以判別是男還是女了。,1.5模式識別系統(tǒng)實例,,11:02,26,,魚類罐頭加工廠:將傳送帶上的魚按品種自動分類,即把不同的魚分開。魚的分類:鮭魚(salmon),鱸魚(seabass),模式識別系統(tǒng)實例(二),數(shù)據(jù)采集:用光學(xué)感知手段,定時拍攝魚的數(shù)字圖像,將其傳入計算機。預(yù)處理:增強圖像中感興趣的部分,抑制圖像中的噪聲,將不同的魚、魚與背景分離開來。特征提?。╢eatureextraction):待分對象鮭魚和鱸魚確實存在一些差異,比如長度、寬度、光澤和形狀等。利用類別之間的這些差異來分類。,1.5模式識別系統(tǒng)實例,11:02,27,,模式識別系統(tǒng)實例(二),特征提?。╢eatureextraction):待分對象鮭魚和鱸魚確實存在一些差異,比如長度、寬度、光澤和形狀等。利用類別之間的這些差異來分類。特征:從模式中提取的、對分類有用的特征。特征選擇是模式識別的核心問題之一。分類判別(classification)——單一特征先驗知識:鱸魚一般比鮭魚長。因此可以選擇長度為分類特征;長度l超過預(yù)定閾值l*時判定為鱸魚,否則判定為鮭魚。如何獲得長度閾值l*呢?(預(yù)定),1.5模式識別系統(tǒng)實例,11:02,28,,模式識別系統(tǒng)實例(二),利用特征直方圖獲得長度閾值l*,直方圖表明:無論怎樣確定長度閾值l*,都不能將兩類魚截然分開,分類錯誤比較嚴(yán)重。通常,單一特征不足以很好分類。,1.5模式識別系統(tǒng)實例,11:02,29,,模式識別系統(tǒng)實例(二),嘗試?yán)闷渌卣鳎呼~的光澤度,用x表示。,1.5模式識別系統(tǒng)實例,11:02,30,,模式識別系統(tǒng)實例(二),利用多個特征進(jìn)行分類形成特征空間:以每個特征為坐標(biāo)軸形成的空間。特征的個數(shù),就是特征空間的維數(shù)。特征向量:特征空間中的一個點。X=(x1,x2)T表示一條魚,x1代表長度,x2代表光澤度。分類器設(shè)計:要找到一個判定邊界,兩類問題?判定線判定線把特征空間分為兩個區(qū)域,識別時特征向量落在那個區(qū)域就判定為相應(yīng)類別。其總分類錯誤比單一特征分類器好一些,但仍存在一些錯誤的分類。,1.5模式識別系統(tǒng)實例,11:02,31,,模式識別系統(tǒng)實例(二),分類器的推廣能力:即分類器對未知模式的正確分類的能力復(fù)雜的分類算法導(dǎo)致復(fù)雜的判定邊界。判決曲線被過分調(diào)諧到這些訓(xùn)練樣本上,雖然所有訓(xùn)練樣本都被正確分類,但其推廣能力卻很差。比如:圖中的?新模式更像鮭魚,卻被分到鱸魚類了。,1.5模式識別系統(tǒng)實例,11:02,32,,模式識別系統(tǒng)實例(二),簡化分類器設(shè)計方案分類器設(shè)計無需上面那樣復(fù)雜,即便對訓(xùn)練樣本不能完美識別,只要對新模式有足夠的推廣能力就可以接受。分類器如何自動產(chǎn)生比較簡單的判決邊界,使其比上面的直線和復(fù)雜邊界更優(yōu)秀?如何預(yù)測分類器對新模式的推廣能力?這些都是模式識別要研究的問題。,1.5模式識別系統(tǒng)實例,,模式識別系統(tǒng)舉例(三):汽車車牌識別,,,,應(yīng)用領(lǐng)域:自動收費站,十字路口的違章車輛監(jiān)視等。,主要步驟:(1)圖像獲?。?)車牌的提取和定位(3)字符識別部分,1.5模式識別系統(tǒng)實例,,,,,1.5模式識別系統(tǒng)實例,11:02,35,,1.5模式識別系統(tǒng)實例,,車牌定位模塊目的:從整幅圖像中定位出車牌的精確位置。利用的信息:是車牌部分的紋理分布,主要利用的是水平和豎直兩個方向上的邊緣。在車牌部分,邊緣分布比較密集,可以利用這一點提取出候選的車牌區(qū)域,在圖中用方框標(biāo)出。粗略定位的結(jié)果往往不是很準(zhǔn),我們還可以利用顏色的連續(xù)性信息對定位的結(jié)果進(jìn)行修正。之后輸出的就是候選的車牌位置,這些位置中,只有一個是真正的車牌。而究竟哪一個是對的,要到字符識別階段才能有結(jié)果。,11:02,36,,1.5模式識別系統(tǒng)實例,,字符識別模塊目的:輸入包括每一個候選車牌區(qū)域,而通過它們的輸出評價,來把不合適的偽車牌區(qū)域去掉,只把最正確車牌的結(jié)果作為最終結(jié)果輸出出來。第一部分:字符分割,要把車牌中的一個個字符逐一切分開,這樣才能在下一步的識別中對每一個字符分別處理。分割方法:利用灰度圖像往水平方向的投影。在有數(shù)字或字符的部分,這個投影值應(yīng)該比較大,而在字符之間的間隙處,投影的累計值就幾乎為零了。確定是否車牌:如果劃分結(jié)果比較合理,劃分出的每個字符的寬度都差不多,那么說明這個區(qū)域比較像車牌。如果字體太寬,說明是其它的字符。,11:02,37,,1.5模式識別系統(tǒng)實例,模板匹配:是把樣本字符與輸入的待識別字符作匹配,如果兩個字符很像(在某種距離度量下距離很小),說明匹配成功,把這個模板的對應(yīng)字符作為輸出結(jié)果。特征提取:是對樣本和待測圖像都先提取一些明顯的特征,例如對“5”和“9”考慮其右上角是否封口,這樣作的好處是可以用維數(shù)較低的向量來描述圖像,而且這些特征都是有代表性,可以用來區(qū)分不同樣本的。,11:02,38,,第二部分:字符識別,方法很多:神經(jīng)元網(wǎng)絡(luò),PCA,特征提取及匹配等,模板匹配和特征提取是比較常用的方法。,1.5模式識別系統(tǒng)實例,,字符識別模塊的訓(xùn)練和識別過程,11:02,39,,車牌定位模塊的訓(xùn)練和識別,1.5模式識別系統(tǒng)實例,11:02,40,,其它應(yīng)用舉例:人臉檢測與跟蹤人臉識別視頻監(jiān)控異常行為分析智能交通,1.5模式識別系統(tǒng)實例,智能視覺物聯(lián)網(wǎng)(SmartVisualInternetofThings,SVIOT),物聯(lián)網(wǎng)是指通過各種信息傳感設(shè)備,如射頻識別(RFID)、紅外感應(yīng)器、藥理傳感器、聲音傳感器、圖像視頻傳感器等,實時采集其聲、光、熱、電、力學(xué)、化學(xué)、生物、位置等各種需要的信息,與互聯(lián)網(wǎng)結(jié)合形成的一個巨大網(wǎng)絡(luò)。其目的是實現(xiàn)物與物、物與人,所有的物品與網(wǎng)絡(luò)的連接,方便識別、管理和控制?!爸悄芤曈X物聯(lián)網(wǎng)”涉及物聯(lián)網(wǎng)的視覺感知部分,利用各類圖像獲取傳感器,包括監(jiān)控攝像機、手機、數(shù)碼相機,獲取人、車、物圖像或視頻,并采用智能分析技術(shù)對視覺信息進(jìn)行處理,為后續(xù)利用提供支撐。智能視覺物聯(lián)網(wǎng)它是未來物聯(lián)網(wǎng)中重要組成部分,對視覺感知范圍內(nèi)的人、車或其他物件等目標(biāo)賦以“身份”標(biāo)簽并識別目標(biāo)的實際“身份”,并利用網(wǎng)絡(luò)化特點對大范圍中的目標(biāo)標(biāo)簽進(jìn)行關(guān)聯(lián),有效地分析目標(biāo)標(biāo)簽物體的實時狀態(tài),感知各類異常事件,就異常事件的發(fā)生向相關(guān)受體提出自動警示。,11:02,41,,1.5模式識別系統(tǒng)實例,,,11:02,42,,學(xué)習(xí)機器的學(xué)習(xí)過程:使用一批包括各類別的訓(xùn)練樣本勾畫出各種事物在特征空間分布的規(guī)律性確定使用分類的具體數(shù)學(xué)公式及其參數(shù),1.6模式識別的若干問題,第一章緒論,,分類器設(shè)計:求優(yōu)化解的過程模式識別中的學(xué)習(xí)與訓(xùn)練是從訓(xùn)練樣本提供的數(shù)據(jù)中找出某種數(shù)學(xué)式子的最優(yōu)解,這個最優(yōu)解使分類器得到一組參數(shù),按這種參數(shù)設(shè)計的分類器使人們設(shè)計的某種準(zhǔn)則達(dá)到極值。分類器參數(shù)的選擇或?qū)W習(xí)過程得到的結(jié)果取決于設(shè)計者選擇什么樣的準(zhǔn)則函數(shù)。不同準(zhǔn)則函數(shù)的最優(yōu)解對應(yīng)不同的學(xué)習(xí)結(jié)果,得到性能不同的分類器。,,例:兩類訓(xùn)練樣本分布圖中兩類訓(xùn)練樣本的分布體現(xiàn)出近似圓形的分布。因此如能把這兩個圓形區(qū)域確定下來,將它們的邊界用某種數(shù)學(xué)式子近似,那么落在某一個圓形內(nèi)的樣本就可以用這種數(shù)學(xué)式子來判斷。當(dāng)不一定非要精確地表達(dá)不同類樣本分布地聚集區(qū)時。用一條直線(線性方程)也許可以達(dá)到同樣的目的。滿足直線的方程是一個線性方程,寫成f(x1,x2)=ax1+bx2+c=0,而不在該直線上的點則用f(x1,x2)是否大于零或小于零來分辨。,1.3模式識別的若干問題,,,一般來說,決定使用什么樣的分類函數(shù)往往是人為決定的。對一個實際分類問題,快速計算、快速分類是十分重要的。,兩類樣本在二維特征空間中有相互穿插很難用簡單的分界線將它們完全分開。直線作為分界線?線性分類器對圖中所示的樣本分布情況,無論直線參數(shù)如何設(shè)計,總會有錯分類發(fā)生。如果以錯分類最小為原則分類,則圖中A直線可能是最佳的分界線,它使錯分類的樣本數(shù)量為最小。,,2.模式的緊致性分類器設(shè)計難易程度與模式在特征空間的分布方式有密切關(guān)系。,1.3模式識別的若干問題,,,,,,(a)(b)(c),例:(a)、(b)與(c)分別表示了兩類在空間分布的三種狀況。其中(a)中兩類樣本存在各自明確的區(qū)域,它們之間的分界線(或面,超曲面)具有簡單的形式,因而也較易區(qū)分,(b)中兩類雖有各自不同的區(qū)域,但分界面的形式比較復(fù)雜,因而設(shè)計分類器的難度要大得多,如果遇到(c)類的情況則無法將它們正確分類。,緊致集:同一類模式類樣本的分布比較集中,沒有或臨界樣本很少,這樣的模式類稱緊致集。性質(zhì):(1)臨界點的數(shù)量與總的點數(shù)相比很少。(2)集合中任意兩個內(nèi)點可以用光滑線連接,在該連線上的點也屬于這個集合。(3)每個內(nèi)點都有一個足夠大的鄰域,在該鄰域中只包含同一集合中的點。,,特征提?。焊纳茢?shù)據(jù)的緊致性,1.3模式識別的若干問題,許多問題在量測空間表示時往往不滿足緊致性。但是如果它們的確是可分的話,這就意味著可以通過一種變換,使它們在相應(yīng)的特征空間中界線分明,也就是具有了緊致性。模式識別系統(tǒng)設(shè)計的任務(wù)就是要尋找這樣一種變換,即選擇一種特征空間,使不同類別的樣本能正確地分開。因此在討論模式識別的問題時,通常假設(shè)同一類的各個模式在該空間中組成一個緊致集。至于如何找到這種變換還沒有一種統(tǒng)一的有效的理論與方法。,,3.距離和相似性度量在特征空間中用特征向量描述樣本的屬性,把相似性度量用距離量表示。給定一個輸入樣本集合,用D維空間中的一個點表示某個樣本,可以選擇某個隨距離增加而下降的函數(shù)f作為兩個樣本和之間相似性度量,1.3模式識別的若干問題,歐式距離的減函數(shù),絕對值偏差的減函數(shù),偏差的夾角,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 模式識別緒論 模式識別 緒論 PPT 課件
鏈接地址:http://www.820124.com/p-11509618.html