模式識(shí)別課程報(bào)告
《模式識(shí)別課程報(bào)告》由會(huì)員分享,可在線閱讀,更多相關(guān)《模式識(shí)別課程報(bào)告(15頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、模式識(shí)別課程報(bào)告 什么是模式識(shí)別 引用 Anil K. Jain 的話對(duì)模式識(shí)別下定義: Pattern recognition is the study of how machines can observe the environment, learn to distinguish patterns of interest from their background, and make sound and reasonable decisions about the categories of the patterns. 什么是 Pattern 呢, Watanabe define
2、s a pattern “as oppaocshiteaoosf; it is an entity, vaguely defined, thatcould be given a name.比如說(shuō)一張指紋圖片,一個(gè)手寫(xiě) 的文字,一張人臉,一個(gè)說(shuō)話的信號(hào),這些都可以說(shuō)是一種模式。 識(shí)別在現(xiàn)實(shí)生活中是時(shí)時(shí)刻刻發(fā)生的,識(shí)別就是再認(rèn)知 (Re-Cog ni tio n),識(shí)別 主要做的是相似和分類的問(wèn)題, 按先驗(yàn)知識(shí)的分類, 可以把識(shí)別分為有監(jiān)督的學(xué) 習(xí)和沒(méi)有監(jiān)督的學(xué)習(xí),下面主要介紹的支持向量機(jī)就是屬于一種有監(jiān)督的學(xué)習(xí)。 模式識(shí)別與統(tǒng)計(jì)學(xué)、人 工智能、機(jī)器學(xué)習(xí)、運(yùn)籌學(xué)等有著很大的聯(lián)系,而 且各行
3、各業(yè)的工作者都在做著識(shí)別的工作,一個(gè)模式識(shí)別系統(tǒng)主要有三部分組 成:數(shù)據(jù)獲取和預(yù)處理,數(shù)據(jù)表達(dá)和決策。 模式識(shí)別的研究主要集中在兩方面,一是研究生物體 ( 包括人)是如何感知 對(duì)象的, 二是在給定的任務(wù)下, 如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。 前者 是生理學(xué)家、心理學(xué)家、生物學(xué)家、神經(jīng)生理學(xué)家的研究?jī)?nèi)容,屬于認(rèn)知科學(xué)的 范疇;后者通過(guò)數(shù)學(xué)家、 信息學(xué)專家和計(jì)算機(jī)科學(xué)工作者近幾十年來(lái)的努力, 已 經(jīng)取得了系統(tǒng)的研究成果。 模式識(shí)別的方法介紹: 模式識(shí)別方法(Pattern Recognition Method)是一種借助于計(jì)算機(jī)對(duì)信息進(jìn)行 處理、判決分類的數(shù)學(xué)統(tǒng)計(jì)方法。 應(yīng)用模式識(shí)別方
4、法的首要步驟是建立模式空間。 所謂模式空間是指在考察一客觀現(xiàn)象時(shí) ,影響目標(biāo)的眾多指標(biāo)構(gòu)成的多維空間。 每個(gè)指標(biāo)代表一個(gè)模式參量。假設(shè)一現(xiàn)象有幾個(gè)事件 (樣本) 組成,每一個(gè)事件都 有P個(gè)特征參量(X1 , X2,.…Xp ),則它就構(gòu)成P維模式空間,每一個(gè)事件的特征參 量代表一個(gè)模式。模式識(shí)別就是對(duì)多維空間中各種模式的分布特點(diǎn)進(jìn)行分析 ,對(duì) 模式空間進(jìn)行劃分 ,識(shí)別各種模式的聚類情況 ,從而做出判斷或決策。分析方法就 利用“映射說(shuō)和“逆映射說(shuō)技術(shù)。映射是指將多維模式空間進(jìn)行數(shù)學(xué)變換到二維 平面,多維空間的所有模式 (樣本點(diǎn) ) 都投影在該平面內(nèi)。在二維平面內(nèi) ,不同類別 的模式分布在不同
5、的區(qū)域之間有較明顯的分界域。 由此確定優(yōu)化方向返回到多維 空間 (原始空間 ) ,得出真實(shí)信息 ,幫助人們找出規(guī)律或做出決策 ,指導(dǎo)實(shí)際工作或 實(shí)驗(yàn)研究。 針對(duì)不同的對(duì)象和不同的目的 ,可以用不同的模式識(shí)別理論、方法,目前主 流的技術(shù)方法是 :統(tǒng)計(jì)模式識(shí)別、句法模式識(shí)別、模糊模式識(shí)別、神經(jīng)網(wǎng)絡(luò)法、 邏輯推理法。 (1) 統(tǒng)計(jì)模式識(shí)別 統(tǒng)計(jì)模式識(shí)別方法也稱為決策論模式識(shí)別方法 ,它是從被研究的模式中選擇 能足夠代表它的若干特征(設(shè)有d個(gè)),每一個(gè)模式都由這d個(gè)特征組成的在d維特 征空間的一個(gè)d維特征向量來(lái)代表,于是每一個(gè)模式就在d維特征空間占有一個(gè)位 置。一個(gè)合理的假設(shè)是同類的模式在特征空
6、間相距較近 ,而不同類的模式在特征 空間則相距較遠(yuǎn)。如果用某種方法來(lái)分割特征空間 ,使得同一類模式大體上都在 特征空間的同一個(gè)區(qū)域中,對(duì)于待分類的模式,就可根據(jù)它的特征向量位于特征空 間中的哪一個(gè)區(qū)域而判定它屬于哪一類模式。 這類識(shí)別技術(shù)理論比較完善。方法也很多,通常較為有效,現(xiàn)已形成了完整的 體系。盡管方法很多,但從根本上講,都是直接利用各類的分布特征,即利用各類的 概率分布函數(shù)、后驗(yàn)概率或隱含地利用上述概念進(jìn)行分類識(shí)別。 其中基本的技術(shù) 為聚類分析、判別類域界面法、統(tǒng)計(jì)判決等。 1) 聚類分析 在聚類分析中,利用待分類模式之間的“相似性”進(jìn)行分類,更相似的作為一 類,更不相似的作為另
7、外一類。在分類過(guò)程中不斷地計(jì)算所分劃的各類的中心 ,下 一個(gè)待分類模式以其與各類中心的距離作為分類的準(zhǔn)則。聚類準(zhǔn)則的確定 ,基本 上有兩種方式。一種是試探方式。憑直觀和經(jīng)驗(yàn) ,針對(duì)實(shí)際問(wèn)題定義一種相似性 測(cè)度的閾值,然后按最近鄰規(guī)則指定某些模式樣本屬于某一聚類類別。例如歐氏 距離測(cè)度,它反映樣本間的近鄰性,但將一個(gè)樣本分到兩個(gè)類別中的一個(gè)時(shí),必須 規(guī)定一距離測(cè)度的閾值作為聚類的判別準(zhǔn)則,按最近鄰規(guī)則的簡(jiǎn)單試探法和最大 最小聚類算法就是采用這種方式。另一種是聚類準(zhǔn)則函數(shù)法。定一種準(zhǔn)則函數(shù) , 其函數(shù)值與樣品的劃分有關(guān)。當(dāng)取得極小值時(shí),就認(rèn)為得到了最佳劃分。實(shí)際工 作中采用得最多的聚類方法之
8、一是系統(tǒng)聚類法。它將模式樣本按距離準(zhǔn)則逐步聚 類,類別由多到少,直到合適的分類要求為止。 2) 判別類域界面法 判別類域界面法中,用已知類別的訓(xùn)練樣本產(chǎn)生判別函數(shù),這相當(dāng)于學(xué)習(xí)或 訓(xùn)練。根據(jù)待分類模式代入判別函數(shù)后所得值的正負(fù)而確定其類別。 判別函數(shù)提 供了相鄰兩類判決域的界面,最簡(jiǎn)單、最實(shí)用的判別函數(shù)是線性判別函數(shù)。線性 判別函數(shù)的一般表達(dá)為下述矩陣式: d(X)佩&) Wm 其中,W^(Wi,W2,...,Wn)t,稱為權(quán)向量,X=(Xi,X2,…,訂為門維特征向量的樣 本,wn 4為閾值權(quán)。d(x)判別函數(shù)是n維特征空間中某個(gè)x點(diǎn)到超平面的距離。 若以Xp表示x到超平面H的
9、投影向量;r為到超平面H的垂直距離;||w0 ||為權(quán)向量 w的絕對(duì)值;Wo/ ||Wo 11為Wo方向上的單位向量,則有 0 利用線性判別函數(shù)進(jìn)行決策就是用一個(gè)超平面對(duì)特征空間進(jìn)行分割。超平 面H的方向由權(quán)向量決定,而位置由閾值權(quán)的數(shù)值確定,H把特征空間分割為兩個(gè) 決策區(qū)域。當(dāng)d(X) 0時(shí),x在H的正側(cè);d(X):::0時(shí),x在H的負(fù)側(cè)。 3) 統(tǒng)計(jì)判別 在統(tǒng)計(jì)判決中,在一些分類識(shí)別準(zhǔn)則下嚴(yán)格地按照概率統(tǒng)計(jì)理論導(dǎo)出各種判 決準(zhǔn)則,這些判決準(zhǔn)則要用到各類的概率密度函數(shù)、先驗(yàn)概率或條件概率,即貝葉 斯法則。貝葉斯判別原則有兩種形式,一種是基于最小錯(cuò)誤率,即若 p(Wj |
10、x) ?-p(Wj |x),則X* Wj(i,j =1,2,..., n;但i = j),換言之,要求最小錯(cuò)誤率,就是 要求p(wi |x)為最大。另一種是基于最小風(fēng)險(xiǎn),對(duì)于某個(gè)x取值采取決策所帶來(lái)的 n 風(fēng)險(xiǎn)定義為:R( : i|x)=E (jWj)八 * 'Ci,Wj)P(Wi|x),其中■ C i,wj)表示對(duì)于 - 一 i 二 某一樣品X,Wj,而采取決策:i時(shí)的損失?;谧钚★L(fēng)險(xiǎn)的貝葉斯規(guī)則為:若 R(〉k|x)二mi nR(〉i|x),則:?-。也就是說(shuō),對(duì)于所有x取值的條件風(fēng)險(xiǎn)R(r|x), 最小風(fēng)險(xiǎn)(損失)的決策是使R(_:? | x)取得最小值時(shí)的決策 4)支
11、持向量機(jī) 統(tǒng)計(jì)學(xué)習(xí)理論是一種專門的小樣本統(tǒng)計(jì)理論,為研究有限樣本情況下的統(tǒng)計(jì) 模式識(shí)別和更廣泛的機(jī)器學(xué)習(xí)問(wèn)題建立了一個(gè)較好的理論框架, 同時(shí)也發(fā)展了一 種新的模式識(shí)別方法一一支持向量機(jī),能夠較好的解決小樣本學(xué)習(xí)問(wèn)題。 基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方面 ,研究從觀測(cè)數(shù)據(jù)(樣本) 出發(fā)尋找規(guī)律,利用這些規(guī)律對(duì)未來(lái)數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。包括模式 識(shí)別、神經(jīng)網(wǎng)絡(luò)等在內(nèi),現(xiàn)有機(jī)器學(xué)習(xí)方法共同的重要理論基礎(chǔ)之一是統(tǒng)計(jì)學(xué)。 傳統(tǒng)統(tǒng)計(jì)學(xué)研究的是樣本數(shù)目趨于無(wú)窮大時(shí)的漸近理論, 現(xiàn)有學(xué)習(xí)方法也多是基 于此假設(shè),但在實(shí)際問(wèn)題中,樣本數(shù)往往是有限的,因此一些理論上很優(yōu)秀的學(xué) 習(xí)方法實(shí)際中
12、表現(xiàn)卻可能不盡人意。與傳統(tǒng)統(tǒng)計(jì)學(xué)相比 ,統(tǒng)計(jì)學(xué)習(xí)理論(Stat ist ical L earn ing Theo ry或SL T )是一種專門研究小樣本情況下機(jī)器學(xué)習(xí)規(guī)律的 理論.V. V apn ik等人從六、七十年代開(kāi)始致力于此方面研究,到九十年代中期, 隨著其理論的不斷發(fā)展和成熟,也由于神經(jīng)網(wǎng)絡(luò)等學(xué)習(xí)方法在理論上缺乏實(shí)質(zhì)性 進(jìn)展,統(tǒng)計(jì)學(xué)習(xí)理論開(kāi)始受到越來(lái)越廣泛的重視, 統(tǒng)計(jì)學(xué)習(xí)理論是建立在一套較 堅(jiān)實(shí)的理論基礎(chǔ)之上的,為解決有限樣本學(xué)習(xí)問(wèn)題提供了一個(gè)統(tǒng)一的框架。 它能 將很多現(xiàn)有方法納入其中,有望幫助解決許多原來(lái)難以解決的問(wèn)題(比如神經(jīng)網(wǎng) 絡(luò)結(jié)構(gòu)選擇問(wèn)題、局部極小點(diǎn)問(wèn)題等),同時(shí),
13、在這一理論基礎(chǔ)上發(fā)展了一種新 的通用學(xué)習(xí)方法 支持向量機(jī)(Support Vector Machine或SVM ),它已初步表 現(xiàn)出很多優(yōu)于已有方法的性能。一些學(xué)者認(rèn)為, SL T和SVM正在成為繼神經(jīng) 網(wǎng)絡(luò)研究之后新的研究熱點(diǎn),并將有力地推動(dòng)機(jī)器學(xué)習(xí)理論和技術(shù)的發(fā)展我國(guó)早 在八十年代末就有學(xué)者注意到統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)成果, 但之后較少研究,目前 只有少部分學(xué)者認(rèn)識(shí)到這個(gè)重要的研究方向。 本文旨在向國(guó)內(nèi)介紹統(tǒng)計(jì)學(xué)習(xí)理論 和支持向量機(jī)方法的基本思想和特點(diǎn),以使更多的學(xué)者能夠看到它們的優(yōu)勢(shì)從而 積極進(jìn)行研究。 支持向量機(jī)基本過(guò)程:(基于LIBSVM工具箱) 一、支持向量機(jī)是解決數(shù)據(jù)分類問(wèn)題
14、的一種流行技術(shù), 甚至有人認(rèn)為它用起來(lái)比 神經(jīng)網(wǎng)絡(luò)還要好用,但是,使用者對(duì) SVM不熟悉常常得到不理想的結(jié)果,這里 我們介紹一下如何使用支持向量機(jī)來(lái)得到較理想的結(jié)果。 我們介紹的主要是對(duì) SVM研究者的一個(gè)指導(dǎo),并不是說(shuō)要得到最好的精 度,我們也沒(méi)有打算解決什么有挑戰(zhàn)或者有難度的問(wèn)題,我們的目的是讓 SVM 研究者們掌握一個(gè)能有快又好的得到可行解得秘訣。 盡管使用者不用徹底理解SVM的理論,但是,我們簡(jiǎn)要介紹SVM的基礎(chǔ), 因?yàn)檫@些東西對(duì)于后面的解釋是有必要的。 一項(xiàng)分類工作通常包含訓(xùn)練數(shù)據(jù)和測(cè) 試數(shù)據(jù),這些數(shù)據(jù)就是一些例子,每個(gè)例子又包括它的類別和它的一些特性。 建 立SVM的
15、目的就是建立一個(gè)模版,這個(gè)模版可以預(yù)測(cè)訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)屬于 哪一類。 給定一組訓(xùn)練數(shù)據(jù)(x,y)i =1,…,1必? Rn,y. {-1,0,SVM需要解決下面 的最優(yōu)化問(wèn)題: min subject tri 這里x通過(guò)?函數(shù)影射到了一個(gè)高維或者無(wú)窮維的空間,SVM找到一個(gè)線 性可分的超平面,使得這個(gè)超平面在高維空間有最大的邊界值。C>0是對(duì)于錯(cuò)誤 部分的懲罰參數(shù)。此外,一 ' 被稱作核函數(shù),盡管研究者 不斷的提出新的核函數(shù),初學(xué)者可以在介紹 SVM的課本上找到四個(gè)基本的核函 數(shù): ? linear: x;) = Xj. * polynomiali K, x; j =『卞斗
16、了 x . + 廣產(chǎn)”牛 > 0. * radial ba^is function (RBF); Xj) = cxp(—丁||百一虧『)j > 0. ? sigmoid: i = taiih(-~rx; xj + r i. 這里,r,d都是核函數(shù)的參數(shù)。 (2) 句法模式識(shí)別 句法模式識(shí)別也稱為結(jié)構(gòu)模式識(shí)別。在許多情況下,對(duì)于較復(fù)雜的對(duì)象僅用 一些數(shù)值特征已不能較充分地進(jìn)行描述,這時(shí)可采用句法識(shí)別技術(shù)。句法識(shí)別技 術(shù)將對(duì)象分解為若干個(gè)基本單元,這些基本單元稱為基元;用這些基元以及他們的 結(jié)構(gòu)關(guān)系來(lái)描述對(duì)象,基元以及這些基元的結(jié)構(gòu)關(guān)系可以用一個(gè)字符串或一個(gè)圖 來(lái)表示;然后運(yùn)用形式語(yǔ)言理
17、論進(jìn)行句法分析,根據(jù)其是否符合某類的文法而決定 其類別。一個(gè)未知類別的模式字符串,當(dāng)它是屬于L(G)中的一個(gè)句子,就應(yīng)屬于 wi類。假如不屬于任何一種語(yǔ)言,則它可被拒識(shí),即x不被接受為M類中的任一類。 (3) 模糊模式識(shí)別 在人們的實(shí)際生活中,普遍存在著模糊概念,諸如“較冷”、“暖和”、“較重”、 “較輕”、“長(zhǎng)點(diǎn)”、“短點(diǎn)”等等都是一些有區(qū)別又有聯(lián)系的無(wú)確定分界的概念。 模糊識(shí)別技術(shù)運(yùn)用模糊數(shù)學(xué)的理論和方法解決模式識(shí)別問(wèn)題 ,因此適用于分類識(shí) 別對(duì)象本身或要求的識(shí)別結(jié)果具有模糊性的場(chǎng)合。 這類方法的有效性主要在于隸 屬函數(shù)是否良好。目前,模糊識(shí)別方法有很多,大致可以分為兩種,即根據(jù)
18、最大隸 屬原則進(jìn)行識(shí)別的直接法和根據(jù)擇近原則進(jìn)行歸類的間接法,分別簡(jiǎn)介如下 : 1)根據(jù)最大隸屬原則進(jìn)行識(shí)別的直接法 若已知個(gè)類型在被識(shí)別的全體對(duì)象U上的隸屬函數(shù),則可按隸屬原則進(jìn)行歸 類。此處介紹的是針對(duì)正態(tài)型模糊集的情形。 對(duì)于正態(tài)型模糊變量x,其隸屬度為 A(x)』b 其中a為均值,b2 =2二2,二2為相應(yīng)的方差 按泰勒級(jí)數(shù)展開(kāi),取近似值得: x - a :: b x —a b 若有n種類型m個(gè)指標(biāo)的情形,則第i種類型在第j種指標(biāo)上的隸屬函數(shù)是 ” 0 xgj(1)-bj 『aj(i) 1- Aj (x)二 -aj⑴ bij 1 aj⑴蘭x蘭aj(2) \-
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 導(dǎo)游服務(wù)技能
- 德國(guó)BASLER_品牌發(fā)布會(huì)方案
- 第1章聲現(xiàn)象(共27張PPT)分解
- 華為公司戰(zhàn)略規(guī)劃(PPT35頁(yè))
- 文明交往禮為先課件
- 《小獅子愛(ài)爾莎》課件3(教育精品)
- 高三化學(xué)上學(xué)期燃料電池復(fù)習(xí)專題
- 中國(guó)移動(dòng)企業(yè)文化理念體系宣講稿件
- 上海來(lái)福士廣場(chǎng)智能商場(chǎng)體驗(yàn)活動(dòng)方案Final(備份
- 節(jié)點(diǎn)電壓法經(jīng)典例題85299課件
- 腳手架荷載計(jì)算課件
- 有機(jī)化學(xué)酸堿理論
- 2013外研版英語(yǔ)七年級(jí)下冊(cè)M4_U2
- 某汽車鑄件質(zhì)量管理措施課件
- 第1講 種群的特征和數(shù)量變化