模式識別詳細(xì)PPT.ppt

上傳人：xt****7

文檔編號：6218779

上傳時(shí)間：2020-02-19

格式：PPT

頁數(shù)：712

大?。?6.59MB

《模式識別詳細(xì)PPT.ppt》由會員分享，可在線閱讀，更多相關(guān)《模式識別詳細(xì)PPT.ppt（712頁珍藏版）》請?jiān)谘b配圖網(wǎng)上搜索。

1 模式識別主講蔡宣平教授電話 73441 O 73442 H E mail xpcai 單位電子科學(xué)與工程學(xué)院信息工程系 2 課程對象相關(guān)學(xué)科教學(xué)方法教學(xué)目標(biāo) 基本要求教材參考文獻(xiàn) 關(guān)于本課程的有關(guān)說明 3 課程對象信息工程專業(yè)本科生的專業(yè)課學(xué)院碩士研究生的學(xué)位課學(xué)院博士研究生的必修課之一 4 相關(guān)學(xué)科統(tǒng)計(jì)學(xué) 概率論線性代數(shù) 矩陣計(jì)算形式語言人工智能圖像處理計(jì)算機(jī)視覺等等 5 教學(xué)方法著重講述模式識別的基本概念基本方法和算法原理注重理論與實(shí)踐緊密結(jié)合實(shí)例教學(xué) 通過實(shí)例講述如何將所學(xué)知識運(yùn)用到實(shí)際應(yīng)用之中避免引用過多的繁瑣的數(shù)學(xué)推導(dǎo) 6 教學(xué)目標(biāo) 掌握模式識別的基本概念和方法有效地運(yùn)用所學(xué)知識和方法解決實(shí)際問題為研究新的模式識別的理論和方法打下基礎(chǔ) 7 基本要求基本完成課程學(xué)習(xí) 通過考試獲得學(xué)分提高能夠?qū)⑺鶎W(xué)知識和內(nèi)容用于課題研究解決實(shí)際問題飛躍通過模式識別的學(xué)習(xí) 改進(jìn)思維方式為將來的工作打好基礎(chǔ) 終身受益 8 教材參考文獻(xiàn) 孫即祥現(xiàn)代模式識別國防科技大學(xué)出版社 2003年吳逸飛譯模式識別原理方法及應(yīng)用清華大學(xué)出版社 2003年李晶皎等譯模式識別第三版電子工業(yè)出版社 2006年 9 講授課程內(nèi)容及安排第一章引論第二章聚類分析第三章判別域代數(shù)界面方程法第四章統(tǒng)計(jì)判決第五章學(xué)習(xí) 訓(xùn)練與錯(cuò)誤率估計(jì)第六章最近鄰方法第七章特征提取和選擇上機(jī)實(shí)習(xí) 10 第一章引論 1 1概述1 2特征矢量和特征空間1 3隨機(jī)矢量的描述1 4正態(tài)分布概念模式識別 PatternRecognition 確定一個(gè)樣本的類別屬性模式類的過程即把某一樣本歸屬于多個(gè)類型中的某個(gè)類型樣本 Sample 一個(gè)具體的研究客觀對象如患者某人寫的一個(gè)漢字一幅圖片等模式 Pattern 對客體研究對象特征的描述定量的或結(jié)構(gòu)的描述是取自客觀世界的某一樣本的測量值的集合或綜合特征 Features 能描述模式特性的量測量值在統(tǒng)計(jì)模式識別方法中通常用一個(gè)矢量表示稱之為特征矢量記為模式類 Class 具有某些共同特性的模式的集合概念模式識別的例子計(jì)算機(jī)自動診斷疾病獲取情況信息采集測量體溫血壓心率血液化驗(yàn) X光透射 B超心電圖 CT等盡可能多的信息并將這些信息數(shù)字化后輸入電腦當(dāng)然在實(shí)際應(yīng)用中要考慮采集的成本這就是說特征要進(jìn)行選擇的運(yùn)行在電腦中的專家系統(tǒng)或?qū)Ｓ贸绦蚩梢苑治鲞@些數(shù)據(jù)并進(jìn)行分類得出正?；虿徽５呐袛?不正常情況還要指出是什么問題 14 各類空間 Space 的概念模式采集從客觀世界對象空間到模式空間的過程稱為模式采集特征提取和特征選擇由模式空間到特征空間的變換和選擇類型判別特征空間到類型空間所作的操作模式識別三大任務(wù) 15 1 1概述模式識別系統(tǒng) 通常在采集信息過程中還要去除所獲取信息中的噪聲增強(qiáng)有用的信息等工作這種使信息純化的處理過程叫做信息的預(yù)處理分類識別是根據(jù)事先確定的分類規(guī)則對前面選取的特征進(jìn)行分類即識別通常能描述對象的元素很多為節(jié)約資源和提高處理速度有時(shí)更為了可行性在滿足分類識別正確率要求的條件下按某種準(zhǔn)則盡量選用對正確分類識別作用較大的特征使得用較少的特征就能完成分類識別任務(wù) 預(yù)處理這個(gè)環(huán)節(jié)的內(nèi)容很廣泛與要解決的具體問題有關(guān) 例如從圖象中將汽車車牌的號碼識別出來就需要先將車牌從圖像中找出來再對車牌進(jìn)行劃分將每個(gè)數(shù)字分別劃分開做到這一步以后才能對每個(gè)數(shù)字進(jìn)行識別以上工作都應(yīng)該在預(yù)處理階段完成數(shù)字化比特流 16 1 1概述模式識別系統(tǒng) 17 1 1概述模式識別系統(tǒng) 模式識別系統(tǒng)的主要環(huán)節(jié) 特征提取符號表示如長度波形特征選擇選擇有代表性的特征能夠正確分類學(xué)習(xí)和訓(xùn)練利用已知樣本建立分類和識別規(guī)則分類識別對所獲得樣本按建立的分類規(guī)則進(jìn)行分類識別 18 紙幣識別器對紙幣按面額進(jìn)行分類面額 1 1概述系統(tǒng)實(shí)例 5元10元20元50元100元 19 1 1概述系統(tǒng)實(shí)例長度 mm 寬度 mm 5元1366310元1417020元1467050元15170100元15677 20 1 1概述系統(tǒng)實(shí)例磁性金屬條位置大約 5元有54 8210元有54 8720元有57 8950元有60 91100元有63 93 5元10元20元50元100元 12345678 反射光波形 22 1 1概述系統(tǒng)實(shí)例數(shù)據(jù)采集特征提取長度寬度磁性磁性的位置光反射亮度光透射亮度等等特征選擇長度磁性及位置反射亮度分類識別確定紙幣的面額及真?zhèn)?23 1 1概述系統(tǒng)實(shí)例訓(xùn)練集是一個(gè)已知樣本集在監(jiān)督學(xué)習(xí)方法中用它來開發(fā)出模式分類器測試集在設(shè)計(jì)識別和分類系統(tǒng)時(shí)沒有用過的獨(dú)立樣本集系統(tǒng)評價(jià)原則為了更好地對模式識別系統(tǒng)性能進(jìn)行評價(jià) 必須使用一組獨(dú)立于訓(xùn)練集的測試集對系統(tǒng)進(jìn)行測試 24 例汽車車牌識別從攝像頭獲取包含車牌的彩色圖象車牌定位和獲取字符分割和識別 25 26 27 1 1概述模式識別的基本方法一統(tǒng)計(jì)模式識別二句法模式識別三模糊模式識別四人工神經(jīng)網(wǎng)絡(luò)法五人工智能方法 28 1 1概述模式識別的基本方法一統(tǒng)計(jì)模式識別模式描述方法特征向量模式判定模式類用條件概率分布P X i 表示 m類就有m個(gè)分布然后判定未知模式屬于哪一個(gè)分布 29 1 1概述模式識別的基本方法一統(tǒng)計(jì)模式識別理論基礎(chǔ) 概率論數(shù)理統(tǒng)計(jì)主要方法線性非線性分類 Bayes決策聚類分析主要優(yōu)點(diǎn) 1 比較成熟2 能考慮干擾噪聲等影響3 識別模式基元能力強(qiáng)主要缺點(diǎn) 1 對結(jié)構(gòu)復(fù)雜的模式抽取特征困難2 不能反映模式的結(jié)構(gòu)特征難以描述模式的性質(zhì)3 難以從整體角度考慮識別問題 30 1 1概述模式識別的基本方法二句法模式識別模式描述方法符號串樹圖模式判定是一種語言用一個(gè)文法表示一個(gè)類 m類就有m個(gè)文法然后判定未知模式遵循哪一個(gè)文法 31 例2 如下圖中一幅圖形要識別圖中的物體選用句法模式識別方法 1 1概述模式識別的基本方法 32 解圖形結(jié)構(gòu)復(fù)雜首先應(yīng)分解為簡單的子圖背景物體構(gòu)成一個(gè)多級樹結(jié)構(gòu) 1 1概述模式識別的基本方法 33 在學(xué)習(xí)過程中確定基元與基元之間的關(guān)系推斷出生成景物的方法判決過程中首先提取基元識別基元之間的連接關(guān)系使用推斷的文法規(guī)則做句法分析若分析成立則判斷輸入的景物屬于相應(yīng)的類型 1 1概述模式識別的基本方法 34 理論基礎(chǔ) 形式語言自動機(jī)技術(shù)主要方法自動機(jī)技術(shù) CYK剖析算法 Early算法轉(zhuǎn)移圖法主要優(yōu)點(diǎn) 1 識別方便可以從簡單的基元開始由簡至繁 2 能反映模式的結(jié)構(gòu)特征能描述模式的性質(zhì) 3 對圖象畸變的抗干擾能力較強(qiáng) 主要缺點(diǎn) 當(dāng)存在干擾及噪聲時(shí) 抽取特征基元困難且易失誤 1 1概述模式識別的基本方法 35 1 1概述模式識別的基本方法三模糊模式識別模式描述方法模糊集合A a a b b n n 模式判定是一種集合運(yùn)算用隸屬度將模糊集合劃分為若干子集 m類就有m個(gè)子集然后根據(jù)擇近原則分類 36 理論基礎(chǔ) 模糊數(shù)學(xué)主要方法模糊統(tǒng)計(jì)法二元對比排序法推理法模糊集運(yùn)算規(guī)則模糊矩陣主要優(yōu)點(diǎn) 由于隸屬度函數(shù)作為樣本與模板間相似程度的度量故往往能反映整體的與主體的特征從而允許樣本有相當(dāng)程度的干擾與畸變主要缺點(diǎn) 準(zhǔn)確合理的隸屬度函數(shù)往往難以建立故限制了它的應(yīng)用 1 1概述模式識別的基本方法 37 1 1概述模式識別的基本方法四人工神經(jīng)網(wǎng)絡(luò)法模式描述方法以不同活躍度表示的輸入節(jié)點(diǎn)集神經(jīng)元模式判定是一個(gè)非線性動態(tài)系統(tǒng) 通過對樣本的學(xué)習(xí)建立起記憶然后將未知模式判決為其最接近的記憶 38 理論基礎(chǔ) 神經(jīng)生理學(xué) 心理學(xué)主要方法 BP模型 HOP模型高階網(wǎng)主要優(yōu)點(diǎn) 可處理一些環(huán)境信息十分復(fù)雜背景知識不清楚推理規(guī)則不明確的問題允許樣本有較大的缺損畸變主要缺點(diǎn) 模型在不斷豐富與完善中目前能識別的模式類還不夠多 1 1概述模式識別的基本方法 39 1 1概述模式識別的基本方法五邏輯推理法人工智能法模式描述方法字符串表示的事實(shí)模式判定是一種布爾運(yùn)算從事實(shí)出發(fā)運(yùn)用一系列規(guī)則推理得到不同結(jié)果 m個(gè)類就有m個(gè)結(jié)果 40 理論基礎(chǔ) 演繹邏輯布爾代數(shù)主要方法產(chǎn)生式推理語義網(wǎng)推理框架推理主要優(yōu)點(diǎn) 已建立了關(guān)于知識表示及組織目標(biāo)搜索及匹配的完整體系對需要眾多規(guī)則的推理達(dá)到識別目標(biāo)確認(rèn)的問題有很好的效果主要缺點(diǎn) 當(dāng)樣本有缺損背景不清晰規(guī)則不明確甚至有歧義時(shí) 效果不好 1 1概述模式識別的基本方法 41 1 1概述模式識別的發(fā)展簡史 1929年G Tauschek發(fā)明閱讀機(jī) 能夠閱讀0 9的數(shù)字 30年代Fisher提出統(tǒng)計(jì)分類理論奠定了統(tǒng)計(jì)模式識別的基礎(chǔ) 50年代NoamChemsky提出形式語言理論傅京蓀提出句法結(jié)構(gòu)模式識別 60年代L A Zadeh提出了模糊集理論模糊模式識別方法得以發(fā)展和應(yīng)用 42 1 1概述模式識別的發(fā)展簡史 80年代以Hopfield網(wǎng) BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)復(fù)活并在模式識別得到較廣泛的應(yīng)用 90年代小樣本學(xué)習(xí)理論支持向量機(jī)也受到了很大的重視 43 1 1概述模式識別的應(yīng)用舉例生物學(xué)自動細(xì)胞學(xué) 染色體特性研究遺傳研究天文學(xué)天文望遠(yuǎn)鏡圖像分析自動光譜學(xué)經(jīng)濟(jì)學(xué)股票交易預(yù)測企業(yè)行為分析醫(yī)學(xué)心電圖分析腦電圖分析醫(yī)學(xué)圖像分析 44 1 1概述主要實(shí)用系統(tǒng)舉例文字識別 CharacterRecognition OCR OpticalCharacterRecognition 智能交通 IntelligentTraffic 車牌車型語音識別 Speechrecognition 翻譯機(jī) 身份識別等目標(biāo)識別ATR AutomaicTargetRecognition 45 46 1 2特征矢量和特征空間 47 1 3隨機(jī)矢量的描述隨機(jī)矢量在模式識別過程中要對許多具體對象進(jìn)行測量以獲得許多次觀測值每次觀測值不一定相同所以對許多對象而言各個(gè)特征分量都是隨機(jī)變量即許多對象的特征向量在n維空間中呈隨機(jī)性分布稱為隨機(jī)矢量 48 1 3隨機(jī)矢量的描述一隨機(jī)矢量的分布函數(shù) 設(shè)為隨機(jī)矢量為確定性矢量隨機(jī)矢量的聯(lián)合概率分布函數(shù)定義為式中表示括號中事件同時(shí)發(fā)生的概率 49 1 3隨機(jī)矢量的描述一隨機(jī)矢量的分布函數(shù) 隨機(jī)矢量的聯(lián)合概率密度函數(shù)定義為 50 1 3隨機(jī)矢量的描述 51 1 3隨機(jī)矢量的描述 x p x 52 1 3隨機(jī)矢量的描述 53 1 3隨機(jī)矢量的描述二隨機(jī)矢量的數(shù)字特征其中的分量式中是的第個(gè)分量的邊緣密度隨機(jī)矢量的均值矢量的各分量是相應(yīng)的各隨機(jī)分量的均值 54 1 3隨機(jī)矢量的描述二隨機(jī)矢量的數(shù)字特征條件期望在模式識別中經(jīng)常以類別作為條件在這種情況下隨機(jī)矢量的條件期望矢量定義為 55 1 3隨機(jī)矢量的描述隨機(jī)矢量的自協(xié)方差矩陣表征各分量圍繞其均值的散布情況及各分量間的相關(guān)關(guān)系其定義為二隨機(jī)矢量的數(shù)字特征協(xié)方差矩陣 56 1 3隨機(jī)矢量的描述 57 1 3隨機(jī)矢量的描述 58 1 3隨機(jī)矢量的描述二隨機(jī)矢量的數(shù)字特征相關(guān)系數(shù) 由布尼亞科夫斯基不等式知相關(guān)系數(shù)矩陣定義為 59 1 3隨機(jī)矢量的描述 60 1 3隨機(jī)矢量的描述 61 1 3隨機(jī)矢量的描述 62 1 3隨機(jī)矢量的描述 63 1 4正態(tài)分布 64 1 4正態(tài)分布 1 一維隨機(jī)變量的正態(tài)分布 65 1 4正態(tài)分布 66 1 4正態(tài)分布 2 隨機(jī)矢量的正態(tài)分布正態(tài)分布隨機(jī)矢量的概率密度函數(shù)定義為 67 1 4正態(tài)分布 68 1 4正態(tài)分布 2 二維隨機(jī)變量的正態(tài)分布 69 1 4正態(tài)分布范例木板圖象512 512d 3長度紋理亮度c 2松木樺木維數(shù)無限有限很大R有限d不大c 總結(jié) 模式識別過程 d R 無限 71 試證明對于正態(tài)分布不相關(guān)與獨(dú)立是等價(jià)的試證明多元正態(tài)隨機(jī)矢量的線性變換仍為多元正態(tài)隨機(jī)矢量試證明多元正態(tài)隨機(jī)矢量X的分量的線性組合是一正態(tài)隨機(jī)變量習(xí)題 72 模式識別主講蔡宣平教授電話 73441 O 73442 H E mail xpcai 單位電子科學(xué)與工程學(xué)院信息工程系 73 第二章聚類分析 ClusteringAnalysis 2 1聚類分析的概念2 2模式相似性測度2 3類的定義與類間距離2 4聚類的算法 74 2 1聚類分析的概念一聚類分析的基本思想相似的歸為一類模式相似性的度量和聚類算法無監(jiān)督分類 Unsupervised 二特征量的類型物理量重量長度速度次序量等級技能學(xué)識名義量性別狀態(tài) 種類第二章聚類分析 75 三方法的有效性取決于分類算法和特征點(diǎn)分布情況的匹配 2 1聚類分析的概念分類無效時(shí)的情況1 特征選取不當(dāng)使分類無效第二章聚類分析 76 三方法的有效性取決于分類算法和特征點(diǎn)分布情況的匹配 2 1聚類分析的概念分類無效時(shí)的情況2 特征選取不足可能使不同類別的模式判為一類第二章聚類分析 77 三方法的有效性取決于分類算法和特征點(diǎn)分布情況的匹配 2 1聚類分析的概念分類無效時(shí)的情況3 特征選取過多可能無益反而有害增加分析負(fù)擔(dān)并使分析效果變差第二章聚類分析 78 三方法的有效性取決于分類算法和特征點(diǎn)分布情況的匹配 2 1聚類分析的概念分類無效時(shí)的情況4 量綱選取不當(dāng) 第二章聚類分析 79 三方法的有效性取決于分類算法和特征點(diǎn)分布情況的匹配 2 1聚類分析的概念分類無效時(shí)的情況4 量綱選取不當(dāng) 第二章聚類分析 80 三方法的有效性取決于分類算法和特征點(diǎn)分布情況的匹配 2 1聚類分析的概念分類無效時(shí)的情況4 量綱選取不當(dāng) 第二章聚類分析 81 下列是一些動物的名稱羊 sheep 狗 dog 藍(lán)鯊 blueshark 蜥蜴 lizard 毒蛇 viper 貓 cat 麻雀 sparrow 海鷗 seagull 金魚 goldfish 緋鯢鰹 red mullet 蛙 frog 要對這些動物進(jìn)行分類則不同的特征有不同的分法特征選取不同對聚類結(jié)果的影響第二章聚類分析 82 特征選取不同對聚類結(jié)果的影響羊狗貓藍(lán)鯊蜥蜴毒蛇麻雀海鷗金魚緋鯢鰹青蛙 a 按繁衍后代的方式分哺乳動物非哺乳動物第二章聚類分析 83 金魚緋鯢鰹藍(lán)鯊羊狗貓蜥蜴毒蛇麻雀海鷗青蛙 b 按肺是否存在分無肺有肺特征選取不同對聚類結(jié)果的影響第二章聚類分析 84 青蛙羊狗貓蜥蜴毒蛇麻雀海鷗金魚緋鯢鰹藍(lán)鯊 c 按生活環(huán)境分陸地水里兩棲特征選取不同對聚類結(jié)果的影響第二章聚類分析 85 藍(lán)鯊金魚緋鯢鰹蜥蜴毒蛇麻雀海鷗青蛙羊狗貓 d 按繁衍后代方式和肺是否存在分非哺乳且有肺哺乳且無肺哺乳且有肺非哺乳且無肺特征選取不同對聚類結(jié)果的影響第二章聚類分析 86 距離測度不同聚類結(jié)果也不同數(shù)據(jù)的粗聚類是兩類細(xì)聚類為4類第二章聚類分析 87 綜上可見選擇什么特征選擇多少個(gè)特征選擇什么樣的量綱選擇什么樣的距離測度這些對分類結(jié)果都會產(chǎn)生極大影響第二章聚類分析 88 聚類過程遵循的基本步驟一特征選擇 featureselection 盡可能多地包含任務(wù)關(guān)心的信息二近鄰測度 proximitymeasure 定量測定兩特征如何相似或不相似三聚類準(zhǔn)則 clusteringcriterion 以蘊(yùn)涵在數(shù)據(jù)集中類的類型為基礎(chǔ) 四聚類算法 clusteringalgorithm 按近鄰測度和聚類準(zhǔn)則揭示數(shù)據(jù)集的聚類結(jié)構(gòu) 五結(jié)果驗(yàn)證 validationoftheresults 常用逼近檢驗(yàn)驗(yàn)證聚類結(jié)果的正確性六結(jié)果判定 interpretationoftheresults 由專家用其他方法判定結(jié)果的正確性 89 聚類應(yīng)用的四個(gè)基本方向一減少數(shù)據(jù)許多時(shí)候當(dāng)數(shù)據(jù)量N很大時(shí) 會使數(shù)據(jù)處理變得很費(fèi)力因此可使用聚類分析的方法將數(shù)據(jù)分成幾組可判斷的聚類m m N 來處理每一個(gè)類可當(dāng)作獨(dú)立實(shí)體來對待從這個(gè)角度看數(shù)據(jù)被壓縮了第二章聚類分析 90 二假說生成在這種情況下為了推導(dǎo)出數(shù)據(jù)性質(zhì)的一些假說對數(shù)據(jù)集進(jìn)行聚類分析因此這里使用聚類作為建立假說的方法然后用其他數(shù)據(jù)集驗(yàn)證這些假說聚類應(yīng)用的四個(gè)基本方向第二章聚類分析 91 聚類應(yīng)用的四個(gè)基本方向三假說檢驗(yàn)用聚類分析來驗(yàn)證指定假說的有效性例如考慮這樣的假說大公司在海外投資要驗(yàn)證這個(gè)假說是否正確就要對大公司和有代表性的公司按規(guī)模海外活躍度成功完成項(xiàng)目的能力等進(jìn)行聚類分析從而來支持這個(gè)假說第二章聚類分析 92 四基于分組的預(yù)測對現(xiàn)有數(shù)據(jù)進(jìn)行聚類分析形成模式的特征并用特征表示聚類接下來對于一個(gè)未知模式就可以用前面的聚類來確定是哪一類聚類應(yīng)用的四個(gè)基本方向例如考慮被同種疾病感染的病人數(shù)據(jù)集先按聚類分析進(jìn)行分類然后對新的病人確定他適合的聚類從而判斷他病情第二章聚類分析 93 2 2模式相似性測度用于描述各模式之間特征的相似程度距離測度相似測度匹配測度第二章聚類分析 94 2 2模式相似性測度一距離測度差值測度測度基礎(chǔ) 兩個(gè)矢量矢端的距離測度數(shù)值兩矢量各相應(yīng)分量之差的函數(shù) 第二章聚類分析 95 2 2模式相似性測度常用的距離測度有 1 歐氏 Euclidean 距離第二章聚類分析 96 2 2模式相似性測度 4 明氏 Minkowski 距離 2 2 4 2 絕對值距離街坊距離或Manhattan距離 2 2 2 3 切氏 Chebyshev 距離 2 2 3 第二章聚類分析 97 2 2模式相似性測度第二章聚類分析 98 2 2模式相似性測度 5 馬氏 Mahalanobis 距離注意馬氏距離對一切非奇異線性變換都是不變的這說明它不受特征量綱選擇的影響并且是平移不變的上面的V的含義是這個(gè)矢量集的協(xié)方差陣的統(tǒng)計(jì)量故馬氏距離加入了對特征的相關(guān)性的考慮第二章聚類分析 99 2 2模式相似性測度第二章聚類分析 100 101 現(xiàn)金識別例子歐氏平均距離數(shù)據(jù)樣本介紹 10個(gè)文本文件文件名 rmb00 txt rmb09 txt每個(gè)文件有4個(gè)幣種的數(shù)據(jù) 分別是 100圓 50圓 20圓 10圓每個(gè)幣種有新舊兩種版本 4個(gè)方向故有8個(gè)數(shù)據(jù)塊如100圓的8個(gè)數(shù)據(jù)塊 data100a data100b data100c data100d 老版data100e data100f data100g data100h 新版每個(gè)數(shù)據(jù)塊有8個(gè)傳感器數(shù)據(jù) 傳感器1 傳感器2 傳感器8每個(gè)傳感器有60個(gè)采樣數(shù)據(jù) 數(shù)據(jù)1 數(shù)據(jù)2 數(shù)據(jù)60 102 現(xiàn)金識別例子 Eucliden 15 000000Manhattan 33 000000Chebyshev 11 000000Minkowski 11 039449 m 8 100元A面第1個(gè)樣本第10點(diǎn)和20點(diǎn)的距離X 75 76 101 83 102 96 91 82 Y 70 74 90 76 99 96 90 86 X Y 5 2 11 7 3 0 1 4 距離測度rmbdis 103 現(xiàn)金識別例子歐式平均距離 100a 100a 2 65 49 66 24 41100a 100b 16 37 55 87 33 97100a 100c 3 87 58 34 29 41100a 100d 6 86 53 74 33 04100a 100e 3 87 62 12 27 51100a 100f 13 60 67 61 34 67100a 100g 11 40 68 56 32 27100a 100h 11 27 68 61 34 43100a 50a 18 76 76 20 40 72100a 20a 13 23 81 28 42 87100a 10a 12 45 90 91 54 99 104 現(xiàn)金識別例子 100圓A面的馬式矩陣SW為 43 553 964 852 752 752 346 837 953 9132 0137 5107 859 674 052 131 564 8137 5165 9124 174 684 167 637 152 7107 8124 1105 557 567 254 535 252 759 674 657 576 271 765 857 952 374 084 167 271 773 162 855 046 852 167 654 565 862 859 651 937 931 537 135 257 955 051 954 7 105 現(xiàn)金識別例子 SW的逆矩陣為 0 3 0 00 1 0 1 0 1 0 1 0 20 2 0 00 3 0 1 0 10 1 0 60 30 20 1 0 10 3 0 1 0 0 0 2 0 30 4 0 1 0 1 0 10 20 10 3 0 1 0 2 0 10 1 0 00 10 7 0 7 0 40 2 0 1 0 6 0 20 3 0 72 2 0 0 1 0 0 20 3 0 3 0 1 0 4 0 01 2 0 50 20 20 4 0 20 2 1 0 0 51 0 106 現(xiàn)金識別例子馬式平均距離 100a 7 46 80 05 39 73100b 26 75 179 86 91 89100c 14 50 231 44 103 76100d 11 69 155 28 78 58100e 5 65 2968 84 247 42100f 39 19 2191 91 108 10100g 10 68 2875 99 265 16100h 9 41 2673 54 107 5650a 22 78 221 07 101 4120a 22 51 343 26 162 9010a 20 93 975 67 256 38 107 現(xiàn)金識別例子馬式平均距離 a 39 73101 41162 90256 38b 91 89230 25288 69659 47c 103 76135 94257 57724 96d 78 58171 10330 97675 90e 247 42443 46333 93218 71f 108 10328 11305 19607 51g 265 16956 58818 83348 42h 107 56339 64387 10628 88 100圓50圓20圓10圓其中馬式矩陣為100圓A面的上面是各面到100圓A面的均值點(diǎn)的平均馬式距離 108 現(xiàn)金識別例子 100圓A面的傳感器1到其它各面?zhèn)鞲衅?的街坊距離 109 2 2模式相似性測度二相似測度測度基礎(chǔ) 以兩矢量的方向是否相近作為考慮的基礎(chǔ) 矢量長度并不不重要設(shè) 1 角度相似系數(shù) 夾角余弦 2 2 11 注意坐標(biāo)系的旋轉(zhuǎn)和尺度的縮放是不變的但對一般的線形變換和坐標(biāo)系的平移不具有不變性 110 現(xiàn)金識別例子 100圓A面?zhèn)鞲衅?與其它各面的相似系數(shù) 111 2 2模式相似性測度二相似測度2 相關(guān)系數(shù)它實(shí)際上是數(shù)據(jù)中心化后的矢量夾角余弦 2 2 12 112 現(xiàn)金識別例子 100圓A面?zhèn)鞲衅?與其它各面的相關(guān)系數(shù) 113 2 2模式相似性測度二相似測度3 指數(shù)相似系數(shù) 2 2 13 式中為相應(yīng)分量的協(xié)方差為矢量維數(shù) 它不受量綱變化的影響 114 現(xiàn)金識別例子 100圓A面?zhèn)鞲衅?與其它各面的相關(guān)系數(shù) 115 2 2模式相似性測度當(dāng)特征只有兩個(gè)狀態(tài) 0 1 時(shí) 常用匹配測度 0表示無此特征1表示有此特征故稱之為二值特征對于給定的x和y中的某兩個(gè)相應(yīng)分量xi與yj若xi 1 yj 1 則稱xi與yj是 1 1 匹配若xi 1 yj 0 則稱xi與yj是 1 0 匹配若xi 0 yj 1 則稱xi與yj是 0 1 匹配若xi 0 yj 0 則稱xi與yj是 0 0 匹配二匹配測度 116 2 2模式相似性測度 117 2 2模式相似性測度三匹配測度 1 Tanimoto測度 118 例2 2 2 可以看出它等于共同具有的特征數(shù)目與分別具有的特征種類總數(shù)之比這里只考慮 1 1 匹配而不考慮 0 0 匹配設(shè) 則 2 2模式相似性測度 119 現(xiàn)金識別例子 100圓A面與其它各面的匹配系數(shù)Tanimoto 120 2 2模式相似性測度三匹配測度 2 Rao測度注 1 1 匹配特征數(shù)目和所選用的特征數(shù)目之比 121 現(xiàn)金識別例子 100圓A面與其它各面的匹配系數(shù)Rao 122 2 2模式相似性測度三匹配測度 3 簡單匹配系數(shù) 注上式分子為 1 1 匹配特征數(shù)目與 0 0 匹配特征數(shù)目之和分母為所考慮的特征數(shù)目 123 現(xiàn)金識別例子 100圓A面與其它各面的匹配系數(shù)Simple 124 2 2模式相似性測度三匹配測度 4 Dice系數(shù) 5 Kulzinsky系數(shù) 125 現(xiàn)金識別例子 100圓A面與其它各面的匹配系數(shù)dice 126 現(xiàn)金識別例子 100圓A面與其它各面的匹配系數(shù)Kulzinsky 127 作業(yè) P44 2 1 2 3 128 2 3類的定義與類間距離 2 3 1類的定義定義之1設(shè)集合S中任意元素xi與yj間的距離dij有dij h其中h為給定的閥值稱S對于閥值h組成一類類的定義有很多種類的劃分具有人為規(guī)定性這反映在定義的選取及參數(shù)的選擇上一個(gè)分類結(jié)果的優(yōu)劣最后只能根據(jù)實(shí)際來評價(jià) 書中的其它定義方法請大家自行參考學(xué)習(xí) 129 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法 130 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法 131 現(xiàn)金識別例子 100圓A面與其它各面的最小距離 132 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法 133 現(xiàn)金識別例子 100圓A面與其它各面的最大距離 134 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法 p q k 135 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法 np nq分別為類wp和wq的樣本個(gè)數(shù) 136 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法 137 現(xiàn)金識別例子 100圓A面與其它各面的平均距離 138 2 3類的定義與類間距離 2 3 2類間距離測度方法最近距離法最遠(yuǎn)距離法中間距離法重心距離法平均距離法離差平方和法分別為對應(yīng)類的重心類內(nèi)離差平方和遞推公式為 139 140 2 3類的定義與類間距離 2 3 3聚類的準(zhǔn)則函數(shù) 判別分類結(jié)果好壞的一般標(biāo)準(zhǔn) 類內(nèi)距離小類間距離大某些算法需要一個(gè)能對分類過程或分類結(jié)果的優(yōu)劣進(jìn)行評估的準(zhǔn)則函數(shù) 如果聚類準(zhǔn)則函數(shù)選擇得好聚類質(zhì)量就會高聚類準(zhǔn)則往往是和類的定義有關(guān)的是類的定義的某種體現(xiàn) 141 2 3 3聚類的準(zhǔn)則函數(shù) 一類內(nèi)距離準(zhǔn)則設(shè)有待分類的模式集在某種相似性測度基礎(chǔ)上被劃分為類類內(nèi)距離準(zhǔn)則函數(shù)定義為表示類的模式均值矢量 2 3 20 2 3類的定義與類間距離 142 2 3類的定義與類間距離 143 加權(quán)類內(nèi)距離準(zhǔn)則 2 3 22 2 3 23 144 2 3類的定義與類間距離 145 加權(quán)類間距離準(zhǔn)則 2 3 25 146 2 3類的定義與類間距離 147 的類內(nèi)離差陣定義為 2 3 28 2 3類的定義與類間距離式中為類的模式均值矢量 2 3 29 148 149 例2 3 1證明 2 3類的定義與類間距離 150 聚類的基本目的是使或利用線形代數(shù)有關(guān)矩陣的跡和行列式的性質(zhì) 可以定義如下4個(gè)聚類的準(zhǔn)則函數(shù) 2 3類的定義與類間距離 151 2 3類的定義與類間距離由它們的構(gòu)造可以看出為得到好的聚類結(jié)果應(yīng)該使它們盡量的大這類準(zhǔn)則也大量用在特征提取和選擇中 152 2 3類的定義與類間距離 J1 7 60886J2 0 0010397J3 15 6089J4 62 9116 用紙幣數(shù)據(jù)計(jì)算獲得的結(jié)果 153 作業(yè) P44 2 4 2 5 2 6 154 2 4聚類的算法 2 4 1聚類的技術(shù)方案聚類分析有很多具體的算法有的比較簡單有的相對復(fù)雜和完善但歸納起來就是三大類 1 按最小距離原則簡單聚類方法2 按最小距離原則進(jìn)行兩類合并的方法3 依據(jù)準(zhǔn)則函數(shù)動態(tài)聚類方法 155 2 4聚類的算法 1 簡單聚類方法針對具體問題確定相似性閾值將模式到各聚類中心間的距離與閾值比較當(dāng)大于閾值時(shí)該模式就作為另一類的類心小于閾值時(shí)按最小距離原則將其分劃到某一類中這類算法運(yùn)行中模式的類別及類的中心一旦確定將不會改變 156 2 4聚類的算法首先視各模式自成一類然后將距離最小的兩類合并成一類不斷地重復(fù)這個(gè)過程直到成為兩類為止 2 按最小距離原則進(jìn)行兩類合并的方法這類算法運(yùn)行中類心不斷地修正但模式類別一旦指定后就不再改變就是模式一旦劃為一類后就不再被分劃開這類算法也稱為譜系聚類法 157 2 4聚類的算法 3 依據(jù)準(zhǔn)則函數(shù)動態(tài)聚類法設(shè)定一些分類的控制參數(shù) 定義一個(gè)能表征聚類結(jié)果優(yōu)劣的準(zhǔn)則函數(shù) 聚類過程就是使準(zhǔn)則函數(shù)取極值的優(yōu)化過程算法運(yùn)行中類心不斷地修正各模式的類別的指定也不斷地更改這類方法有 C均值法 ISODATA法等 158 2 4聚類的算法簡單聚類方法 159 2 4聚類的算法簡單聚類方法 160 2 4聚類的算法簡單聚類方法 161 2 4聚類的算法簡單聚類方法這類算法的突出優(yōu)點(diǎn)是算法簡單但聚類過程中類的中心一旦確定將不會改變模式一旦指定類后也不再改變算法特點(diǎn) 從算法的過程可以看出該算法結(jié)果很大程度上依賴于距離門限T的選取及模式參與分類的次序如果能有先驗(yàn)知識指導(dǎo)門限T的選取通?？色@得較合理的效果也可考慮設(shè)置不同的T和選擇不同的次序最后選擇較好的結(jié)果進(jìn)行比較 162 2 4聚類的算法簡單聚類方法簡單聚類圖例 163 例2 4 1 初始條件不同的簡單聚類結(jié)果初始中心不同 12345 12345 12345 12345 1098 1098 876 876 1167 1167 91011 91011 164 2 4聚類的算法簡單聚類法程序 simpleclustering 165 2 4聚類的算法最大最小距離法 166 2 4聚類的算法最大最小距離法算法原理步驟 167 計(jì)算未被作為聚類中心的各模式特征矢量與之間的距離并求出它們之中的最小值為表述簡潔雖然某些模式已選做聚類中心但上面仍將所有模式下角標(biāo)全部列寫出來因這并不影響算法的正確性即 168 169 170 2 4聚類的算法最大最小距離法程序 maxminclustering 171 2 4聚類的算法層次聚類法 HierarchicalClusteringMethod 系統(tǒng)聚類法譜系聚類法按最小距離原則不斷進(jìn)行兩類合并 2 4 3譜系聚類法 172 2 4聚類的算法層次聚類法 HierarchicalClusteringMethod 系統(tǒng)聚類法譜系聚類法按最小距離原則不斷進(jìn)行兩類合并算法思想首先將N個(gè)模式視作各自成為一類然后計(jì)算類與類之間的距離選擇距離最小的一對合并成一個(gè)新類計(jì)算在新的類別分劃下各類之間的距離再將距離最近的兩類合并直至所有模式聚成兩類為止 2 4 3譜系聚類法 173 2 4聚類的算法 2 4 3譜系聚類法 174 2 4聚類的算法 2 4 3譜系聚類法 175 例2 4 3 如下圖所示1 設(shè)全部樣本分為6類 2 作距離矩陣D 0 3 求最小元素 4 把 1 3合并 7 1 3 4 6合并 8 4 6 5 作距離矩陣D 1 D 0 176 例2 4 3 如下圖所示1 設(shè)全部樣本分為6類 2 作距離矩陣D 0 3 求最小元素 4 把 1 3合并 7 1 3 4 6合并 8 4 6 5 作距離矩陣D 1 D 1 177 6 若合并的類數(shù)沒有達(dá)到要求轉(zhuǎn)3 否則停止 3 求最小元素 4 8 5 2合并 9 2 5 4 6 178 179 2 4聚類的算法譜系聚類法程序 Hierarchicalclustering 180 2 4聚類的算法最大距離和層次聚類算法的一個(gè)共同特點(diǎn)是某個(gè)模式一旦劃分到某一類之后在后繼的算法過程中就不改變了而簡單聚類算法中類心一旦選定后在后繼算法過程中也不再改變了因此這些方法效果一般不會太理想 181 2 確定評估聚類質(zhì)量的準(zhǔn)則函數(shù) 3 確定模式分劃及聚類合并或分裂的規(guī)則 2 4聚類的算法動態(tài)聚類算法要點(diǎn) 182 2 4聚類的算法動態(tài)聚類的基本步驟建立初始聚類中心進(jìn)行初始聚類計(jì)算模式和類的距離調(diào)整模式的類別計(jì)算各聚類的參數(shù) 刪除合并或分裂一些聚類從初始聚類開始運(yùn)用迭代算法動態(tài)地改變模式的類別和聚類的中心使準(zhǔn)則函數(shù)取得極值或設(shè)定的參數(shù)達(dá)到設(shè)計(jì)要求時(shí)停止 183 2 4聚類的算法動態(tài)聚類的框圖產(chǎn)生初始聚類中心聚類檢驗(yàn)聚類合理性待分類模式 184 條件及約定設(shè)待分類的模式特征矢量集為類的數(shù)目C是事先取定的 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法算法思想該方法取定C個(gè)類別和選取C個(gè)初始聚類中心按最小距離原則將各模式分配到C類中的某一類之后不斷地計(jì)算類心和調(diào)整各模式的類別最終使各模式到其判屬類別中心的距離平方之和最小 185 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法 186 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法 187 選代表點(diǎn) 4 動態(tài)聚類框圖 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法 188 例2 4 2使用聚類算法實(shí)現(xiàn)圖像分割在散射圖上形成了兩個(gè)聚類利用模式識別的方法將其分開就實(shí)現(xiàn)了圖象的分割 189 例2 4 3 已知有20個(gè)樣本每個(gè)樣本有2個(gè)特征數(shù)據(jù)分布如下圖使用C 均值法實(shí)現(xiàn)樣本分類 C 2 第一步令C 2 選初始聚類中心為 190 191 0 0 第二步 192 193 194 195 第三步更新聚類中心 196 197 第四步第二步第三步更新聚類中心 198 199 clustering 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法程序 200 作業(yè) P45 2 7 2 8 201 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法關(guān)于C 均值法收斂性的分析 202 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法當(dāng)模式分布呈現(xiàn)類內(nèi)團(tuán)聚狀 C 均值算法是能達(dá)到很好的聚類結(jié)果故應(yīng)用較多從算法的迭代過程看 C 均值算法是能使各模式到其所判屬的類別中心距離平方之和為最小的最佳聚類 203 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法的改進(jìn) 在類別數(shù)未知的情況下可使類數(shù)C由較小值逐步增加對于每個(gè)選定的C分別使用該算法顯然準(zhǔn)則函數(shù)J是隨C的增加而單調(diào)減少 C的調(diào)整作一條C一J曲線其曲率變化的最大點(diǎn)對應(yīng)的類數(shù)是比較接近最優(yōu)的類數(shù) 在增加過程中總會出現(xiàn)使本來較密集的類再拆開的情況此時(shí)J雖減小但減小速度將變緩如果作一條C一J曲線其曲率變化的最大點(diǎn)對應(yīng)的類數(shù)是比較接近最優(yōu)的類數(shù) 然而在許多情況下曲線并無明顯的這樣的點(diǎn) 204 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法的改進(jìn) 初始聚類中心的選取憑經(jīng)驗(yàn)選擇初始類心將模式隨機(jī)地分成C類計(jì)算每類中心以其作為初始類心最大密度求以每個(gè)特征點(diǎn)為球心某一正數(shù)d0為半徑的球形域中特征點(diǎn)個(gè)數(shù) 這個(gè)數(shù)稱為該點(diǎn)的密度選取密度最大的特征點(diǎn)作為第一個(gè)初始類心Z1 然后在與Z1大于某個(gè)距離d的那些特征點(diǎn)中選取具有最大密度的特征點(diǎn)作為第二個(gè)初始類心Z2 如此進(jìn)行選取C個(gè)初始聚類中心 205 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法的改進(jìn) 初始聚類中心的選取用相距最遠(yuǎn)的C個(gè)特征點(diǎn)作為初始類心具體地講是按前述的最大最小距離算法求取C個(gè)初始聚類中心當(dāng)N較大時(shí) 先隨機(jī)地從N個(gè)模式中取出一部分模式用譜系聚類法聚成C類以每類的重心作為初始類心設(shè)已標(biāo)準(zhǔn)化的待分類模式集為希望將它們分為C類 206 設(shè)已標(biāo)準(zhǔn)化的待分類模式集為希望將它們分為C類設(shè) 計(jì)算顯然0 ai C 若ai最接近整數(shù)j 則把xi分劃至中wj 對所有樣本都實(shí)行上述處理就可實(shí)現(xiàn)初始分類從而產(chǎn)生初始聚類中心 207 2 4聚類的算法 2 4 3動態(tài)聚類法 C 均值法的改進(jìn) 用類核代替類心前面的算法存在一個(gè)不足即只用一個(gè)聚類中心點(diǎn)作為一類的代表但一個(gè)點(diǎn)往往不能充分地反映該類的模式分布結(jié)構(gòu) 從而損失了很多有用的信息當(dāng)類的分布不是球狀或近似球狀時(shí) 這種算法很難有較好的效果此時(shí) 可用類核代替類心類核可以是一個(gè)函數(shù) 一個(gè)點(diǎn)集或其他適當(dāng)?shù)哪Ｐ?比如前面我們講過的馬式距離 208 3 動態(tài)聚類法 ISODATA算法 IterativeSelf OrganizingDataAnalysisTechniquesAlgorithm迭代自組織數(shù)據(jù)分析特點(diǎn) 啟發(fā)性推理分析監(jiān)督控制聚類結(jié)構(gòu)及人機(jī)交互算法思想在每輪迭代過程中樣本重新調(diào)整類別之后計(jì)算類內(nèi)及類間有關(guān)參數(shù) 并和設(shè)定的門限比較確定是兩類合并為一類還是一類分裂為兩類不斷地自組織以達(dá)到在各參數(shù)滿足設(shè)計(jì)要求條件下使各模式到其類心的距離平方和最小 209 ISODATA算法原理步驟預(yù)置設(shè)定聚類分析控制參數(shù) 預(yù)期的類數(shù) 每一類中允許的最少模式數(shù)目初始聚類中心個(gè)數(shù) 可以不等于c 類內(nèi)各分量分布的距離標(biāo)準(zhǔn)差上界分裂用兩類中心間的最小距離下界合并用在每次迭代中可以合并的類的最多對數(shù) 允許的最多迭代次數(shù) 210 ISODATA算法原理步驟 211 ISODATA算法原理步驟 212 ISODATA算法原理步驟計(jì)算各類的中心計(jì)算分類后的參數(shù) 各類中心類內(nèi)平均距離及總體平均距離計(jì)算各類中模式到類心的平均距離計(jì)算各個(gè)模式到其類內(nèi)中心的總體平均距離 213 ISODATA算法原理步驟 214 ISODATA算法原理步驟計(jì)算各類類內(nèi)距離的標(biāo)準(zhǔn)差矢量式中為分量編號為類的編號為矢量維數(shù) 是的第個(gè)分量是的第個(gè)分量 215 ISODATA算法原理步驟 216 ISODATA算法原理步驟 217 ISODATA算法原理步驟 218 ISODATA算法原理步驟 219 220 ISODATA算法舉例二維 1 初始值設(shè)定類間距離上限距離標(biāo)準(zhǔn)差上界最少模式數(shù)目合并的類的最多對數(shù) 221 ISODATA算法舉例 2 聚類只有一個(gè)中心 222 ISODATA算法舉例 3 因無合并 4 計(jì)算聚類中心類內(nèi)平均距離和總的平均距離 223 ISODATA算法舉例 5 因不是最后一步迭代且轉(zhuǎn)至 6 求的標(biāo)準(zhǔn)差矢量 224 ISODATA算法舉例 7 算得 6 因且將分裂成兩類取則且轉(zhuǎn) 2 225 ISODATA算法舉例 2 聚類兩個(gè)中心 3 因無合并 226 ISODATA算法舉例 4 計(jì)算聚類中心類內(nèi)平均距離和總的平均距離 5 因這是偶次迭代滿足算法原理步驟中的條件故轉(zhuǎn) 227 ISODATA算法舉例 11 因不是最后一次迭代題設(shè) 判斷是否修改參數(shù) 由上面結(jié)果可知已獲得所要求類別數(shù)目類間距離大于類內(nèi)距離每類樣本數(shù)都有樣本總數(shù)的足夠大的百分比因此不改變參數(shù) 228 2 4 計(jì)算結(jié)果與前一次迭代結(jié)果相同 7 分裂條件不滿足轉(zhuǎn)至無新的變化轉(zhuǎn)至 6 計(jì)算和的標(biāo)準(zhǔn)差矢量 5 沒有任一種情況被滿足到與前一次迭代結(jié)果相同無合并發(fā)生 229 與前一次迭代結(jié)果相同因是最后一次迭代令轉(zhuǎn)至同前因無合并發(fā)生因是最后一次迭代結(jié)束 230 ISODATA流程 231 232 233 輸入樣本數(shù)據(jù) 置c Nc 選初始類心zj j 1 2 Nc 1 置控制參數(shù) n s D L I 2 聚類 ifdil min D xi z1 D xi z2 D xi zNc thenxi l 3 合并判決 nj n N Y Nc Nc 1 4 計(jì)算分類后的參數(shù) 類心zj 類內(nèi)平均距離dj 總類內(nèi)平均距離d 234 作業(yè) P45 2 9 2 10 235 模式識別主講蔡宣平教授電話 73441 O 73442 H E mail xpcai 單位電子科學(xué)與工程學(xué)院信息工程系 236 第三章判別域代數(shù)界面方程法 3 1用判別域界面方程分類的概念 3 2線性判別函數(shù) 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 3 4Fisher線性判別 3 5一次準(zhǔn)則函數(shù)及梯度下降法 3 6二次準(zhǔn)則函數(shù)及其解法 3 9廣義線性判別函數(shù) 3 10二次判別函數(shù) 3 12位勢函數(shù)分類法 237 3 1用判別域界面方程分類的概念 238 兩類的分類問題它們的邊界線就是一個(gè)判別函數(shù) 239 兩類問題中線性不可分的實(shí)例 240 三類的分類問題它們的邊界線也是一個(gè)判別函數(shù) 241 3 1用判別域界面方程分類的概念第三章判別域代數(shù)界面方程法 242 3 2線性判別函數(shù) 第三章判別域代數(shù)界面方程法 243 244 245 多類問題圖例第一種情況不確定區(qū)域 246 1 第一種情況續(xù) 判別規(guī)則為如果則判比如對圖的三類問題如果對于任一模式如果它的則該模式屬于 1類 247 1 第一種情況續(xù) 如果某個(gè)X使二個(gè)以上的判別函數(shù)di 0 則此模式X就無法作出確切的判決如圖另一種情況是IR2區(qū)域判別函數(shù)都為負(fù)值 IR1 IR2 IR3 IR4 都為不確定區(qū)域 248 1 第一種情況續(xù) 解三個(gè)判別邊界分別為 249 1 第一種情況續(xù) 結(jié)論因?yàn)樗运鼘儆?2類 250 1 第一種情況續(xù) 251 252 2 第二種情況續(xù) 多類問題圖例第二種情況 253 254 d12 x d21 x x1 x2 5 0 d12 x 為正兩分法例題圖示 d21 x 為正 255 d23 x d32 x x1 x2 0 d32 x 為正 d23 x 為正 256 d13 x d31 x x1 3 0 d31 x 為正 d13 x 為正 257 3類判別區(qū)域d31 x 0d32 x 0 258 259 3 第三種情況續(xù) 多類問題圖例第三種情況 260 261 上述三種方法小結(jié) 方法判別函數(shù)的數(shù)目和方法相同但沒有不確定區(qū) 分析簡單是最常用的一種方法 262 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間第三章判別域代數(shù)界面方程法 263 此方程表示一超平面它有以下三個(gè)性質(zhì) 1 系數(shù)矢量是該平面的法矢量 2 判別函數(shù)的絕對值正比于到超平面的距離 3 判別函數(shù)值的正負(fù)表示出特征點(diǎn)位于哪個(gè)半空間中 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間第三章判別域代數(shù)界面方程法 264 圖3 3 1點(diǎn)面距離及界面的正負(fù)側(cè)示意圖 265 266 267 268 證明判別函數(shù)值的正負(fù)表示出特征點(diǎn)位于哪個(gè)半空間中 269 這說明判別函數(shù)值的正負(fù)表示出特征點(diǎn)位于哪個(gè)半空間中或者換句話說表示特征點(diǎn)位于界面的哪一側(cè) 270 例3 3 1 利用判別函數(shù)的鑒別意義試分析d x1 x2 x1 x2 1 271 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 272 2 解矢量 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 273 2 解矢量 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 274 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 275 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間先看一個(gè)簡單的情況設(shè)一維數(shù)據(jù)1 2屬于w1 1 2屬于w2求將w1和w2區(qū)分開的w0 w1 276 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間先看一個(gè)簡單的情況設(shè)一維數(shù)據(jù)1 2屬于w1 1 2屬于w2求將w1和w2區(qū)分開的w0 w1 w0 w1 277 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間先看一個(gè)簡單的情況設(shè)一維數(shù)據(jù)1 2屬于w1 1 2屬于w2求將w1和w2區(qū)分開的w0 w1 w0 w1 278 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間先看一個(gè)簡單的情況設(shè)一維數(shù)據(jù)1 2屬于w1 1 2屬于w2求將w1和w2區(qū)分開的w0 w1 w0 w1 279 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間先看一個(gè)簡單的情況設(shè)一維數(shù)據(jù)1 2屬于w1 1 2屬于w2求將w1和w2區(qū)分開的w0 w1 w0 w1 280 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間先看一個(gè)簡單的情況設(shè)一維數(shù)據(jù)1 2屬于w1 1 2屬于w2求將w1和w2區(qū)分開的w0 w1 w0 w1 281 3 解空間 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 282 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間每一個(gè)訓(xùn)練模式都對解區(qū)提供一個(gè)約束訓(xùn)練模式越多解區(qū)的限制就越多解區(qū)就越小就越靠近解區(qū)的中心解矢量就越可靠由它構(gòu)造的判別函數(shù)錯(cuò)分的可能性就越小 283 4 余量 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間 284 4 余量 3 3 2權(quán)空間解矢量與解空間 3 3判別函數(shù)值的鑒別意義權(quán)空間及解空間引入了余量可有效地避免量測的誤差引入的誤差以及某些算法求得的解矢量收斂于解區(qū)的邊界上從而提高了解的可靠性 285 設(shè)一3類問題有如下判決函數(shù)d1 x x1d2 x x1 x2 1d3 x x1 x2 1試畫出下列各種情況的判決邊界及各類的區(qū)域 1 滿足3 4 2節(jié)中的第一種情況 2 滿足3 4 2節(jié)中的第二種情況且令d12 x d1 x d13 x d2 x d23 x d3 x 3 滿足3 4 2節(jié)中的第三種情況作業(yè) 286 3 4Fisher線性判別第三章判別域代數(shù)界面方程法 287 二維模式向一維空間投影示意圖 288 二維模式向一維空間投影示意圖 289 二維模式向一維空間投影示意圖 o x y o x y 290 1 求解Fish準(zhǔn)則函數(shù) 291 292 類間離差度為 293 并使其最大上式稱為Fisher準(zhǔn)則函數(shù) 294 利用二次型關(guān)于矢量求導(dǎo)的公式可得 2 求解Fisher最佳鑒別矢量令可得 295 296 上式右邊后兩項(xiàng)因子的乘積為一標(biāo)量令其為于是可得式中為一標(biāo)量因子其不改變軸的方向可以取為1 于是有 297 此時(shí)的可使Fisher準(zhǔn)則函數(shù)取最大值即是n維空間到一維空間投影軸的最佳方向由和 JF最大值為 298 即稱為Fisher變換函數(shù) JF 299 由于變換后的模式是一維的因此判別界面實(shí)際上是各類模式所在軸上的一個(gè)點(diǎn) 所以可以根據(jù)訓(xùn)練模式確定一個(gè)閾值yt 于是Fisher判別規(guī)則為 3 求解Fisher判別函數(shù) 判別閾值可取兩個(gè)類心在u方向上軸的投影連線的中點(diǎn)作為閾值即 300 301 7 計(jì)算 8 計(jì)算yt 9 對未知模式x判定模式類 302 以100元A面數(shù)據(jù)和50元A面數(shù)據(jù)

下載提示(請認(rèn)真閱讀)

1.請仔細(xì)閱讀文檔，確保文檔完整性，對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
2.下載的文檔，不會出現(xiàn)我們的網(wǎng)址水印。
3、該文檔所得收入（下載+內(nèi)容+預(yù)覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請點(diǎn)此認(rèn)領(lǐng)！既往收益都?xì)w您。

同意并開始全文預(yù)覽

文檔包含非法信息？點(diǎn)此舉報(bào)后獲取現(xiàn)金獎勵！

文檔加載中……請稍候！
如果長時(shí)間未打開，您也可以點(diǎn)擊刷新試試。

下載文檔到電腦，查找使用更方便

19.9 積分

還剩頁未讀，繼續(xù)閱讀

舉報(bào)

版權(quán)申訴 word格式文檔無特別注明外均可編輯修改；預(yù)覽文檔經(jīng)過壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁顯示word圖標(biāo)，表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
特殊限制：: 部分文檔作品中含有的國旗、國徽等圖片，僅作為作品整體效果示例展示，禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
關(guān) 鍵詞：: 模式識別詳細(xì) PPT

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

裝配圖網(wǎng)所有資源均是用戶自行上傳分享，僅供網(wǎng)友學(xué)習(xí)交流，未經(jīng)上傳用戶書面授權(quán)，請勿作他用。

關(guān)于本文

本文標(biāo)題：模式識別詳細(xì)PPT.ppt
鏈接地址：http://www.820124.com/p-6218779.html

相關(guān)資源更多

正為您匹配相似的精品文檔

相關(guān)搜索

模式識別 詳細(xì) PPT

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

備案號:蜀ICP備2024067431號-1 川公網(wǎng)安備51140202000466號

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務(wù)平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請立即通知裝配圖網(wǎng)，我們立即給予刪除！

影音先锋男人资源在线观看,精品国产日韩亚洲一区91,中文字幕日韩国产,2018av男人天堂,青青伊人精品,久久久久久久综合日本亚洲,国产日韩欧美一区二区三区在线

模式識別詳細(xì)PPT.ppt

最新文檔