《計算機視覺課件3》由會員分享,可在線閱讀,更多相關《計算機視覺課件3(49頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、1 1二值圖象分析Binary Image Analysis第第 3 3 章章 2 2二值圖像例二值圖像例3.1 二值圖象二值圖象3 3二值圖象的特點二值圖象的特點 a. a. 二值圖像只有兩個灰度級,其中物體像素值為二值圖像只有兩個灰度級,其中物體像素值為1 1,背景像素值為背景像素值為0 0; b. b. 圖象中許多的特征如邊緣、輪廓可以用二值圖像圖象中許多的特征如邊緣、輪廓可以用二值圖像表示;表示; c. c.二值圖像處理的算法簡單,所需的內(nèi)存小,計算二值圖像處理的算法簡單,所需的內(nèi)存小,計算速度快;速度快; d. d.二值視覺系統(tǒng)技術可用于灰度圖像視覺系統(tǒng)二值視覺系統(tǒng)技術可用于灰度圖像
2、視覺系統(tǒng) 。4 4(3)二值圖象的獲取a. a. 硬件實現(xiàn)硬件實現(xiàn) 敏感元二值輸出或邏輯輸出。敏感元模擬值敏感元二值輸出或邏輯輸出。敏感元模擬值 輸出,通過硬件電路二值化。輸出,通過硬件電路二值化。b. b. 軟件實現(xiàn)軟件實現(xiàn) 灰度圖象可以通過灰度圖象可以通過閾值(閾值(thresholdthreshold)分割)分割進進行二值化處理。行二值化處理。5 5圖象二值化圖象二值化 設一幅灰度圖像中物體的灰度分布在某一區(qū)間內(nèi),經(jīng)設一幅灰度圖像中物體的灰度分布在某一區(qū)間內(nèi),經(jīng)過閾值運算后的圖像為二值圖像。過閾值運算后的圖像為二值圖像。其它如果0, 1,21TjiITjiB其它如果0, 1,ZjiIji
3、B其中Z是組成物體各部分灰度值的集合 (4)灰度圖象的二值化灰度圖象的二值化6 6一幅灰度圖像和使用不同閾值得到的二值圖一幅灰度圖像和使用不同閾值得到的二值圖像結果像結果1:原始灰度圖像,2:閾值T=100;3:T=1284:T1=100|T2=128 7 7 通過閾值化方法檢測出物體后,下一步就要通過閾值化方法檢測出物體后,下一步就要對物體進行識別和定位對物體進行識別和定位 在大多數(shù)工業(yè)應用中,攝像機的位置和環(huán)境在大多數(shù)工業(yè)應用中,攝像機的位置和環(huán)境是已知的,因此通過簡單的幾何知識就可以從物是已知的,因此通過簡單的幾何知識就可以從物體的二維圖像確定出物體的三維位置體的二維圖像確定出物體的三維
4、位置 利用尺度和形狀特征來識別:如大小、位置利用尺度和形狀特征來識別:如大小、位置和方向和方向. .3.2 幾何特性幾何特性8 8(1) 尺寸和位置尺寸和位置一幅二值圖像區(qū)域的面積(或零階矩)由下式一幅二值圖像區(qū)域的面積(或零階矩)由下式給出:給出:9 9物體的中心位置:物體的中心位置: 其中其中x x和和y y是相對于圖像左上角的中心坐標是相對于圖像左上角的中心坐標 物體的位置為:物體的位置為: 注意:因約定注意:因約定y y軸軸向上向上故故有負號有負號1010方向方向一般假定物體是長形的,其長軸方向被定義為物體的方一般假定物體是長形的,其長軸方向被定義為物體的方向通常,二維平面上與最小慣量
5、軸同方向的最小二階向通常,二維平面上與最小慣量軸同方向的最小二階矩軸被定為長軸矩軸被定為長軸設慣性軸:設慣性軸: , 滿足:滿足: 是點是點i, j到該軸的距離。到該軸的距離。sincosyxmin;,22jiBrijijjir,cossini jrji1111有有: 22( cossin) , ijjiB i j02令令: , 有:有: 其中:其中: sincosyx)(tan211cab;,)(2jiBxxaijij;,)(2jiByyxxbijijij;,)(2jiByycijij021212注意:求得的慣性軸有兩個,即最大、最小慣性軸。Maximum axisMinimum axis1
6、313(3) 密集度密集度 區(qū)域的密集度區(qū)域的密集度: 其中,其中,p p 和和 A A 分別為圖形的周長和面積分別為圖形的周長和面積根據(jù)此定義,圓是最密集的圖形根據(jù)此定義,圓是最密集的圖形密集度的另一意義:周長在給定后,密集度越高,密集度的另一意義:周長在給定后,密集度越高,所圍面積越大所圍面積越大 1414(4) (4) 體態(tài)比體態(tài)比 區(qū)域的最小外接矩形的長與寬之比特性: 1)正方形和圓的體態(tài)比等于1 2)細長形物體的體態(tài)比大于1 下圖是幾種形狀的外接矩形:1515投影能表現(xiàn)圖像的某種特征信息投影能表現(xiàn)圖像的某種特征信息 給定一條直線,用垂直該直線給定一條直線,用垂直該直線的一簇等間距直線
7、將一幅二值圖的一簇等間距直線將一幅二值圖像分割成若干條,每一條內(nèi)像素像分割成若干條,每一條內(nèi)像素值為值為1 1的像素個數(shù)為該條二值圖的像素個數(shù)為該條二值圖像在像在給定直線上的投影給定直線上的投影定義給定直線為水平或垂直直定義給定直線為水平或垂直直線時,二值圖像列或行上像素值線時,二值圖像列或行上像素值為為1 1的像素數(shù)量之和為該圖像的的像素數(shù)量之和為該圖像的水平或垂直投影水平或垂直投影3.3 投影投影 1616 對角線投影對角線投影 設行和列的標號分別用設行和列的標號分別用i和和j表示若圖像矩陣為表示若圖像矩陣為n行行m列,則列,則i和和j的范圍分別為的范圍分別為0 0到到n-1和和0 0到到
8、m-1假設對角線的標號假設對角線的標號d用行和列的仿射變換(線性組用行和列的仿射變換(線性組合加上常數(shù))計算,即:合加上常數(shù))計算,即: d = ai+ bj + c 對角線投影共對應對角線投影共對應n+m-1n+m-1個條,其中仿射變換個條,其中仿射變換把右上角像素映射成對角線投影的第一個位置,把右上角像素映射成對角線投影的第一個位置,把左下角像素映射成最后一個位置,如圖所示,把左下角像素映射成最后一個位置,如圖所示,則當前行列對應的標號則當前行列對應的標號d d的公式為:的公式為: d = i - j + m - 1 1717二值圖像及其對角線上的投影圖1818用圖像像素值連續(xù)為用圖像像素
9、值連續(xù)為1 1的個數(shù)來描述圖像的個數(shù)來描述圖像, ,有有兩種方法兩種方法: (1)用)用1 1的起始位置和的起始位置和1 1的游程長度;的游程長度; (2)僅僅使用游程長度,)僅僅使用游程長度,0:表示從:表示從0象素開始象素開始 ; 例:例:1 1的游程:(的游程:(2,22,2)()(6,36,3)()(13,613,6)()(20,120,1) (4,64,6)()(11,1011,10) (1,5 1,5 )()(1111,1 1)()(1717,4 4)1 1和和0 0的游程長度:的游程長度:0 0,1, 2 2,2 2,3 3,4 4,6 6, 1 1,1 1; 0 0,3 3,6
10、 6,1 1,10 10 ; 5 5,5 5,1 1,5 5,4 4 3.4游程長度編碼游程長度編碼 (run-length encoding) 19193.5.1 定義定義(1)近鄰:)近鄰: 4鄰點鄰點(4-neighbors):有公共邊關系的兩個像素有公共邊關系的兩個像素 8鄰點鄰點(8-neighbors):兩個像素至少共享一個頂角兩個像素至少共享一個頂角 4連通連通(4-connected):一個像素與其一個像素與其4鄰點的關系鄰點的關系 8連通連通(4-connected):一個像素與其一個像素與其8鄰點的關系鄰點的關系3.5 二值圖像算法二值圖像算法2020(2) (2) 路徑路
11、徑 路徑路徑: :從像素從像素 到像素到像素 的一個像素序的一個像素序列:列: , 和和 互為鄰點互為鄰點 4 4路徑路徑: :像素與其近鄰像素是像素與其近鄰像素是4 4連通關系連通關系 8 8路徑路徑: :像素與其近鄰像素是像素與其近鄰像素是8 8連通關系連通關系(3)(3)前景前景 圖像中值為圖像中值為1 1的全部像素的集合,用的全部像素的集合,用S S表示表示(4)(4)連通性連通性已知像素已知像素p p 和和q q ,如果存在一條從,如果存在一條從p p到到q q的路徑,且路徑上的全部的路徑,且路徑上的全部像素都包含在像素都包含在S S中,則稱中,則稱p p與與q q是連通的是連通的,
12、00ji,nnji, ,1100nnjijiji,11kkji,kkji2121(5)連通成份:連通成份:一個像素集合,如果集合內(nèi)的每一個像素一個像素集合,如果集合內(nèi)的每一個像素與集合內(nèi)其它像素連通,則稱該集合為一個連通成份。與集合內(nèi)其它像素連通,則稱該集合為一個連通成份。(6) (6) 背景:背景: S S(S S的補集)中包含圖像邊界點的所有連通的補集)中包含圖像邊界點的所有連通成份的集合。成份的集合。 洞洞: : S S中所有非背景其它元。中所有非背景其它元。 對物體和背景應使用不同的連通對物體和背景應使用不同的連通.如果對如果對 S S 使用使用8 8連通連通, 則對則對 S S 應使
13、用應使用4 4連通連通。 S S 洞洞洞洞2222 (7) 邊界邊界 S的邊界是的邊界是S中與中與 S中有中有4連通關系的像素集合連通關系的像素集合S (8) 內(nèi)部內(nèi)部 S中不屬于它的邊界的像素集合中不屬于它的邊界的像素集合. S的內(nèi)部等于的內(nèi)部等于S - S (9) 包圍包圍 如果從如果從S S中任意一點到圖像邊界的中任意一點到圖像邊界的4 4路徑必須與區(qū)域路徑必須與區(qū)域T T相相交,則區(qū)域交,則區(qū)域 T T 包圍區(qū)域包圍區(qū)域 S S(或(或S S在在T T內(nèi))內(nèi))例:一幅二值圖像 內(nèi)部內(nèi)部包圍包圍邊界邊界 S S S S圖像圖像邊界邊界2323視覺中常見的運算是找連通成分。視覺中常見的運算
14、是找連通成分。 連通標記算法可以找到圖像中的所有連通成份,并對連通標記算法可以找到圖像中的所有連通成份,并對同一連通成份中的所有點分配同一標記下圖表示的是一同一連通成份中的所有點分配同一標記下圖表示的是一幅圖像和已標記的連通成份下面介紹兩種連通成份標記幅圖像和已標記的連通成份下面介紹兩種連通成份標記算法:算法:遞歸算法遞歸算法和和序貫算法序貫算法 3.5.2 連通成分標記算法連通成分標記算法2424 算法算法3.13.1:連通成份遞歸算法連通成份遞歸算法 1.掃描圖像,找到無標記的值為1的象素點,給它分配 一個標記 L; 2.遞歸分配標記L給1點的鄰點; 3.如果不存在沒標記的點,則停止; 4
15、.返回第1步。2525算法算法3.23.2:4-4-連通成份序貫連通成份序貫算法算法 1從左至右、從上到下掃描圖像 2如果像素點為1,則: (a) 如果上面點和左面點有一個標記,則復制這一標記 (b) 如果兩點有相同的標記,復制這一標記 (c) 如果兩點有不同的標記,則復制上點的標記且將兩個 標記輸入等價表中作為等價標記 (d) 否則給這一個像素點分配一新的標記并將這一標記輸 入等價表 3回到第2步只到掃描完所有點 4在等價表的每一等價集中找到最低的標記 5掃描圖像,用等價表中的最低標記取代每一標記2626在視覺應用中,歐拉數(shù)或虧格數(shù)可作為識別物體的特征。1. 定義:連通成份數(shù)減去空洞數(shù)E =
16、 C - H 其中: E為歐拉數(shù)、C為連通成份數(shù)、H為空洞數(shù)2.舉例E=0E=-1E=23.特性 具有平移、旋轉和比例不變特性的拓撲特征前景:8連通背景:4連通3.5.3 歐拉數(shù)歐拉數(shù)27273.5.4 區(qū)域邊界區(qū)域邊界通過簡單的局部運算找邊界點是視覺應用中的基本任務,常見的算法是按逆時針方向跟蹤區(qū)域的所有點。2828 算法算法3.33.3:邊界跟蹤算法邊界跟蹤算法 從左到右、從上到下掃描圖像,求區(qū)域S的起始點, 用c表示當前邊界上被跟蹤的像素點置 , 記c左4鄰點為b, ; 按逆時針方向從b開始將c的8個8鄰點分別記為: 從b開始,沿逆時針方向找到第一個 ; 置 , ; 重復步驟、,直到 。
17、 0),(),()(kkykxks)(ksc Sb8, 21,nnn1 kkSniinksc)(1inb)0()(sks29293.5.5 距離距離2212212211Euclidean)()(),(jjiijijid 歐幾里德距離:歐幾里德距離: 街區(qū)距離:街區(qū)距離: . |2121Blockjjiid棋盤距離:棋盤距離: |).| |,max(|2121Chessjjiid30303.5.6 中軸中軸 中軸可作為物體的一種簡潔表示中軸可作為物體的一種簡潔表示圖 3.13a 4鄰點 中軸變換舉例 3131圖313b表明少量噪聲會使中軸變換結果產(chǎn)生顯著的差異 圖 3.13b 中軸變換舉例 32
18、32細化是把區(qū)域縮成線條、逼近中心線(骨架或核線)的一種圖細化是把區(qū)域縮成線條、逼近中心線(骨架或核線)的一種圖像處理。像處理。細化的目的是減少圖像成份,直到只留下區(qū)域的最基本信息,以便進一步分析和識別雖然細化可以用在包含任何區(qū)域形狀的二值圖像,但它主要對細長形(而不是凸圓形或水滴狀)區(qū)域有效細化一般用于文本分析預處理階段,以便將文本圖像中線條圖畫或字符筆畫表示成單像素線條 要求:要求:1)連通圖像區(qū)域必須細化成連通線結構;2)細化結果最少應該是8連通;3)保留近似終止線的位置;4)細化結果應該近似于中軸線; 5由細化引起的附加突刺(短分支)應該是最小的。3.5.7 細化細化3333算法算法.
19、:鄰點細化迭代算法鄰點細化迭代算法 1、對于每一個像素,如果)沒有上近鄰(或下近鄰或左近鄰或右近鄰) )不是孤立點或終止線)去除該像素點不會斷開區(qū)域 則去除該像素點 2、重復步驟1直到?jīng)]有像素點可以去除為止。3434圖314 細化手寫體“華”的迭代過程(a) 原圖像,(b)(f)為五次迭代過程,每次迭代削去一層邊界 3.5.7 細化細化3535如果某一連通成份可以變化,使得背景像素點變成1的運算稱為擴展如果物體像素點全方位地消減或變?yōu)?時,則稱為收縮 擴展:如果背景和洞的像素點鄰點是1,則將該點從0變?yōu)?收縮:如果物體像素點鄰點是0,則將該點從1變?yōu)?3.5.8 擴展與收縮擴展與收縮原始噪聲圖
20、像 擴展運算 收縮運算對字母h收縮與擴展算法實驗結果:3636對字母h收縮與擴展算法實驗結果:原始噪聲圖像 擴展運算 收縮運算 擴展-收縮 收縮-擴展先擴展后收縮算法能補上不希望存在的洞,先收縮后擴展算法則能去除孤立的噪聲點。 3737對字母h收縮與擴展算法實驗結果:原始噪聲圖像 擴展運算 收縮運算 擴展-收縮 收縮-擴展)()()(nmmnnmSSSkkSS)(kkSS)()(kS:S擴展k倍 )( kS:S收縮k倍 38383.6形態(tài)學算子形態(tài)學算子理論基礎:集合論理論基礎:集合論作用:保持形狀特征,同時簡化圖像作用:保持形狀特征,同時簡化圖像工具:結構元工具:結構元數(shù)學形態(tài)學(數(shù)學形態(tài)學
21、(mathematical mophology)39393.6.1 形態(tài)學集合論基礎形態(tài)學集合論基礎 圖像圖像=前景像素的集合前景像素的集合 交運算交運算 并運算并運算平移運算平移運算BpAppBA and |BpAppBAor |AapaAp|二值圖像A被一個像素點p平移是指將A的原點移到 p。40403.6.2 形態(tài)學算子形態(tài)學算子-1 , ,|BbApbpppBAbab Ba AABAB用結構元進行膨脹運算也可以描述為:結構元的原點用結構元進行膨脹運算也可以描述為:結構元的原點像素經(jīng)過待膨脹的二值圖像中所有像素經(jīng)過待膨脹的二值圖像中所有1像素點時,對應結像素點時,對應結構元所有像素的二值
22、圖像像素置為像素;構元所有像素的二值圖像像素置為像素; 膨脹(膨脹(dilation):擴張圖像區(qū)域):擴張圖像區(qū)域結構元原點是指定的,不一定是圖像左上角多種解釋:圖像位移、結構元位移4141用結構元位移計算用結構元位移計算42423.6.2 形態(tài)學算子形態(tài)學算子-2 BbAbppBA ,pA Bp BApA用結構元進行腐蝕運算也可以描述為:結構元的原點像素經(jīng)過待腐蝕的二值圖像中所有1像素點時,如果結構元中有一個像素沒有對應待腐蝕二值圖像的像素,則對應結構元原點的待腐蝕二值圖像像素置為 腐蝕(腐蝕(erosion):):獲得表示結構元所有出現(xiàn)位置的圖像獲得表示結構元所有出現(xiàn)位置的圖像4343用
23、結構元位移計算用結構元位移計算4444圖316 原始測試圖像A (左)與結構元B(右)注意結構元的原點比中的其它像素點要黑一些4545A被被B膨脹膨脹 4646A被被B腐蝕腐蝕47473.6.2 形態(tài)學算子形態(tài)學算子-3 開運算(開運算(opening):):去除比結構元小的區(qū)域像素去除比結構元小的區(qū)域像素 用同一結構元腐蝕后再膨脹用同一結構元腐蝕后再膨脹 閉運算(閉運算(closing):):填充比結構元小的孔洞填充比結構元小的孔洞 用同一結構元膨脹后再腐蝕用同一結構元膨脹后再腐蝕 BBABABBABA4848圖318“開”運算左:腐蝕;右:膨脹圖中的粗黑線表示原始圖像邊界 4949圖3.19 “閉”運算左:膨脹;右:腐蝕圖中的粗黑線表示原始圖像邊界