第04章北理工賈云德《計算機視覺》--區(qū)域分析.
《第04章北理工賈云德《計算機視覺》--區(qū)域分析.》由會員分享,可在線閱讀,更多相關(guān)《第04章北理工賈云德《計算機視覺》--區(qū)域分析.(23頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 第四章 區(qū)域分析 圖像中的區(qū)域是指相互連結(jié)的具有相似特性的一組像素.由于區(qū)域可能對應(yīng)場景中的物體,因此,區(qū)域的檢測對于圖像解釋十分重要.一幅圖像可能包含若干個物體,而每一個物體又可能包含對應(yīng)于物體不同部位的若干個區(qū)域.為了精確解釋一幅圖像,首先要把一幅圖像劃分成對應(yīng)于不同物體或物體不同部位的區(qū)域. 4.1 區(qū)域和邊緣 圖像區(qū)域劃分有兩種方法:一種是基于區(qū)域的方法,另一種是使用邊緣檢測的輪廓預(yù)估方法.在基于區(qū)域的方法中,把所有對應(yīng)于一個物體的像素組合在一起,并進行標記,以表示它們屬于一個區(qū)域,這一處理過程稱為分割.在某一評判標準下,把
2、像素分配給某一區(qū)域,就可以把這些像素同圖像其余部分分開.圖像分割中的兩個最基本的原則是數(shù)值相似性和空間接近性.如果兩個像素具有相似的強度特性,或它們之間十分靠近,則可以把它們分配到同一區(qū)域,例如,兩個像素之間的數(shù)值相似性度量可以是它們的灰度值之差,也可以是區(qū)域灰度值分布;它們的空間 接近性度量可以是歐幾里德距離,也可以是區(qū)域致密度. 相似性和接近性原則來源于如下假設(shè):同一物體上的點投影到圖像上得到的像素點在空間上十分靠近,且具有相似的灰度值.很顯然,這一假設(shè)并不是在任何情況下都成立.然而可以使用這一假設(shè)來組合圖像中的像素,然后利用相關(guān)域知識來匹配物體模型和區(qū)域.在簡單的情況下,可以通過閾
3、值法和連通成份標記法來進行圖像分割,這一點在第三章討論過了.對于復(fù)雜的圖像,可以使用更高級的方法實現(xiàn)圖像分割. 分割也可以通過求取區(qū)域邊界上的像素來進行.這些像素點(也稱為邊緣)可以通過搜尋鄰近像素的方法來得到.由于邊緣像素是在邊界上,在邊界兩邊的區(qū)域具有不同的灰度值,這樣,區(qū)域的邊界可以通過測量鄰近像素差值來求?。M管邊緣檢測可能使用誘導(dǎo)特性(如紋理和運動)來檢測邊緣.但大多數(shù)邊緣檢測器僅使用強度特性作為邊緣檢測的基礎(chǔ). 在理想的圖像中,一個區(qū)域是由一條封閉輪廓線包圍著.原則上,區(qū)域分割和邊緣檢測應(yīng)該產(chǎn)生相同的結(jié)果,即使用邊界跟蹤算法可以得到區(qū)域的邊緣(或封閉的輪廓線);反過來
4、,使用區(qū)域填充算法也可以得 到邊緣所包圍的區(qū)域.但在實際的圖像中,很少能夠從區(qū)域中得到正確的邊緣,反之亦然.由于噪聲和其它因素的影響,不論是區(qū)域分割還是邊緣檢測,都無法提供完整的信息. 本章將討論區(qū)域的基本概念,主要集中在兩個問題上:圖像分割和區(qū)域表示. 4.2 分割 已知一幅圖像像素集 I 和一個一致性謂詞 (? P ,求圖像 I 表示成 n 個區(qū)域 i R 集合的一種劃分: I R n i i == 1 (4.1) 一致性謂詞和圖像劃分具有如下特性,即任何區(qū)域滿足如下謂詞:
5、 True (=i R P (4.2) 任何兩個相鄰區(qū)域不能合并成單一區(qū)域,必滿足謂詞: False (=j i R R P (4.3) 一致性謂詞 (? P 定義了在區(qū)域 i R 上的所有點與區(qū)域模型的相似程度. 把一幅灰度圖像轉(zhuǎn)換成二值圖像是圖像分割的最簡單形式.用于求取二值圖像的閾值算法可以推廣到求取多值圖像,其中的閾值算法已經(jīng)在第三章中討論過了.為了在各種變化的場景中都能得到魯棒的圖像分割,閾值分割算法應(yīng)能根據(jù)圖像強度取樣來自動選取合適的閾值.閾值分割法不要過分依賴于物體的灰度知識,且使用有關(guān)灰度值的相對特性來選取
6、合適的閾值.這一簡單的思想在許多計算機視覺算法中十分有用. 4.2.1 自動閾值化法 為了使分割更加魯棒,系統(tǒng)應(yīng)能自動選擇閾值.基于場景中的物體、環(huán)境和應(yīng)用域等知識的圖像分割算法比基于固定閾值算法更具有普遍性.這些知識包括:對應(yīng)于物體的圖像灰度特性,物體的尺寸,物體在圖像中所占的比例,圖像中不同類型物體的數(shù)量等.圖像灰度直方圖就是一種灰度特性,它是指圖像所有灰度值出現(xiàn)的相對頻率. 使用上述知識并在無人介入的情況下自動選取閾值的方法稱為自動閾值化方法.自動閾值化算法通常使用灰度直方圖來分析圖像中灰度值的分布,并使用特定應(yīng)用域知識來選取最合
7、適的閾值.由于所用的知識具有普遍性,因此大大增加了算法的應(yīng)用范圍. 假設(shè)一幅圖像中包含有 n 個物體 n O O O , , , 21? ? ? ,包括背景,并假設(shè)不同 的區(qū)域 n πππ , , ?, 21?? 的灰度值具有概率分布函數(shù) (, , (, (21z p z p z p n? ? ? .在 許多應(yīng)用中,物體在圖像中出現(xiàn)的概率 n ,P , ,P P? ? ? 21 也許是已知的.使用這些 知識來嚴格地計算閾值是完全可能的.由于場景中的照明控制著圖像中強度值的概率分布函數(shù) (z p i , 因此預(yù)先計算閾值是不可能的.我們將要看到,大多數(shù)自動閾值的選
8、取算法使用了物體尺寸和出現(xiàn)概率,并通過計算灰度直方圖估算強度分布. 下面將討論幾種常用的自動閾值化方法.為了簡化表示,我們將遵循物體在圖像中的表示慣例,即物體相對于光亮背景是黑的.也就是說,低于某一閾值的灰度值屬于物體,而高于這一閾值的灰度值屬于背景.下面將要討論的算法稍作改動就可以應(yīng)用到其它場合,如光亮物體相對于黑暗背景,灰暗物體相對于光亮和黑暗背景,光亮或黑暗物體相對于灰暗背景.一些算法還可以推廣到由任意像素值集合組成的物體. (1 模態(tài)方法 如果圖像中的物體具有同一灰度值,背景具有另一個灰度值,圖像被零均值高 斯噪聲污染,那么就可以假定灰度
9、分布曲線是由兩個正態(tài)分布函數(shù) ,(,(2 22211σμσμ和疊加而成.圖像直方圖將會出現(xiàn)兩個分離的峰值,如圖 4.1 所 示.在理想恒定灰度值情況下, 021==σσ,其直方圖為兩條線分別對應(yīng)兩個峰值,這時的閾值可以設(shè)置在兩個最大值之間的任何位置.在實際應(yīng)用中,兩個最大值并不是分得很開,此時需要檢測直方圖曲線的波谷和波峰,并把閾值設(shè)置成波谷對應(yīng)的像素值.可以證明,當物體的尺寸和背景相等時,這樣選取閾值可使誤分類概率達到極小值.在大多數(shù)情況下,由于直方圖在波谷附近的像素很稀疏,因此,閾值的選取對圖像分割影響不大. 這一方法可推廣到具有不同灰度均值的
10、多物體圖像中.假設(shè)有 n 個物體,其強 度值的正態(tài)分布參數(shù)為 , (, , , (, , (2222211n n ? ?σμσμσμ?,背景也服從正態(tài)分布 , (200 σμ.如果這些均值明顯的不同,方差值很小,且沒有小尺寸物體,那么圖像直 方圖將包含 n+1 個波峰,并可確定波谷的位置 n T T T ,..., , 21,落入每一個間隔 , (1+i i T T 中的所有像素被分配給對應(yīng)的物體,如圖 4.2所示.
11、 圖 4. 1(a 理想情況下,背景和物體的灰度值可以分的很開. (b 大多數(shù)情況下,物體和背景的強度值相互重疊. 圖 4. 2 具有不同灰度值的多物體圖像直方圖 (2 迭代式閾值選擇 迭代式閾值選擇方法如下:首先選擇一個近似閾值作為估計值的初始值,然后連續(xù)不斷地改進這一估計值.比如,使用初始閾值生成子圖像,并根據(jù)子圖像的特性來選取新的閾值,再用新閾值分割圖像,這樣做的效果將好于用初始閾值分割的圖像.閾值的
12、改進策略是這一方法的關(guān)鍵.算法 4.1 給出了這一方法的步驟. 算法 4.1 迭代式閾值選擇算法 選擇一個初始閾值的估算值 T ,比如,圖像強度均值就是一個較好的初始值. 利用閾值 T 把圖像分割成兩組, 1R 和 2R . 計算區(qū)域 1R 和 2R 的均值 21, μμ. 選擇新的閾值 T (2 121μμ +=T重復(fù) 2- 4 步,直到 1μ和 2μ的均值不再變化. (3 自適應(yīng)閾值化方法 如果場景中的照明不均勻,那么上述的自動閾值化方法就不能使用.顯然,在這
13、種情況下,一個閾值無法滿足整幅圖像的分割要求。處理不均勻照明或不均勻灰度分布背景的直接方法是首先把圖像分成一個個小區(qū)域,或子圖像,然后分析每一 個子圖像,并求出子圖像的閾值。比如,把圖像分成 m m ? 個子圖像,并基于第子圖像的直方圖來選擇該子圖像的閾值 ij T (m j i ≤≤),,1圖像分割的最后結(jié)果是所有子圖像分割區(qū)域的邏輯并。這一算法如圖 ij 4.3 所示.
14、圖 4.3 基于子圖像 (直方圖的自適應(yīng)閾值化處理示意圖 (4 變量閾值化方法 在不均勻照明條件下的另一種實用的閾值化方法是使用簡單的函數(shù),如平面、 二次曲面等,來逼近不均勻照明下的物體圖象與背景圖象之間的分界面。分界面在 很大程度上是由背景灰度值確定的。例如,圖 4. 4( a )是在不均勻照明下獲取的 圖像,其中物體上一部分點的灰度值大于背景點的灰度值,而物體的另一部分點的 灰度值則小于背景點的灰度值,圖 4.4(d )和( e )是取直方圖的兩個波谷值 85=T 和 165=T 作為閾值得到的二 幅二值圖
15、象。顯然,不存在一個閾值可以很好地分割圖像。如果用一個平面來擬合 背景灰度值,則目標很容易從背景中分離出來,如圖 4.4( f ) —(j )所示.原圖 像與背景擬合平面之差形成規(guī)范化圖像,在規(guī)范化圖像中,目標的灰度值大于背景 灰度值,即圖像直方圖有顯著的波谷存在,因此,目標很容易從背景圖像中分離出 來. 圖 4. 4 (a 不均勻照明下的原始圖像;( b )原始
16、圖像的 3D 圖形顯示;( c )原始圖像的直方圖;( d )二值圖像( T=85);( e )二值圖像( T=165)( f )擬合背景的平面函數(shù); (g 原始圖像和平面近似函數(shù)的差值圖像 (即規(guī)范化圖像 ,(h 規(guī)范化圖像; (i 規(guī)范化圖像直方圖; (j 二 值圖像( T=110) (5 雙閾值方法 在許多應(yīng)用中,屬于物體的某些灰度值是已知的.然而,可能還有一些灰度值 或者屬于物體,或者屬于背景.在這種情況下,人們可能使用一個保守一點的閾值 1T 來分離物體圖像,稱之為物體圖像核,然后,使用有關(guān)算法來增長物體圖像.增長
17、物體圖像的方法取決于特定的應(yīng)用,通常使用另一個閾值來吸收那些圖像核像素的鄰接像素,或用圖像強度特性(如直方圖)來決定屬于物體區(qū)域上的那些點,一種簡單的方法是吸收低于第二個閾值 2T 并且與原先物體圖像點相連結(jié)的所有點.算法 4.2 概括了這一算法. 算法 4.2 區(qū)域增長的雙閾值算法 1. 選擇兩個閾值 1T 和 2T . 2. 把圖像分割成三個區(qū)域: 1R ,包含所有灰度值低于閾值 1T 的像素; 2R ,包含所 有灰度值位于閾值 1T 和 2T 之間的像素; 3R ,包含所有灰度值高于閾值 2T 的像素.
18、 3. 查看分配給區(qū)域 2R 中的每一個像素.如果某一像素鄰接區(qū)域 像素重新分配給 1R . 4. 1R ,則把這一 重復(fù)步驟 3 直到?jīng)]有像素被重新分配. 5. 把區(qū)域 2R 剩下的所有像素重新分配 給3R. 在算法 4.2 中,區(qū)域 1R 是區(qū)域核,區(qū)域 2R 是邊緣區(qū)(也稱中間區(qū)或過渡 區(qū)),區(qū)域 3R 是背景.把邊緣區(qū)域中鄰接核區(qū)域的像素點歸并到核區(qū)域,使核區(qū) 域得到增長.核區(qū)域增長結(jié)束后,剩下哪些不屬于核區(qū)域的像素為背景像素.區(qū)域 增長的雙重閾值算法體現(xiàn)了灰度相似性和空間接近性.邊緣區(qū)
19、的像素灰度值十分接 近核區(qū)域像素灰度值是由于兩個區(qū)域的像素點集合在直方圖意義下是相鄰的,而邊 緣區(qū)的像素在空間上接近核區(qū)域像素是由于它們是鄰接點. 4.2.2 直方圖方法的局限性 我們已經(jīng)討論了用圖像直方圖信息來選擇用于圖像分割的閾值.這一方法在物體圖像具有恒定灰度值的情況下特別有用.如果場景中不同部分具有不同的照明,那么,即使圖像中僅包含有一個物體,也無法用一個閾值來分割圖像.在這種情況下,我們應(yīng)該使用有效的分割方法,或者說,在每一個子圖像中獨立地選擇閾值.現(xiàn)在也有一些基于圖像直方圖的啟發(fā)式方法.但對于復(fù)雜的圖像,這些方法仍然不能適用.
20、 基于直方圖的圖像分割方法沒有利用圖像強度的空間信息,因此,在本質(zhì)上存在著局限性.直方圖僅描述了圖像強度分布,因此具有不同灰度空間分布的圖像可能具有類似的直方圖.例如,用直方圖無法區(qū)分隨機分布的黑白點圖像、黑白棋格圖像和黑白各半的圖像.直方圖的全局特性限制了其在復(fù)雜圖像中的應(yīng)用.直方圖完全沒有考慮由于物體表面的連續(xù)性而使得物體圖像點常常在空間上非常密集這一特點. 4.3 區(qū)域表示 區(qū)域有許多應(yīng)用,也有許多種表示方法.不同的表示方法有著不同的應(yīng)用.一些應(yīng)用只需計算單個區(qū)域,而另一些則需要計算圖像各區(qū)域的關(guān)系.本節(jié)將討論幾種區(qū)域表示方法并研究它們的特性.需要指
21、出,區(qū)域完全可以表示成封閉輪廓,有關(guān)表示方法將在第七章討論. 大多數(shù)區(qū)域表示方法可以歸納為下面三種類型:陣列表示,層級表示,基于特征的區(qū)域表示. 4.3.1 陣列表示 區(qū)域表示的基本形式是一個與原始圖像一樣大小的陣列,陣列元素表示像素所屬區(qū)域.這樣,如果陣列元[ i , j ]具有標記 a ,那么對應(yīng)的圖像像素就屬于區(qū)域 a .這種表示的最簡單例子是二值圖像,其中每個像素屬于區(qū)域 0 或?qū)儆趨^(qū)域 1. 另一種表示方法是使用模板( mask )或比特位圖( bitmap ).每一個區(qū)域?qū)?yīng)一個二值圖像,稱之為模板,表示圖像中哪些像素屬于該區(qū)域.把
22、模板重疊在原 始圖像上,可以求得對應(yīng)區(qū)域的強度特性.這種方法的一個優(yōu)點是可以處理不確定性問題,即像素的區(qū)域?qū)傩圆荒艽_切地定義時,允許該像素屬于一個或一個以上的區(qū)域.在一個以上的區(qū)域(模板)中,該像素值皆為 1.陣列表示方法包含了圖畫或圖像中的區(qū)域信息,而符號信息沒有被明顯地表示出來. 4.3.2 層級表示 圖像可以用多種不同的分辨率來表示.顯然,降低圖像的分辨率可以降低陣列的尺寸,但要丟失一些信息,使得信息恢復(fù)工作比較困難.然而,降低分辨率可以降低對存儲器容量和計算速度的要求.圖像的層級表示可以是多分辨率表示.在許多應(yīng)用中,首先在低分辨率下
23、進行圖像特性計算,然后在高分辨率上對圖像某一選定區(qū)域再進行精細計算.多級圖像表示也在圖像瀏覽中得到了廣泛地應(yīng)用.下面我們給出兩種常用的圖像層級表示方法,金字塔型和四叉樹型. (1)金字塔型 n n ? 陣列圖像的金字塔型( pyramid )表示包含了原圖像和原圖像的 k 個遞減圖像,其中 n 是 2 的指數(shù)冪,其它圖像分別是 2/2/n n ? , 4/4/n n ? , ... , 11? 陣列.在圖像的金字塔型表示中, L 層的像素是通過對 1+L 層的若干像素組合得到的.在頂層或 0 層,圖像表示為單一像素;而底層則是原始圖像或未被遞減的圖 像.某一層
24、的一個像素表示下一層的幾個像素的合成信息.圖 4.5 所示的是一幅 圖像及其金字塔型遞減圖像.其中金字塔型圖像是通過求簡單的 22? 鄰域的均值 得到.當然,構(gòu)想其它策略來獲取遞減分辨率圖像是完全可能的.同樣,以非線性 的方法來構(gòu)造金字塔型表示方法也是可能的.需要補充說明的是,整個金字塔型圖 像滿足維數(shù)為 2 的線性陣列 2(2 級數(shù) ? . (a
25、 (b 圖 4. 5 圖像多分辨率表示示意圖。 (a 遞減分辨率的圖像是通過求 四個像素的平均值得到的; (b 原圖像為 512×512 的多分辨率表示 (2)四叉樹型 四叉樹( quad tree)被認為是二值圖像金字塔型表示的擴展 , 它包含了三種類 型的節(jié)點:白、黑和灰度.一個四叉樹是通過不斷地分裂圖像得到的.一個區(qū)域可 以分裂成大小一樣的四個子區(qū)域,如
26、圖 4.6 所示.對于每一個子區(qū)域,如果其所有點或者是黑的,或者是白的,則該區(qū)域不再進行分裂;但如果同時包含有黑白兩種點,則認為該區(qū)域是灰度區(qū)域,可以進一步分裂成四個子區(qū)域.通過這種不斷分裂得到的圖像就可用樹型結(jié)構(gòu)表示.分裂過程不斷進行,直到樹中沒有灰度區(qū)域.樹結(jié)構(gòu)中的每一個節(jié)點或者是一個樹葉,或者包含有四個子節(jié)點,故稱為四叉樹. 四叉樹在立體數(shù)據(jù)庫中的應(yīng)用在不斷地增加.把一幅光柵圖轉(zhuǎn)化為一個四叉樹以及把一個四叉樹轉(zhuǎn)化為一幅光柵圖的算法也有若干.最近幾年人們致力于用代碼表示四叉樹,以減少指針對存儲空間的需求.
27、 圖 4. 6 建立四叉樹. (a 原始圖像; (b 把原始圖像分裂成為四個子區(qū)域; (c 分 裂圖像 (b 中的灰度區(qū)域成為四個子區(qū)域; (d 分裂最后一個灰度區(qū)域,得到最后的四叉 樹. 4.3.3 基于特征的區(qū)域表示 一個區(qū)域可以使用其特征來表示.一些常用的特征有:最小外接矩形、中心、矩、歐拉數(shù)等.其它的圖像特征也經(jīng)常在圖像區(qū)域表示中使用,如,灰度均值、方差等.另外,與應(yīng)用有關(guān)的區(qū)域特
28、征也可以用來表示區(qū)域.如果我們要解釋一幅圖像,則圖像的表示還應(yīng)該包含有相鄰區(qū)域的關(guān)系. 4.3.4 圖像分割數(shù)據(jù)結(jié)構(gòu) 為了實現(xiàn)用于圖像分割的區(qū)域合并和分裂算法(見 4.4 節(jié)),所生成的區(qū)域必須以某種數(shù)據(jù)結(jié)構(gòu)保存.合并和分裂運算要使用區(qū)域之間的邊界信息以及區(qū)域的總體特性,因此,為了更容易地處理區(qū)域特征,人們提出許多相應(yīng)的數(shù)據(jù)結(jié)構(gòu).在本節(jié), 我們將討論幾種用于區(qū) 域合并和分裂的數(shù)據(jù)結(jié)構(gòu). (1)區(qū)域鄰接圖 區(qū)域鄰接圖( region adjacency graphs, RAG)表示圖像中區(qū)域與區(qū)域之間的關(guān)
29、系,它主要強調(diào)由區(qū)域構(gòu)成的圖像的劃分和每一個劃分的特性.區(qū)域的不同特性可以存貯在不同的節(jié)點數(shù)據(jù)結(jié)構(gòu)中. RAG (見圖 4.7)中的節(jié)點表示區(qū)域,節(jié)點之間的弧線表示區(qū)域的公共邊界. RAG 強調(diào)區(qū)域的鄰接性,因此在圖像分割中起著關(guān)鍵的作用. RAG 形成的基本過程是:在進行基于灰度值等基元特性的初始分割后,將分割結(jié)果表示為 RAG ,然后,可以再組合區(qū)域以得到更好的分割.算法4.3 給出了產(chǎn)生 RAG 的步驟. 算法 4.3 區(qū)域鄰接圖生成算法 掃描陣列 a 并在每一個像素角標 ], [j i 完成下列各步, 讓 ], [1j i a
30、 r =, 查看像素在 ], [j i 的鄰接像素 ], [l k . 對每一個鄰近像素,進行下一步, 讓], [2l k a r =, 如果 21r r ,≠在區(qū)域鄰接圖的節(jié)點 1r 和 2r 之間增加一條弧線. 在某些場合,也可能用到區(qū)域鄰近圖的對偶圖.在對偶圖的表示中,節(jié)點表示邊界,而弧線則表示被邊界分割的區(qū)域. 圖 4. 7 用于圖像分割的區(qū)域鄰接圖.左圖:已分割的圖像,右圖:區(qū)域鄰接 圖 (2)超級
31、網(wǎng)格 在某些應(yīng)用中,希望把分割信息存貯在圖像陣列中.在這種情況下表示邊界會遇到一些問題.直觀地看,邊界應(yīng)位于兩個鄰接區(qū)域的像素之間.然而,在圖像陣列表示中,邊界只能用實際的像素來表示.解決這一問題的方法是引進超級網(wǎng)格, 如圖 4.8 所示.如果原始圖像是 n n ? ,那么超級網(wǎng)格就是 12( 12(+? +n n 陣列.每一個像素被八個位于超級網(wǎng)格上的非像素點包圍.非像素點用來表示兩個像素之間的邊界,以及邊界的方向.這就大大簡化了合并和分裂運算. 圖 4.
32、 8 超級網(wǎng)格區(qū)域表示.左:圖像網(wǎng)格;中:傳統(tǒng)的邊界表示;右:超級網(wǎng)格表示 4.4 分裂和合并 具有恒定灰度的區(qū)域,閾值化算法的輸出也常常包含有許多額外的區(qū)域.造成這一問題的主要原因是高頻噪聲和不同區(qū)域灰度值的緩變. 在基于灰度特征進行區(qū)域的初始分割后,所得到的區(qū)域可能需要進一步細化分割或修正處理.目前已經(jīng)有了許多種處理的方法,其中的一些方法是使用了相關(guān)域知識,另一些方法則使用了圖像處理知識.區(qū)域的進一步細化分割可以由人通過計算機界面交互地進行,也可以由計算機自動來完成.在計算機自動細化分割中,必須使用有關(guān)物體的特性、圖像的特性等知識.
33、使用分裂和合并的組合算法可以實現(xiàn)自動細化分割運算.分裂和合并運算是通過合并屬于同一物體的鄰接區(qū)域來消除錯誤的邊界和虛假的區(qū)域,同時可以通過分裂屬于不同物體的區(qū)域來增添丟失的邊界. 4.4.1 區(qū)域合并 合并運算就是把相似的區(qū)域組合起來.算法 4.4 是一種合并運算的高層算 法,該算法可以用于各種相似區(qū)域的測量. 算法 4.4 區(qū)域合并算法 使用閾值法(或其它簡單的方法)進行圖像的初始區(qū)域分割,然后進行連通域 標記 , 建立圖像的 RAG , 對于圖像中的每一個區(qū)域,完成下列步驟:
34、 a .查看是否與鄰接區(qū)域相似 , b .合并相似的區(qū)域,并修改 RAG , 重復(fù)步驟 3,直到?jīng)]有區(qū)域可以合并. 然而,當使用這一簡單算法時,也可能遇上麻煩.例如,一幅圖像具有三個鄰 接區(qū)域 A 、B 、 C ,相似性謂詞分別確定 A 和 B 是相似的, B 和 C 是相似的,但 A 和 C 不相似.在合并相似區(qū)域時,盡管 A 和 C 這兩個區(qū)域并不相似,但分別合 并 A 、B 和 B 、C 這樣的局部決策會把三個區(qū)域合并成單一區(qū)域.在這種情況下,我們必須在區(qū)域合并前,考慮附加的區(qū)域特征. 合并算法中最重要的
35、運算是確定兩個區(qū)域的相似性.評判區(qū)域相似性方法有許多.廣義地說,評判相似性的方法可以基于區(qū)域的灰度值,也可以基于區(qū)域邊界的強弱性,也許還包含著這些區(qū)域的空間鄰近性. 評價鄰接區(qū)域的相似性有兩種方法: 1. 比較它們的灰度均值.如果灰度均值無法用預(yù)先設(shè)置的灰度值來區(qū)分,則可 以認 為它們相似,并確定為合并的候選區(qū)域. 這一方法的改進形式是使用曲面擬 合方法,以便確定是否存在一個曲面來逼近區(qū)域. 2. 假設(shè)灰度值服從概率分布,根據(jù)相鄰區(qū)域是否具有相同的概率分布函數(shù)考慮 是否 合并它們.這一方法使用了
36、假設(shè)-檢驗方法來評判鄰接區(qū)域的相似性(下面將詳細討論). (1)合并統(tǒng)計意義下的相似區(qū)域 這種方法將考慮兩個相鄰區(qū)域的統(tǒng)計特性,以便決定是否合并它們.假設(shè)圖像中的區(qū)域具有恒定灰度值,并且被獨立、加性和零均值高斯噪聲污染,所以灰度值 服從正態(tài)分布.假定兩個相鄰區(qū)域 R 1 和 R 2 分別包含有 m 1,m 2 個點 , 有兩種可能的假設(shè): 0H :兩個區(qū)域?qū)儆谕晃矬w.在這種情況下,兩個區(qū)域的灰度值都服從單一 高斯分布 , (2 00σμ. 1H : 屬于不同物體的區(qū)域.在這種情況下,每一個區(qū)域的灰度值服從不同的
37、高 斯分布 , ( , (222211 σμσμ和. 一般情況下,上面所述參數(shù)是未知的,但可以使用樣本來估計.例如,當區(qū)域 包含有 n 個像素,每個像素灰度值為 n i g i ,..., 2, 1, =, 服從正態(tài)分布: . 21 (22 ( σμσπ--= i g i e g p (4. 4 這些參數(shù)的最大似然估計方程為: ∑==n i i g n 1 1?μ (4.5 ∑=-=n i i g n 1 22. ?(1? μσ.6(4在假設(shè) 0H 下,所有的像素獨立服從同一個分布 , (20
38、0 σ u.N 在 0H 下的聯(lián)合概率密度是: 2 (02 (012 (10021212 1021120212102 02121 2(1 . 2(121 , ( , , , (m m m m g m m m m i g m m i i m m e e e H g p H g g g p m m i i i +-+--++=-- +=+=∑= == ? ? ? +=∏∏σπσ πσμσμ.7 (4 在假設(shè) H 1 下,屬于區(qū)域 R 1 的 1m 個像素服從分布 ,
39、 (211 σu ,N屬于區(qū)域 R 2 的 2m 個像素服從分布 , (222 σ u.N在這一假設(shè)下,聯(lián)合分布密度函數(shù)為: 2221112122112111 (1 2(1 |, , , , , , (m m m m m m m m e e H g g g g g p --++=? ? ? ? ? ? σπσπ.8(4 似然比 L 定義為兩種假設(shè)下的概率密度之比: 2 121210 021121. |, , , ( |, , , (m m m m H g g p H g g p L ? =
40、? ? ? ? ? ?σσσ= + (4.9 在上面方程中,參數(shù) 210, , σσσ可由方程 4. 5 和 4.6 通過使用 21m m +個像素估計得到,其中 1m 、 2m 分別是區(qū)域 R 1 和 R 2 的像素.如果似然比低于某一閾值,說明這兩個區(qū)域可以合并為一個區(qū)域. 這一方法也可用于邊緣檢測.由于似然比可以指出兩個區(qū)域是否分離,因此,也就指示出兩個區(qū)域之間是否存在一條邊界.對于邊緣檢測,一個像素點任意一側(cè)區(qū)域的似然比可用來探測邊緣的存在. 現(xiàn)在有許多似然比的修正公式,并在許多應(yīng)用中起著十分重要的作用.似然比是在區(qū)域為恒定灰度值的
41、假設(shè)下推導(dǎo)出來的,恒定灰度值(由于噪聲)服從正態(tài)分布.也可以假設(shè)灰度分布不是恒定值,而是平面分布或是二次曲面分布,由此推導(dǎo)似然比,并可得到類似的應(yīng)用. 4.4.2 區(qū)域分裂 如果區(qū)域的某些特性不是恒定的,則區(qū)域應(yīng)該分裂.基于分裂方法的圖像分割 過程是從最大的區(qū)域開始,在許多情況下,常常把整個圖像作為起始分裂的圖像. 算法 4.5 給出了圖像分裂的一種算法. 區(qū)域分裂前,必須明確二個問題,一是確定什么情況下區(qū)域的特性不恒定,二是如何分裂這樣的區(qū)域,使得分裂后的子區(qū)域特性值恒定.這些問題與應(yīng)用域有關(guān),須在特定應(yīng)用領(lǐng)域中有關(guān)區(qū)域特性的基礎(chǔ)上討論.
42、在某些應(yīng)用場合,灰度的變化量常常作為灰度值接近恒值程度的度量.在其它的一些應(yīng)用中,可用擬合函數(shù)來逼近灰度值,擬合函數(shù)與實際的灰度值之差可作為區(qū)域相似度的度量. 分裂區(qū)域要比確定區(qū)域灰度值是否恒定難的多.一種用于區(qū)域分割的最佳邊界 確定方法是在區(qū)域內(nèi)考慮邊緣強度測量.最容易的區(qū)域分裂方法是把區(qū)域分割成固 定數(shù)量的等尺度區(qū)域,稱為常規(guī)分解方法.在 4. 3. 2 節(jié)討論的四叉樹圖像表示方 法就是常規(guī)分解方法的一個例子. 算法 4.5 區(qū)域分裂算法 形成初始區(qū)域 對圖像的每一個區(qū)域,連續(xù)執(zhí)行下面兩步: (a
43、)計算區(qū)域灰度值方差 (b )如果方差值大于某一閾值,則沿著某一合適的邊界分裂區(qū)域. 需要指出,四叉樹方法不能直接用于非二值圖像的分割,必須經(jīng)過修正后才能使用.也就是說,決定區(qū)域是否分裂的基礎(chǔ)不是黑白區(qū)域,而是圖像方差.一般說來,區(qū)域分裂比其合并更困難. 4.4.3 分裂和合并 分裂和合并運算可以同時進行,也就是說,用閾值化方法預(yù)分割后,連續(xù)進行分裂和合并,最后得到圖像的精確分割.分裂和合并組合算法對分割復(fù)雜的場景圖像十分有用.引入應(yīng)用域知識,可以提高分裂和合并算法的有效性. 假定把一幅圖像分割成為若干區(qū)域,形成
44、區(qū)域集, }{k R , m k , , 2, 1 =,按照 有關(guān)區(qū)域的謂詞邏輯 P 的性質(zhì),區(qū)域上的所有像素將是一致的.謂詞表示了區(qū)域中像素之間的相似性.例如,在區(qū)域中使用灰度方差來定義謂詞: ? ?? =其它方差小于某一值 01 (R P (4.10) 區(qū)域分割的分裂和合并算法見算 法 4.6 算法 4.6 區(qū)域分割的分裂與并合算法: 設(shè)整幅圖像為初始區(qū)域 選一個區(qū)域 R ,如果 (R P 錯誤,則把該區(qū)域分裂成四個子區(qū)域 考慮圖像中任意兩個或更多的鄰接子區(qū)域 n R R R , , 21?
45、? ? , 如果 (11n R R R P ? ? ? 正確,則把這 n 個區(qū)域合并成一個區(qū)域. 重復(fù)以上各步,直到不能再進行區(qū)域分裂和合并. 4.5 區(qū)域增長 在許多圖像中,單個區(qū)域內(nèi)的灰度值不是完全恒定的,因此需要更復(fù)雜的算法來進行 圖像分割.其中最好的算法是那些基于如下假設(shè)的算法,即圖像可以劃分成區(qū)域,而區(qū)域可以用簡單函數(shù)模型化.將這種想法用于圖像分割是很自然的. 由第 4.2 節(jié)提出的分割問題可導(dǎo)出如下算法:尋找初始區(qū)域核,并從區(qū)域核開始,逐漸增長核區(qū)域,形成滿足一定約束的較大的區(qū)域.
46、例如,一致性謂詞是基于區(qū)域灰度的平面或二次曲面函數(shù)擬合.然而,在一般情況下,一致性謂詞是基于 圖像區(qū)域的特征,如,平均強度、方差、紋理和顏色等.這一算法概括在算法 4. 7. 該算法首先把圖像分割成 n n ? 個區(qū)域,其中 n 的典型值為 5 到 9.如果一個平面函數(shù)或一個二次曲面函數(shù)可以同時擬合兩個相鄰區(qū)域,則并合這兩個區(qū)域.平面和二次曲面模型是一些基函數(shù)的線性組合,其中基函數(shù)包含了各階雙變量多項式.所以,模型可以表示為: ∑≤ += m j i i i ij y x a m a y x f , , , ( (4.11)
47、其中模型的階數(shù) m 限制在 02≤≤ 也m就是說,區(qū)域的 模型只有平面和二次曲面函數(shù). 一致性謂詞是基于區(qū)域中點與區(qū)域模型之間的距 離: ∑∈= R y c m a y x d m a R , 22 , , , ( , , ( ( 4. 12) χ 其中距離是通常的 歐幾里德距離: . ], , , ( , ([ , , , (22m a y x f y x g m a y x d -= (4.13) 在圖像平面中,點 (x, y 處的灰度值 g(x, y 是圖像在那一位置的像素灰度值.已 知點集 R ,求解模型的階數(shù)
48、 m 和模型參數(shù) a 使得誤差函數(shù) χ2(, , R a m最?。畬嶋H 上這是一個最小二乘法問題,可以通過奇異值分解求解.關(guān)于奇異值分解的詳細討論見文獻 [196]. 算法 4.7 基于平面和二次曲面模型的區(qū)域增長算法 1. 把圖像劃分成初始區(qū)域核 2. 用平面模型擬合每一個區(qū)域核.如果 χ2誤差足夠小,則接收這一區(qū)域核及其模型,否則,拒絕接收. 3. 對每一個區(qū)域,通過區(qū)域模型向鄰接區(qū)域外插,求取與該區(qū)域兼容的所有點.兼容點定義為: }4,(,,,(|,{( ( (2 (鄰域的一個是且
49、 -≤ =k i k i k i C R y x m a y x d y x C 其中 ε是兼容ε閾值 4. 如果沒有兼容點,則增加模型階數(shù), m<--m+1.如果模型階數(shù)大于最大的模型階數(shù),停止區(qū)域增長;否則,回到第三步,繼續(xù)區(qū)域增長. 5. 形成新的區(qū)域,重新用相同階數(shù)的模型擬合新區(qū)域,計算擬合最佳度 , , ( 1(2m a R k i + . χ 6. 計算區(qū)域模型的新老擬合最佳度之差: , , ( , , ( ( (2 1( 1(2 1(k i k k i k k R a m R a m -=+++ χχρ 7.
50、如果 1 1(T k <+ ,ρ回到第三步,繼續(xù)區(qū)域增長. 8. 增加模型階數(shù), 1+← m m .如果模型階數(shù)大于最大的模型階數(shù),停止區(qū)域 增長. 9. 用新的模型階數(shù)再擬合區(qū)域模型.如果擬合誤差減少,接收新的模型階數(shù),回到第3步,繼續(xù)區(qū)域增長,否則,停止區(qū)域增長. 在對組合點集進行曲面擬合前,必須檢測點對曲面片的兼容性,主要原因是最 小二乘法擬合對局外點( outlier )十分敏感.如果在擬合前,把一個局外點加到區(qū) 域中,則曲面片會由于局外點發(fā)生嚴重變形,以至于無法擬合那些真正屬于區(qū)域的 點.
51、一般說來,事先不可能知道如何把一幅圖像分割成幾個可用明顯不同的曲面片模型化的區(qū)域,因為這是分割本身要解決的問題,但是求取區(qū)域核的方法有許多,可以使用嚴格的方法來保守地求取區(qū)域核,可以使用保守的閾值化方法求取區(qū)域核,可以使用域知識和圖像的特性建立復(fù)雜的方法來求取初始區(qū)域核,例如在距離圖像中,微分幾何特性可以用來求取初始區(qū)域核.使用一些圖像的一般特性來識別 這些區(qū)域核也是一種有效的方法,比如,可以首先把圖像分割成 77? 的區(qū)域核,然后用曲面片擬合這些區(qū)域核,根據(jù)曲面片擬合的 2χ誤差 函數(shù)決定是否接收這一區(qū)域核.如果一個 77? 曲面片被拒絕,那么可以用一 個 55?
52、曲面片來代替,以便得到高的分辨率.區(qū)域增長是通過接收兼容點來實現(xiàn)的.如果區(qū)域的曲面片可以擴展到包容距離曲面片不遠的一些點,則這些點與區(qū)域是兼容的,得到區(qū)域兼容點后,曲面片可以重新擬合由原區(qū)域和兼容點共同組成的新區(qū)域. 一個點可能屬于一個或一個以上的區(qū)域,這一不確定性問題通過選擇模型后處理過程來解決.在區(qū)域增長的經(jīng)典方法中,要求每一個點最多只能屬于一個區(qū)域.體現(xiàn)這一約束的途徑是修改現(xiàn)有算法,使得一個區(qū)域接收來自另一個區(qū)域的點可以同時改善這兩個區(qū)域曲面片模型的擬合效果.更精確地說,把一個點從一個區(qū)域分配到另一個區(qū)域的條件是這兩個區(qū)域的表面擬合組合誤差最低. 早先討論的經(jīng)典區(qū)域分割方法可以認為是區(qū)域增長技術(shù),其中曲面片僅限于常數(shù).換句話說,所用的假設(shè)條件是圖像中的區(qū)域幾乎是常數(shù),圖像可以劃分成分段常數(shù)圖像強度區(qū)域.推廣這一假設(shè)條件到變化的圖像強度場合,可以得到更復(fù)雜的分割算法,可以處理由于陰影而產(chǎn)生的更真實的圖像強度變化.
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。