圖像分割算法有哪些

時(shí)間：2020-08-03 19:36:01

關(guān)鍵字：圖像分割數(shù)字圖像處理

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 　　數(shù)字圖像處理技術(shù)是一個(gè)跨學(xué)科的領(lǐng)域。隨著計(jì)算機(jī)科學(xué)技術(shù)的不斷發(fā)展，圖像處理和分析逐漸形成了自己的科學(xué)體系，新的處理方法層出不窮，盡管其發(fā)展歷史不長，但卻引起各方面人士的廣泛關(guān)注。首先，視覺是

　　數(shù)字圖像處理技術(shù)是一個(gè)跨學(xué)科的領(lǐng)域。隨著計(jì)算機(jī)科學(xué)技術(shù)的不斷發(fā)展，圖像處理和分析逐漸形成了自己的科學(xué)體系，新的處理方法層出不窮，盡管其發(fā)展歷史不長，但卻引起各方面人士的廣泛關(guān)注。首先，視覺是人類最重要的感知手段，圖像又是視覺的基礎(chǔ)，因此，數(shù)字圖像成為心理學(xué)、生理學(xué)、計(jì)算機(jī)科學(xué)等諸多領(lǐng)域內(nèi)的學(xué)者們研究視覺感知的有效工具。其次，圖像處理在軍事、遙感、氣象等大型應(yīng)用中有不斷增長的需求。

　　圖像分割就是把圖像分成若干個(gè)特定的、具有獨(dú)特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過程。它是由圖像處理到圖像分析的關(guān)鍵步驟?，F(xiàn)有的圖像分割方法主要分以下幾類：基于閾值的分割方法、基于區(qū)域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。1998年以來，研究人員不斷改進(jìn)原有的圖像分割方法并把其它學(xué)科的一些新理論和新方法用于圖像分割，提出了不少新的分割方法。圖像分割后提取出的目標(biāo)可以用于圖像語義識別，圖像搜索等等領(lǐng)域。

　　圖像分割有哪些方法

　　1 基于區(qū)域的圖像分割

　　圖像分割中常用的直方圖門限法、區(qū)域生長法、基于圖像的隨機(jī)場模型法、松弛標(biāo)記區(qū)域分割法等均屬于基于區(qū)域的方法。

　?。?）直方圖門限分割就是在一定的準(zhǔn)則下，用一個(gè)或幾個(gè)門限值將圖像的灰度直方圖（一維的或多維的）分成幾個(gè)類，認(rèn)為圖像中灰度值在同一個(gè)灰度類內(nèi)的象素屬于同一個(gè)物體，可以采用的準(zhǔn)則包括直方圖的谷底、最小類內(nèi)方差（或最大類間方差）、最大熵（可使用各種形式的熵）、最小錯(cuò)誤率、矩不變、最大繁忙度（由共生矩陣定義）等。門限法的缺陷在于它僅僅考慮了圖像的灰度信息，而忽略了圖像中的空間信息，對于圖像中不存在明顯的灰度差異或各物體的灰度值范圍有較大重疊的圖像分割問題難以得到準(zhǔn)確的結(jié)果。

　?。?）區(qū)域生長是一種古老的圖像分割方法，最早的區(qū)域生長圖像分割方法是由Levine等人提出的。該方法一般有兩種方式，一種是先給定圖像中要分割的目標(biāo)物體內(nèi)的一個(gè)小塊或者說種子區(qū)域，再在種子區(qū)域基礎(chǔ)上不斷將其周圍的像素點(diǎn)以一定的規(guī)則加入其中，達(dá)到最終將代表該物體的所有像素點(diǎn)結(jié)合成一個(gè)區(qū)域的目的；另一種是先將圖像分割成很多的一致性較強(qiáng)，如區(qū)域內(nèi)像素灰度值相同的小區(qū)域，再按一定的規(guī)則將小區(qū)域融合成大區(qū)域，達(dá)到分割圖像的目的，典型的區(qū)域生長法如T. C. Pong等人提出的基于小面（facet）模型的區(qū)域生長法，區(qū)域生長法固有的缺點(diǎn)是往往會造成過度分割，即將圖像分割成過多的區(qū)域。

　?。?）基于圖像的隨機(jī)場模型法主要以Markov隨機(jī)場作為圖像模型，并假定該隨機(jī)場符合Gibbs分布。使用MRF模型進(jìn)行圖像分割的問題包括：鄰域系統(tǒng)的定義；能量函數(shù)的選擇及其參數(shù)的估計(jì)；極小化能量函數(shù)從而獲得最大后驗(yàn)概率的策略。鄰域系統(tǒng)一般是事先定義的，因而主要是后面兩個(gè)問題。S. Geman，首次將基于Gibbs分布的Markov隨機(jī)場模型用于圖像處理，詳細(xì)討論了MRF模型的鄰域系統(tǒng)，能量函數(shù)，Gibbs采樣方法等各種問題，提出用模擬退火算法來極小化能量函數(shù)的方法，并給出了模擬退火算法收斂性的證明，同時(shí)給出了MRF模型在圖像恢復(fù)中的應(yīng)用實(shí)例。在此基礎(chǔ)上，人們提出了大量的基于MRF模型的圖像分割算法。

　?。?）標(biāo)記法（labeling）就是將圖像欲分割成的幾個(gè)區(qū)域各以一個(gè)不同的標(biāo)號來表示，對圖像中的每一個(gè)象素，用一定的方式賦之以這些標(biāo)記中的某一個(gè)，標(biāo)記相同的連通象素就組成該標(biāo)記所代表的區(qū)域。標(biāo)記法常采用松弛技術(shù)來給圖像中的各個(gè)象素賦予標(biāo)記，一般可分為離散松弛、概率松弛、模糊松弛等三種。Smith等人最先采用松弛標(biāo)記技術(shù)進(jìn)行圖像分割，以后人們又提出了大量的圖像松弛分割算法。另外，松弛標(biāo)記不僅可用于圖像分割，還可用于邊緣檢測、目標(biāo)識別等。

　　2 基于邊緣的圖像分割

　　基于邊緣的分割方法則與邊緣檢測理論緊密相關(guān)，此類方法大多是基于局部信息的，一般利用圖像—階導(dǎo)數(shù)的極大值或二階導(dǎo)數(shù)的過零點(diǎn)信息來提供判斷邊緣點(diǎn)的基本依據(jù)，進(jìn)一步還可以采用各種曲線擬合技術(shù)獲得劃分不同區(qū)域邊界的連續(xù)曲線。根據(jù)檢測邊緣所采用的方式的不同，邊緣檢測方法可大致分為以下幾類：基于局部圖像函數(shù)的方法、圖像濾波法、基于反應(yīng)—擴(kuò)散方程的方法、基于邊界曲線擬合的方法及活動(dòng)輪廊（acTIve contour）法等。

　?。?）基于局部圖像函數(shù)法的基本思想是將灰度看成高度，用一個(gè)曲面來擬合一個(gè)小窗口內(nèi)的數(shù)據(jù)，然后根據(jù)該曲面來決定邊緣點(diǎn)。

　?。?）圖像濾波法是基于如下理論的：即對濾波算子與圖像的卷積結(jié)果求導(dǎo)，相當(dāng)于用算子的同階導(dǎo)數(shù)與圖像做卷積。于是，只要事先給出算子的一階或二階導(dǎo)數(shù)，就可以將圖像平滑濾波與對平滑后的圖像求一階或二階導(dǎo)數(shù)在一步完成。因而，這種方法的核心問題是濾波器的設(shè)計(jì)問題。

　　常用的濾波器主要是高斯（Gaussian）函數(shù)的一階和二階層數(shù)，Canny認(rèn)為高斯函數(shù)的一階導(dǎo)數(shù)是他求得的最優(yōu)濾波器的較好似近，一般采用Laplacian算子求高斯函數(shù)的二階導(dǎo)數(shù)得到LOG（Laplacian of Gaussian）濾波算子，該算子由計(jì)算機(jī)視覺的創(chuàng)始人Marr首先提出。近年來研究的濾波器還有可控濾波器（steerable），B-樣條濾波器等。

　　問題提出：圖像濾波的方法是基于對平滑濾波后的圖像求其一階導(dǎo)數(shù)的極大值或二階導(dǎo)數(shù)的過零點(diǎn)來決定邊緣的，必然遇到的問題是，一階的極大值或二階導(dǎo)數(shù)的過零點(diǎn)對應(yīng)的像素點(diǎn)是否真的就是邊緣點(diǎn)？

　?。?）基于反應(yīng)—擴(kuò)散方程的方法是從傳統(tǒng)意義上的Gaussian核函數(shù)多尺度濾波來的。由于本人閱讀文獻(xiàn)有限，這里不多做介紹了。

　?。?）基于邊界曲線擬合的方法用平面曲線來表示不同區(qū)域之間的圖像邊界線，試圖根據(jù)圖像梯度等信息找出能正確表示邊界的曲線從而得到圖像分割的目的，而且由于它直接給出的是邊界曲線而不象一般的方法找出的是離散的、不相關(guān)的邊緣點(diǎn)，因而對圖像分割的后繼處理如物體識別等高層處理有很大幫助。即使是用一般的方法找出的邊緣點(diǎn)，用曲線來描述它們以便于高層處理也是經(jīng)常被采用的一種有效的方式。

　　L. H. Staib等人在文獻(xiàn)中給出了一種用Fourier參數(shù)模型來描述曲線的方法，并根據(jù)Bayes定理，按極大后驗(yàn)概率的原則給出了一個(gè)目標(biāo)函數(shù)，通過極大化該目標(biāo)函數(shù)來決定Fourier系數(shù)。實(shí)際應(yīng)用中，先根據(jù)對同類圖像的分割經(jīng)驗(yàn)，給出一條初始曲線，再在具體分割例子中根據(jù)像數(shù)據(jù)優(yōu)化目標(biāo)函數(shù)來改變初始曲線的參數(shù)，擬合圖像數(shù)據(jù)，得到由圖像數(shù)據(jù)決定的具體曲線。這種方法比較適合于醫(yī)學(xué)圖像的分割。除了用Fourier模型來描述曲線外，近年來還研究了一些其它的曲線描述方法，如A.Goshtasby詳細(xì)介紹了用有理Gaussian曲線和曲面來設(shè)計(jì)和擬合二維及三維形狀的方法。R. Legault等人給出了一種曲線平滑的方法。M. F. Wu等人給出了一種雙變量三維Fourier描述子來描述三維曲面。

　?。?）活動(dòng)輪廓（又稱Snake模型）是一種可變形模型（或稱彈性模型），最初由Kass等人提出 ?；顒?dòng)輪廓法邊緣檢測認(rèn)為圖像中各區(qū)域的輪廓線應(yīng)為平滑曲線，各輪廓線的能量由內(nèi)部能量及外部能量（包括圖像能量及控制能量）兩部分組成，其中內(nèi)部能量表征了輪廓線的光滑約束，圖像能量由輪廓線上對應(yīng)點(diǎn)的灰度、梯度和角點(diǎn)曲率半徑（若該點(diǎn)為角點(diǎn)）等決定，而控制能量則代表了圖像平面上固定點(diǎn)對輪廓線的吸引或排斥作用。采用變分法求解該能量函數(shù)的極小值就可得到與區(qū)域邊界相對應(yīng)的輪廓線。