當(dāng)前位置:首頁 > 公眾號精選 > AI科技大本營
[導(dǎo)讀]作者|小白來源|?小白學(xué)視覺了解圖像分割當(dāng)我們在做一個圖像分類任務(wù)時,首先我們會想從圖像中捕獲感興趣的區(qū)域,然后再將其輸入到模型中。讓我們嘗試一種稱為基于聚類的圖像分割技術(shù),它會幫助我們在一定程度上提高模型性能,讓我們看看它是什么以及一些進(jìn)行聚類分割的示例代碼。什么是圖像分割?想...

作者 | 小白
來源 | 小白學(xué)視覺


了解圖像分割
當(dāng)我們在做一個圖像分類任務(wù)時,首先我們會想從圖像中捕獲感興趣的區(qū)域,然后再將其輸入到模型中。讓我們嘗試一種稱為基于聚類的圖像分割技術(shù),它會幫助我們在一定程度上提高模型性能,讓我們看看它是什么以及一些進(jìn)行聚類分割的示例代碼。



什么是圖像分割?
想象一下我們要過馬路,過馬路之前我們會做什么?



首先,我們會看道路兩旁,以確定接近的車輛等環(huán)境對象,然后我們會對接近的車輛的速度做出一些快速的估計,并決定何時以及如何過馬路。所有這些都發(fā)生在很短的時間內(nèi),非常很的神奇。



  1. 我們的大腦捕捉道路兩側(cè)的圖像


  2. 它檢測道路上的車輛和其他物體==物體檢測


  3. 它還確定了它檢測到的每個對象的形狀 == 圖像分割



通過確定不同物體的形狀,我們的大腦能夠在同一張快照中檢測到多個物體,這是多么神奇啊。



讓我們進(jìn)一步了解,假設(shè)我們有我們的圖像分類模型,它能夠以 95% 上的準(zhǔn)確率對蘋果和橙子進(jìn)行分類。當(dāng)我們輸入一幅同時包含蘋果和橙子的圖像時,預(yù)測精度會下降。隨著圖像中對象數(shù)量的增加,分類模型的性能會下降,這就是目標(biāo)定位發(fā)揮作用的地方。



在我們檢測圖像中的對象并對其進(jìn)行分類之前,模型需要了解圖像中的內(nèi)容,這就是圖像分割的幫助所在。它為圖像中的對象創(chuàng)建一個像素級的蒙版,這有助于模型更精細(xì)地理解對象的形狀及其在圖像中的位置。



目標(biāo)檢測 VS 圖像分割



分割的類型有哪些?
圖像分割大致分為兩大類。


  1. 語義分割


  2. 實(shí)例分割


檢測到的對象 — 語義段 — 實(shí)例段



在第一張圖片中,我們可以看到檢測到的對象都是男性。在語義分割中,我們認(rèn)為所有這些像素都屬于一類,因此我們用一種顏色表示它們。另一方面,在實(shí)例分割中,這些像素屬于同一類,但我們用不同的顏色表示同一類的不同實(shí)例。



根據(jù)我們使用的分割方法,分割可以分為許多類別。


  • 基于區(qū)域的分割


  • 基于邊緣檢測的分割


  • 基于聚類的分割


  • 基于CNN的分割等。



接下來讓我們看一個基于聚類的分割示例。



什么是基聚類的分割?
聚類算法用于將彼此更相似的數(shù)據(jù)點(diǎn)從其他組數(shù)據(jù)點(diǎn)更緊密地分組。



現(xiàn)在我們想象一幅包含蘋果和橙子的圖像。蘋果中的大部分像素點(diǎn)應(yīng)該是紅色/綠色,這與橙色的像素值不同。如果我們能把這些點(diǎn)聚在一起,我們就能正確地區(qū)分每個物體,這就是基于聚類的分割的工作原理?,F(xiàn)在讓我們看一些代碼示例。


from skimage.io import imreadfrom skimage.color import rgb2grayimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefrom scipy import ndimage# Scaling the image pixels values within 0-1img = imread('./apple-orange.jpg') / 255plt.imshow(img)plt.title('Original')plt.show()


由于肉眼可見,圖像中有五個色段



  1. 蘋果的綠色部分


  2. 橙子的橙色部分


  3. 蘋果和橙子底部的灰色陰影


  4. 蘋果頂部和右側(cè)部分的亮黃色部分


  5. 白色背景



讓我們看看我們是否可以使用來自 scikit-learn 的 K 均值算法對它們進(jìn)行聚類


# For clustering the image using k-means, we first need to convert it into a 2-dimensional arrayimage_2D = img.reshape(img.shape[0]*img.shape[1], img.shape[2])# Use KMeans clustering algorithm from sklearn.cluster to cluster pixels in imagefrom sklearn.cluster import KMeans# tweak the cluster size and see what happens to the Outputkmeans = KMeans(n_clusters=5, random_state=0).fit(image_2D)clustered = kmeans.cluster_centers_[kmeans.labels_]# Reshape back the image from 2D to 3D imageclustered_3D = clustered.reshape(img.shape[0], img.shape[1], img.shape[2])plt.imshow(clustered_3D)plt.title('Clustered Image')plt.show()


效果非常好,我們能夠?qū)⑽鍌€部分組合在一起,這就是聚類分割的工作原理。目前有許多先進(jìn)的技術(shù),例如 Mask R-CNN,可以進(jìn)行更細(xì)粒度的分割。




Github代碼連接:


https://github.com/Mathanraj-Sharma/sample-for-medium-article/blob/master/cluster-based-segmentation-skimage/cluster-based-segmentation.ipynb





本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

摘 要 :智能汽車競賽的賽題難度與工程應(yīng)用性能在不斷提升,賽道元素日益增多且賽道類型逐漸多樣,其識別難度隨之增大,以賽道邊界線斜率、曲率和圖像中黑白跳變等信息為依據(jù)的傳統(tǒng)賽道識別方法已無法適用于復(fù)雜的賽道情況。因此,通過...

關(guān)鍵字: 圖像分割 特征分析 圖像匹配 賽道元素 智能汽車競賽 賽道識別

摘 要 :圖像處理作為計算機(jī)視覺技術(shù)必不可少的部分,成為眾多學(xué)者口中的熱點(diǎn)及難點(diǎn)。圖像分割是把圖像分成若干個特定、具有獨(dú)特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過程,目的是實(shí)現(xiàn)通過醫(yī)學(xué)領(lǐng)域的閾值分割方法以有效分割作物與背景。...

關(guān)鍵字: 圖像預(yù)處理 圖像增強(qiáng) 邊緣檢測 圖像分割 識別 閾值分割

  邊緣檢測和圖像分割的聯(lián)系:   邊緣檢測是通過圖像的梯度變化將圖像中梯度變化明顯的地方檢測出來,針對的是邊緣信息。圖像分割是將目標(biāo)分割出來,針對的是目標(biāo)對象,邊緣檢測是空間域圖像分割

關(guān)鍵字: 圖像分割 邊緣檢測

  數(shù)字圖像處理技術(shù)是一個跨學(xué)科的領(lǐng)域。隨著計算機(jī)科學(xué)技術(shù)的不斷發(fā)展,圖像處理和分析逐漸形成了自己的科學(xué)體系,新的處理方法層出不窮,盡管其發(fā)展歷史不長,但卻引起各方面人士的廣泛關(guān)注。首先,視覺是

關(guān)鍵字: 圖像分割 數(shù)字圖像處理

  圖像分割至今尚無通用的自身理論。隨著各學(xué)科許多新理論和新方法的提出,出現(xiàn)了許多與一些特定理論、方法相結(jié)合的圖像分割方法。   聚類分析   特征空間聚類法進(jìn)行圖像分割是將圖像

關(guān)鍵字: 圖像分割 圖像處理

所謂圖像分割指的是根據(jù)灰度、顏色、紋理和形狀等特征把圖像劃分成若干互不交迭的區(qū)域,并使這些特征在同一區(qū)域內(nèi)呈現(xiàn)出相似性,而在不同區(qū)域間呈現(xiàn)出明顯的差異性。 1、基于邊緣的圖像分割方法

關(guān)鍵字: 圖像分割 圖像處理

1引言所謂圖像分割就是根據(jù)目標(biāo)與背景的先驗(yàn)知識,對圖像中的目標(biāo)、背景進(jìn)行標(biāo)記、定位,然后將要識別的目標(biāo)從背景或其他偽目標(biāo)中分離出來。圖像分割是圖像理解的重要組成部分,其目的是將目標(biāo)和背景分離,為目標(biāo)識別

關(guān)鍵字: 圖像分割 邊緣檢測 CANNY SOBEL

全球領(lǐng)先的醫(yī)療培訓(xùn)和模擬技術(shù)供應(yīng)商Simbionix USA Corporation 的旗下子公司Simbionix Ltd. 欣然宣布,該公司的 PROcedure Rehearsal Studio(TM) 軟件已獲得...

關(guān)鍵字: 圖像分割 模擬技術(shù) FDA SIM

一. 設(shè)計概述1. 設(shè)計意圖迅速發(fā)展的醫(yī)學(xué)影像技術(shù)不斷的推動現(xiàn)代醫(yī)學(xué)進(jìn)步,CT、MRI、PET廣泛地應(yīng)用與臨床診斷分析。其作用已經(jīng)從人體組織器官解剖結(jié)構(gòu)的非侵入檢查和可視化,發(fā)展成一種用于手術(shù)計劃和仿真、手術(shù)導(dǎo)航、

關(guān)鍵字: 圖像分割 NIOS BSP 指令

AI科技大本營

111 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉