Understanding CMOS Image Sensor(二)
轉(zhuǎn)自知乎Camera技術(shù)專家?劉斯寧
鏈接:https://zhuanlan.zhihu.com/p/100777121
get="_blank">Understanding CMOS Image Sensor(一)
像素類型 (Pixel type)
2.1 被動像素 (Passive pixel)最簡單的Pixel結(jié)構(gòu)只有一個PN結(jié)作為感光結(jié)構(gòu),以及一個與它相連的reset晶體管(RS)作為一個開關(guān),如下圖所示。- 開始曝光前,像素的行選擇地址會上電,于是RS使能,連通PN結(jié)與列選擇器(column bus),同時列選擇器會上電,使PN結(jié)上加高反向電壓(如3.3 V),短暫延時后PN結(jié)內(nèi)電子空穴對達(dá)到平衡,于是reset 操作完成,RS 信號失效,隔斷PN結(jié)與column bus的連通。
- 開始曝光時,PN結(jié)內(nèi)的硅在吸收光子激發(fā)出電子-空穴對。受PN結(jié)內(nèi)電場的影響,電子會流向PN結(jié)的n 端,空穴會流向PN結(jié)的p-substrate。因此,曝光后的的PN結(jié)反向電壓會降低。
- 曝光結(jié)束后,RS再次使能,讀出電路會測量PN結(jié)內(nèi)的電壓,該電壓與原反向電壓之間的差值即正比于PN結(jié)接受到的光子數(shù)。
- 在讀出感光信號后,會對PN結(jié)進(jìn)行再次reset,準(zhǔn)備下次曝光。
當(dāng)sensor 控制邏輯需要讀出陣列中的某個特定像素時,需要發(fā)出該像素的行地址和列地址,地址會被兩個譯碼器(address decoder)解析并激活該像素所在的行選擇線和列選擇線,使該像素的PN結(jié)電容經(jīng)過RS三級管連接到輸出放大器上,如下圖所示。
- PN結(jié)的電容小于讀出電路上的電容,所以對電路噪聲很敏感。
- PN結(jié)的信號需要先讀出才進(jìn)行放大,因此讀出電路的噪聲會被一起放大。
2.3 主動像素 (Active pixel)目前主流的CMOS傳感器都采用Active Pixel 結(jié)構(gòu)設(shè)計。下圖所示的Active Pixel 結(jié)構(gòu)稱為3T結(jié)構(gòu),每個像素包含一個感光PN結(jié)和3個晶體管,即一個復(fù)位管RST,一個行選擇器RS,一個放大器SF。3T結(jié)構(gòu)的經(jīng)典版圖設(shè)計如下所示。
- 復(fù)位。使能RST給PN結(jié)加載反向電壓,復(fù)位完成后撤銷RST。
- 曝光。與Passive Pixel 原理相同。
- 讀出。曝光完成后,RS會被激活,PN結(jié)中的信號被SF放大后讀出。
- 循環(huán)。讀出信號后,重新復(fù)位,曝光,讀出,不斷輸出圖像信號。
2.4 PPD結(jié)構(gòu)為了解決復(fù)位kTC噪聲,減小暗電流,在3T結(jié)構(gòu)之后又出現(xiàn)了PPD結(jié)構(gòu)(Pinned Photodiode Pixel),包括一個PN結(jié)感光區(qū)和4個晶體管,所以也稱4T結(jié)構(gòu),它在3T結(jié)構(gòu)的基礎(chǔ)上增加了一個TX三極管起控制電荷轉(zhuǎn)移的作用。PPD結(jié)構(gòu)的經(jīng)典版圖設(shè)計如下所示。
2.5 PPD共享結(jié)構(gòu)PPD結(jié)構(gòu)有4個晶體管,有的設(shè)計甚至有5個,這大大降低了像素的填充因子(即感光區(qū)占整個像素面積的比值),這會影響傳感器的光電轉(zhuǎn)換效率,進(jìn)而影響傳感器的噪聲表現(xiàn)。為了解決這個問題又出現(xiàn)了PPD共享結(jié)構(gòu),像素的感光區(qū)和讀出電路由TX晶體管隔開,相鄰像素之間可以共用讀出電路,如下圖所示。圖中2x2像素共享一個讀出電路,一共使用7個晶體管,平均一個像素1.75個晶體管。這樣可以大大減少每個像素中讀出電路占用的面積,提高填充因子。美中不足的是,由于這2x2個像素的結(jié)構(gòu)不再一致,會導(dǎo)致固定模式噪聲(FPN)的出現(xiàn),需要在后續(xù)ISP處理中消除。
2.5 雙相關(guān)采樣(CDS)雙相關(guān)采樣即Correlated Double Samping,其基本思想是進(jìn)行兩次采樣,先采樣一個參考信號用于評估背景噪聲,延遲很短時間后再采集目標(biāo)信號,從第二次采樣中減去參考信號即得到去除了大部分背景噪聲的目標(biāo)信號,其原理模型如下圖所示。
3 CMOS Sensor特性
CMOS sensor的本質(zhì)是計量光電轉(zhuǎn)換事件的線性傳感器,在一定意義上可以說是光子計數(shù)器,sensor上每個像素的讀值都反映了指定時間內(nèi)該像素捕獲光子的數(shù)量。一個理想的sensor 應(yīng)該具備以下一些特性- 輸出與輸入恒成正比(無sensor噪聲,只有信號本身的噪聲)
- 輸入輸出均可以無限大
- 高靈敏度,小的輸入激勵大的輸出
- 高幀率
- 高分辨率
- 低功耗
- 工藝簡單
- 低成本
以上關(guān)系用公式描述就是
S(N, t)?= q(λ)·N·t
其中,S(N, t)是sensor的一個像素采集到的電子數(shù),?q(λ,)是sensor在波長λ處的光電轉(zhuǎn)換效率,N是單位時間內(nèi)入射到sensor表面的光子數(shù)(波長λ的單色光),t是曝光時間。sensor 最終輸出的像素值是使用ADC對S(N,t)進(jìn)行采樣和AD轉(zhuǎn)換得到的量化值,該值會有PV(Pixel Value),ADU(Analog-Digital Unit),DN(Digital Number),Output Code等多種表述方式,并且DN=g*S(N, t)其中符號g代表增益系數(shù)gain,意義是多少個光子能夠激勵出1個比特的DN值。下圖描述了一個CMOS像素發(fā)生光電轉(zhuǎn)換和收集光生電子的過程。3.1 量子效率 (Quantum Efficiency)
量子效率是描述光電器件光電轉(zhuǎn)換能力的一個重要參數(shù),它是在某一特定波長下單位時間內(nèi)產(chǎn)生的平均光電子數(shù)與入射光子數(shù)之比。由于sensor存在三種像素,所以量子效率一般針對三種像素分別給出。下圖是一個實際sensor的量子效率規(guī)格示例。3.2 勢阱容量 (Saturation Capacity)
勢阱容量又稱Full Well Capacity,指一個像素的勢阱最多能夠容納多少個光生電子,消費類的sensor一般以2000~4000較為常見,此值越大則sensor的動態(tài)性能越好。下圖給出一個包含勢阱容量規(guī)格的例子。下圖是一些單反相機sensor的飽和阱容比較。
3.3 噪聲 (Noise)
“噪聲”的廣義定義是:在處理過程中設(shè)備自行產(chǎn)生的信號,這些信號與輸入信號無關(guān)。由于電子的無規(guī)則熱運動產(chǎn)生的噪聲在所有電子設(shè)備中普遍存在,是不可避免的,因此被重點研究,并賦予了很多名字,如本底噪聲、固有噪聲、背景噪聲等,英文中常見noise floor, background noise等提法。如下圖所示,器件的溫度越高,電子的熱運動越劇烈,產(chǎn)生的噪聲也就越大。真實世界中的所有信號都是疊加了噪聲的,圖像信號也不例外,如下圖所示,當(dāng)有用信號的幅度小于背景噪聲時,這個信號就淹沒在噪聲中而難以分辨,只有當(dāng)有用信號的幅度大于噪聲時這個信號才是可分辨的。
下圖是對噪聲圖像的數(shù)值分析。
泊松分布是最重要的離散分布之一,它適合描述單位時間內(nèi)隨機事件發(fā)生的次數(shù)。舉例來說,假設(shè)某高速公路在某時段的車流量是每小時1380輛,平均每分鐘23輛,可是如果進(jìn)一步以分鐘為單位進(jìn)行統(tǒng)計,我們就會發(fā)現(xiàn)某一分鐘只通過了15輛,而另一分鐘則通過了30輛,這個概率分布就需要用泊松分布來描述。同理,我們可以把這個例子中的車流換成芯片內(nèi)流過PN結(jié)的電子流,或者換成通過鏡頭入射到像素的光子流,這兩種情況在統(tǒng)計意義上是完全一樣的,都需要用泊松分布來描述。下面這篇文章較詳細(xì)地解釋了泊松分布的推導(dǎo)過程和它的現(xiàn)實意義。泊松分布的現(xiàn)實意義是什么,為什么現(xiàn)實生活多數(shù)服從于泊松分布?9406 關(guān)注 · 79 回答問題
sensor 噪聲中含有幾部分分量:
- 暗散粒噪聲(σD):?硅片中電子的熱運動會導(dǎo)致一些價電子隨機激發(fā)至導(dǎo)帶中形成暗電流(dark current),所以即使完全沒有光子入射,sensor也會存在一定的信號輸出。在曝光過程中,暗電流的隨機變化即形成暗散粒噪聲。暗電流變化的主要原因是電子穿過PN結(jié)時會遇到PN結(jié)的電勢屏障(barrier),電子穿越屏障需要經(jīng)歷動能-勢能-動能的轉(zhuǎn)換過程,所以需要耗費一些時間。暗散粒噪聲在統(tǒng)計上服從泊松分布,與光信號的高低水平無關(guān),但與傳感器的溫度有關(guān),一般的規(guī)律是溫度每升高8°C暗電流翻一倍。所以在設(shè)計電路時必須注意把容易發(fā)熱的電子元件盡可能布置在遠(yuǎn)離sensor的地方。
- 讀出噪聲 (σR):?該噪聲是在產(chǎn)生電子信號時生成的。Sensor中使用AD轉(zhuǎn)換器(ADC)將模擬放大器輸出的模擬電壓采樣為數(shù)字電壓。由于數(shù)字信號的精度總是有限的,通常為10比特至14比特,幅值位于兩個相鄰數(shù)字之間的模擬信號會四舍五入到最接近的數(shù)值,所以這個過程會引入量化噪聲,這是讀出噪聲的重要組成部分。該噪聲由傳感器的設(shè)計決定,意義是至少需要多少個電子才能驅(qū)動讀出電路的ADC變化一個比特。它與信號高低水平和傳感器溫度無關(guān)。
- 光子散粒噪聲(σS):?Shot noise, 該噪聲是與落于傳感器像素上光子相關(guān)的統(tǒng)計噪聲。在微觀尺度下,光子流到達(dá)傳感器的行為在時間和空間上都是不均勻的,就像統(tǒng)計高速公路上的車流,有時車流比較密集,過一會又變得稀疏。有時左邊的車道密集,過一會右邊的車道密集,整體上其統(tǒng)計規(guī)律符合泊松分布。光子散粒噪聲是與被測信號的高低水平有關(guān)的,與傳感器溫度無關(guān)。
- 固定模式噪聲 (σF):?Fixed-pattern noise(FPN), 該噪聲是由像素的空間不均勻性引起的,CMOS sensor 每個像素內(nèi)都配置一個電荷電壓放大器,每行、每列都有一些晶體管用于控制像素的復(fù)位和讀出,這些器件的工作參數(shù)相對理論值的漂移就構(gòu)成一種固定模式噪聲。另外,壞像素、瑕疵像素也可以視為一種固定模式噪聲。FPN效果大致上可以用下面的示意圖模擬。
在所有像素中,總會有一些像素相對平均值漂移較大,這些像素稱為離群像素(outliers),如下圖所示。離群像素的數(shù)量能夠反映sensor品質(zhì)的好壞。
- 復(fù)位噪聲 (σr):?卷簾曝光方式需要在先對勢阱復(fù)位,將勢阱中自由積累的電荷全部釋放,為后續(xù)的讀出準(zhǔn)備。但是由于暗電流的存在,每次復(fù)位后都會殘留一些大小隨機的噪聲信號,即復(fù)位噪聲,其大小與像素結(jié)構(gòu)、芯片溫度、PN結(jié)電容有關(guān),因此也稱為kTC噪聲。
- 1/f噪聲 (σf):?1/f 噪聲是一種低頻噪聲,在有些文獻(xiàn)中也稱flicker noise(閃爍噪聲) 或pink noise(粉紅噪聲),它廣泛存在于半導(dǎo)體器件中。在低頻的時候1/f噪聲一般顯著高于電散粒噪聲。
- 光響應(yīng)非均勻性 (σp):?英文為PRNU,Photo Response Non-Uniformity。Bayer格式的sensor 通常存在四種像素(R,Gr,Gb,B),這四種像素的光電轉(zhuǎn)換特性(即增益特性)不可能是完全一樣的,不同種像素間存在種間差異,同種像素之間也存在個體差異,如下圖所示。
- 串?dāng)_ :?英文為Crosstalk,在通信領(lǐng)域中指兩條信號線之間由于屏蔽不良而發(fā)生了的信號耦合,一條線路上的信號通過線纜間存在的互感和互容饋送到了附近的信號線上,在模擬通信時代可能導(dǎo)致聽到別人的通話。在sensor領(lǐng)域,串?dāng)_指的是入射到一個像素A的光信號沒有在這個像素里被捕獲,反而被其周圍的像素B捕獲,導(dǎo)致B產(chǎn)生了不該有的信號。
三星公司研發(fā)了ISOCELL技術(shù)用于抑制串?dāng)_,該技術(shù)使用metal grid制造電勢屏障阻止電子進(jìn)入相鄰的像素,但是會引入一些新的問題,所以后來又發(fā)展出了ISOCELL Plus技術(shù),該技術(shù)是在ISOCELL的基礎(chǔ)上改進(jìn)了材料,避免了metal grid 引起的不良反應(yīng)。
索尼的HAD CCD技術(shù)給像素設(shè)計了一個特別的蓋子,可以防止像素內(nèi)的光電子逃逸,同時也防止像素外的自由電子進(jìn)入像素內(nèi)部。
噪聲模型
下圖測量了sensor中4種像素的光響應(yīng)特性,從圖種可以看出4種噪聲的表現(xiàn)機理。PRNU體現(xiàn)的是紅、綠、藍(lán)三種像素的增益差異。對于任一種像素,光信號越強像素值抖動越大,這體現(xiàn)了光信號本身的散粒噪聲。光信號為零時,輸出幅度最小的像素體現(xiàn)了半導(dǎo)體的暗散粒噪聲,而 紅、綠、藍(lán)三種像素之間的差異體現(xiàn)了FPN噪聲。
目前的CMOS工藝水平已經(jīng)非常先進(jìn),對于科學(xué)水平的sensor,讀出噪聲的典型值通常小于10 e-,在極限條件下甚至已經(jīng)可以做到1e-。下圖給出了一些常見單反sensor和儀器sensor的讀出噪聲水平。
本專欄的另一篇文章專題討論了降噪的算法,可以結(jié)合閱讀。劉斯寧:Understanding ISP Pipeline - Noise Reduction69 贊同 · 10 評論文章
3.4 信噪比 (SNR)
信噪比是一個電子設(shè)備或者電子系統(tǒng)中信號與噪聲的比例,如下圖所示。這里面的信號指的是來自設(shè)備外部需要通過這臺設(shè)備進(jìn)行處理的電子信號,而噪聲是指該設(shè)備自行產(chǎn)生的無規(guī)則信號,并且該種信號并不隨外部輸入信號的變化而變化。一般認(rèn)為,SNR=10dB 是可接受(acceptable)的圖像質(zhì)量標(biāo)準(zhǔn),該值意味著信號幅度是噪聲的3.16倍。而SNR=40dB 是優(yōu)秀(excellent)的圖像質(zhì)量標(biāo)準(zhǔn),該值意味著信號幅度是噪聲的100倍,因此至少需要10000e-飽和阱容。介于中間的是SNR=30dB,該值要求像素提供1000e-以上的飽和阱容,這剛好是很多手機sensor的指標(biāo)范圍。
下圖是一些單反相機的典型SNR對比。
下圖是Canon 1D3 單反相機在不同ISO下的信噪比曲線,橫坐標(biāo)是曝光量,縱坐標(biāo)是SNR,都是以"stop"為單位,即以2為底的log-log坐標(biāo)。
在評估圖像質(zhì)量時,常用以下公式計算噪聲和信噪比
3.5 動態(tài)范圍 (Dynamic Range)
一個信號系統(tǒng)的動態(tài)范圍被定義成最大不失真電平和噪聲電平的比值,在實際應(yīng)用中經(jīng)常用以10為底的對數(shù)來表示,單位是分貝。對于膠片和感光元件來說,動態(tài)范圍表示圖像中所包含的從“最暗”至“最亮”的取值范圍。根據(jù)ISO15739的定義,“最亮”指的是能夠使輸出編碼值達(dá)到特定“飽和值”的亮度;而“最暗”指的是圖像信噪比下降至1.0時的亮度。sensor 動態(tài)范圍越大,所能表現(xiàn)的層次越豐富,所包含的色彩空間也越廣。下圖是用來測量sensor動態(tài)范圍性能的常用方法。下圖列舉了一些典型單反相機sensor的動態(tài)范圍指標(biāo),縱坐標(biāo)可以理解為AD轉(zhuǎn)換器的位數(shù)。例如12位ADC能夠表示的動態(tài)范圍是2^12=4096,而14位ADC能夠表示2^14=16384,以此類推。
下圖列舉了一些典型場景的動態(tài)范圍。
3.6 靈敏度 (Sensitivity)
CMOS sensor 對入射光功率的響應(yīng)能力用靈敏度參數(shù)衡量,常用的定義是在1μm2單位像素面積上,標(biāo)準(zhǔn)曝光條件下(1Lux照度,F(xiàn)5.6光圈),在1s時間內(nèi)積累的光子數(shù)能激勵出多少mV的輸出電壓。在量子效率一定的情況下,sensor 的靈敏度主要取決于電荷/電壓轉(zhuǎn)換系數(shù)(Charge/Voltage Factor, CVF)。在下圖的例子中,CVF =220uV/e,這意味著阱容2000e的像素能夠激勵出最大440mV的電壓信號。- 在圖像噪聲水平接近的情況下,靈敏度高的sensor圖像亮度更高、細(xì)節(jié)更豐富
- 在圖像整體亮度接近的情況下,靈敏度高的sensor噪聲水平更低,圖像畫質(zhì)更細(xì)膩
EMVA 1288 定義了評價camera 靈敏度的標(biāo)準(zhǔn),即多少個光子可以引起camera像素值變化1,即一個DN。根據(jù)量子力學(xué)的公式,
下圖給出了普通靈敏度和高靈敏度sensor在噪聲、亮度方面的效果對比。
3.7 填充系數(shù) (Fill factor)一個像素不管實際面積多少,用于控制和讀出的三極管和電路連線所占的面積是必須首先保證的,余下的面積才能用于制造感光PN結(jié)。假設(shè)一個像素小到只能勉強容納幾個必須的三極管,則填充系數(shù)降為零,這個像素就失去了意義。反之,像素面積越大,三極管和電路所占面積的比例就越小,像素的填充系數(shù)就越高,像素的成像質(zhì)量也會越好。下圖是一個像素版圖的例子,這是一個采用PPD結(jié)構(gòu)設(shè)計的像素,盡管面積很大,但實際也只取得了60%的填充系數(shù)。
為了大幅度地提高填充系數(shù),人們不得不費心費力地在每個像素上方制造一個微透鏡,將較大范圍內(nèi)的入射光會聚到較小的感光面上,這樣可以將光能利用率提高到90%以上,也就是通過微透鏡提高了等效填充系數(shù),如下圖所示。
3.8 像素尺寸(pixel pitch)最小的像素通常是出現(xiàn)在手機sensor上,典型尺寸1.1um,這差不多已經(jīng)到了實用的極限了,安防和機器視覺sensor常用2.2um~4.2um大小的像素,而單反和廣播級的sensor則傾向于用更大尺寸的像素。關(guān)于像素尺寸有兩個非常經(jīng)典的問題,假設(shè)你有兩個桶,一大一小,那么
- 如果外邊雨下的特別大,哪個桶先盛滿水?OK,很顯然是小的桶先滿。
- 如果外邊的雨是一滴一滴地偶爾掉下來,哪個桶更容易接到水?OK,很顯然是大的那個。
一個sensor 的尺寸大小主要取決于感光陣列和處理電路所占的面積,而感光陣列的面積等于像素尺寸和像素數(shù)量的乘積。sensor 的像素數(shù)量有專用的術(shù)語叫做分辨率(resolution),可以用總數(shù)量描述,如2MP,3MP等(MP=MegaPixel,百萬像素),或者寫成寬乘以高的形式,如1920x1080,2048x1536 等。sensor 的大小也有專用的術(shù)語叫做光學(xué)格式(optical format),用sensor 封裝后的對角線長度衡量,注意并不是sensor 光敏陣列的對角線長度。光學(xué)格式在技術(shù)發(fā)展的過程中已經(jīng)完全標(biāo)準(zhǔn)化,形成了一系列固定的尺寸,方便與任何廠家生產(chǎn)的標(biāo)準(zhǔn)規(guī)格鏡頭進(jìn)行適配。在進(jìn)行像素密度計算時,設(shè)計人員需要準(zhǔn)確地知道所選sensor 光敏陣列的尺寸,這個數(shù)據(jù)可以根據(jù)sensor 分辨率和像素尺寸計算得到,也可以快速地查表得到。下表給出了一些常見光學(xué)格式的光敏陣列尺寸。
3.9 成品率(yield)單純從信噪比的角度考慮,像素的尺寸顯然是越大越好。但是為什么手機sensor都是越做越小呢?這主要有兩方面的原因,最終都能歸結(jié)到成本問題。一個很容易理解的原因是,在芯片總面積一定的情況下,單個像素面積越大,芯片的總像素數(shù)就會越少,即sensor的分辨率就越低,這與人類追求高像素、高清晰度的目標(biāo)是不符的。因此手機sensor的發(fā)展思路一直是依靠技術(shù)進(jìn)步不斷提高像素靈敏度同時縮減像素面積,在保證成像效果基本不損失的前提下,通過提高成品率來降低單個sensor的成本,擴大總收益。那么是否可以把芯片總面積擴大,既用大像素,也提供高像素數(shù)呢?在一定程度上是可以的,事實上單反、廣播、武器、科研級的sensor就是這樣做的,代價就是一片wafer(硅片)只能制造幾十個sensor,單個sensor 的成本是相當(dāng)感人的。
當(dāng)然了,如果是用在天文望遠(yuǎn)鏡這種不計成本的場合上,也有人會用一整片wafer制造一個超大的sensor,比如下面這貨,是佳能在一個12英寸(直徑300mm)wafer 上制造的單個CMOS sensor,面積 202×205mm2, 1600萬像素, 幀率100fps,采用0.25μm工藝。
但是對于手機sensor這種消費市場,拍攝夜景并不是頻繁和主要的需求,相反成本是最重要的考慮,所以sensor廠家會希望一片wafer能夠產(chǎn)出2000個以上sensor。
顯然sensor面積越大遇到瑕疵的概率也就越大,從數(shù)學(xué)上看,sensor遇到瑕疵(變成廢品)概率與像素尺寸(pixel pitch)是平方關(guān)系而不是線性關(guān)系。假設(shè)wafer上的瑕疵是均勻分布的,當(dāng)sensor面積大到一定程度的時候,就會出現(xiàn)無論如何也無法避開瑕疵的尷尬境地。
3.10 前照式工藝(FSI)傳統(tǒng)CMOS sensor 工藝又稱為FSI(Front Side Illumination)工藝,與傳統(tǒng)的半導(dǎo)體工藝一樣,它首先裝夾固定好一片wafer(硅片),從wafer的一側(cè)開始制造光敏PN結(jié)以及控制和讀出電荷所需的晶體管,然后制造連接晶體管所需的金屬線路(鋁或銅),接下來制造Bayer濾光膜和微透鏡。在整個制造過程中wafer只裝夾固定一次,直到制造完成,最后的wafer大概就是下圖所示的樣子。
封裝就是將晶片固定在塑料或金屬外殼內(nèi)部,形成最終產(chǎn)品的過程,與其它半導(dǎo)體芯片的封裝過程基本是一樣的。
根據(jù)sensor尺寸的不同,一個12英寸(直徑300mm)的wafer粗略可以切出100~2000個sensor,但是能否收回制造成本還取決于成品率(yield),正常情況下廠家會期望成品率大于90%,如果很不幸有一半sensor 是廢品則廠家大概率會血本無歸。強烈推薦一個芯片制造的視頻,和制造sensor過程是差不多的。為什么 CPU 這么貴?5987 贊同 · 571 評論回答
言歸正傳,在FSI工藝下,光線需要穿越多層電路結(jié)構(gòu)才能抵達(dá)硅感光區(qū),如下圖所示。
下圖是FSI像素在電子顯微鏡下的照片。
3.11 主光線角(CRA)主光線角(Chief Ray Angle, CRA)是衡量sensor 收集入射光能量的一個主要參考指標(biāo)。尤其是對于經(jīng)典的FSI工藝,由于多個金屬布線層的存在導(dǎo)致CRA 不太容易提高。如下圖所示,使用銅線可以在一定程度上改善CRA 但也會提高sensor 成本。
CRA 經(jīng)常是限制sensor 性能的一個重要因素,而下面將要介紹的BSI 工藝則可以顯著改善CRA,使之不再成為一個主要問題。
3.12 背照式工藝 (BSI)隨著半導(dǎo)體工藝的進(jìn)步,人們發(fā)現(xiàn)其實可以將wafer打磨得非常薄,讓光線穿透wafer,從背面入射到感光PN結(jié),這個想法無論在技術(shù)上還是成本上都已經(jīng)變得可行,于是就產(chǎn)生了背照式工藝(Back Side Illumination, BSI)。BSI工藝的主要特點(也是難點)是生產(chǎn)過程中需要兩次固定裝夾,一次在wafer背面制造濾光膜和微透鏡,一次在wafer正面制造感光PN結(jié)和電路結(jié)構(gòu)。兩次裝夾定位的重復(fù)精度要求極高,才能保證光線能夠通過背面的微透鏡精準(zhǔn)聚焦到PN結(jié)上。下圖是BSI工藝的典型流程,中間一個非常關(guān)鍵的步驟就是"flip wafer"。
下圖是FSI工藝和BSI工藝的原理對比。
下圖是Sony BSI工藝的簡介。
FSI 與 BSI 工藝效果對比 @ ISO6400左側(cè):Sony 20mp RX100 CMOS Sensor右側(cè):Sony 20mp RX100 II BSI CMOS Sensor
下圖是另一個FSI工藝與BSI工藝效果對比的例子。
3.13 其它進(jìn)展Sony 于2007年推出第一代Exmor系列CMOS 圖像傳感器。與傳統(tǒng)CIS技術(shù)相比,Exmor 的主要特點是為每列像素配置了專用ADC和額外的CDS。由于ADC單元與像素的物理距離更近,并且由于大規(guī)模并行化可以降低單個器件的工作頻率,所以極大地改善了sensor的噪聲特性。而新增的CDS又進(jìn)一步抑制數(shù)字噪聲。
隨著制造技術(shù)的進(jìn)一步演進(jìn),在背照式工藝的基礎(chǔ)上又發(fā)展出了堆棧式(Stacked)工藝。顧名思義,堆棧式工藝把兩片或者更多片硅片上下堆疊在一起,最上層硅片全部用于制造像素的感光區(qū),而sensor 控制所需的模擬、數(shù)字邏輯全部移到下層硅片,所以感光區(qū)占sensor靶面尺寸的比例可以接近100%,終于達(dá)到了sensor 效率的巔峰。
實際上,CMOS sensor 也可以設(shè)計稱支持global shutter曝光方式。與CCD 類似,global shutter 的實現(xiàn)原理是每個曝光像素都伴隨一個存儲電容,感光陣列上所有像素同時曝光,然后光電子立即被轉(zhuǎn)移到存儲電容上并鎖定,等待讀出電路讀出。下圖是一種較新的global shutter 像素設(shè)計,該設(shè)計支持兩種不同的增益系數(shù),因此支持HDR功能。
3.14 Sensor for AI另外,近些年的發(fā)展趨勢是在sensor 上集成內(nèi)存和AI 運算單元,使sensor 本身就能夠完成一些高級圖像處理算法,實現(xiàn)sensor 的智能化。
3.15 ToF sensorToF 即 Time-of-flight,ToF sensor 主動向視場前方打出一組激光,然后追蹤反射光被sensor捕獲的時間,通過時間差計算前方障礙物的距離,從而形成深度圖(depth image)。深度圖的每個像素值代表目標(biāo)距離camera的距離。為了形象地呈現(xiàn)深度信息,人們一般用紅色代表近的距離,藍(lán)色代表遠(yuǎn)的距離。
3.16 Sensor fusion車載是僅次于手機、安防的第三大sensor應(yīng)用市場。車載應(yīng)用的主要挑戰(zhàn)是包括強光、高動態(tài)、雨雪霧等環(huán)境因素會對 sensor 成像造成嚴(yán)重干擾,目前單靠CMOS sensor本身的性能提升還不能很好地解決這些問題,所以人們在探索將可見光sensor、毫米波雷達(dá)、激光雷達(dá)等成像技術(shù)結(jié)合在一起,形成更為可靠的車載解決方案,保證在各種氣象條件下都能穩(wěn)定地檢測出畫面中的目標(biāo)。索尼將此技術(shù)稱為sensor fusion。
3.17 Foveon sensor研究發(fā)現(xiàn),不同波長的光在硅材料中能夠穿透的深度是不同的,下表是關(guān)于穿深的統(tǒng)計。
Foveon 公司開發(fā)了一款可以在一個像素上捕捉全部色彩的圖像傳感器,型號為Foveon X3。與傳統(tǒng)的Bayer陣列原理不同,F(xiàn)oveon 利用了藍(lán)光穿透距離小,紅光穿透距離大的原理,采用三層感光元件堆疊布局,每層記錄一個顏色通道。
3.14 寬動態(tài)(WDR)寬動態(tài)即Wide Dynamic Range,與之等價的一個術(shù)語是高動態(tài)即High Dynamic Range (HDR)。單從語法的角度看,WDR比HDR在語法上更嚴(yán)謹(jǐn)一些,因為形容一個范圍可以說“寬窄”但很少說"高矮",除此之外其實并無技術(shù)層面的區(qū)別。從另一個角度看,當(dāng)用水平的圖表比較動態(tài)范圍時,用WDR術(shù)語是最恰當(dāng)?shù)?,如下圖。
- Staggered 長短曝光幀融合,非同時曝光,存在運動偽影問題,短幀存在flicker問題
- Interleaved 行交替曝光,將像素以兩行為單位分組,長、短交替曝光,存在分辨率損失
- Chopped 斬波曝光,主要解決flicker問題
- Lin-Log 函數(shù)響應(yīng),依賴特別的像素設(shè)計,LDR區(qū)間為線性響應(yīng),HDR區(qū)間變?yōu)閘og規(guī)律響應(yīng),缺點是FPN較大
- Dual-diode pixel,兩種不同敏感度的像素呈棋盤格排列,長、短幀同時曝光,存在分辨率損失和運動偽影
- LOFIC 像素,用大電容收集像素溢出的電荷,原理與Split-diode pixel 有些類似
- Complementary carrier pixel,在LOF基礎(chǔ)上使用電子-空穴兩種互補載流子,顯著提高阱容
- DCG 像素 (Dual Conversion Gain),每個像素可獨立控制增益,等效于實現(xiàn)兩種敏感度像素
- Split-diode pixel, 將每個像素的光敏區(qū)切成兩塊,分別負(fù)責(zé)短曝光和長曝光,沒有分辨率損失和運動偽影
3.14.2 Interleaved第二種模式又稱BME(Binned Multiplexed Exposure)。這種sensor每隔兩行的曝光時間分別設(shè)為短曝光和長曝光。然后融合長短曝光的兩幀圖像,成為行數(shù)減半的一幀WDR圖像??臻g分辨率損失了一半,就好像是做了1x2binning,所以叫做BME。SONY IMX135 和IMX258使用了這一技術(shù)。
3.14.3 Chopped第三種模式主要用于解決WDR的短曝光容易遇到flicker的問題,需要針對短曝光做特別的斬波支持,具體可參考本文1.10小節(jié)。
3.14.4 Lin-log第四種模式是使像素具備log響應(yīng)曲線,自動壓縮輸入信號的動態(tài)范圍。當(dāng)輸入信號小于一定閾值時,像素表現(xiàn)為線性響應(yīng)(linear),當(dāng)輸入大于該閾值后,輸出的阻尼正比于信號強度,輸出表現(xiàn)為log特性。
3.14.5 Dual-diode第五種模式又稱SME( Spatially Multiplexed Exposure)。這種sensor在空間上以棋盤格的形式排列高感度和低感度兩種像素,通過算法處理融合一幀WDR圖像。
寫到此處先悼念一下筆者的好友,Dr. Reberto Marchesini,一個特別溫和友善的意大利人,在2010年加入AV之前曾在某sensor公司設(shè)計WDR sensor,就是用的這種WDR模式。曾有導(dǎo)演用他設(shè)計的sensor拍攝了一部電影,就是下面這個。
Reberto 一生與摩托車有緣。他第一次去AV面試的路上在路口被私家車刮碰了一下,住了兩個月院。痊愈出院后第二次面試拿到了offer,他的小女朋友聽到喜訊立即辭去了waitress工作回家做起了全職主婦。一年后的12月,Reberto 榮升硬件設(shè)計主管,在職務(wù)生效的第一天早上,他騎摩托車又被私家車刮碰了一下,不幸的是這次是在高速公路上,私家車時速130公里,親愛的Reberto 同學(xué)當(dāng)場就撒手西去了,再未醒來。筆者每次回憶起與他共事的愉快經(jīng)歷都不勝唏噓,感慨世事無常。
3.14.6 LOFIC第六種模式全稱是Lateral OverFlow Integration Capacitor,原理是每個像素都配置一個較大的電容用于收集因飽和而溢出的電荷,如下圖所示。
2019年的報道是用2.8um像素實現(xiàn)了12萬電子的最大阱容。
另據(jù)報導(dǎo),此種技術(shù)可以實現(xiàn)高達(dá)200dB的動態(tài)范圍。
3.14.7 Complementary carrier第七種模式的原理是引入空穴載流子,由于CDTI工藝可以容易實現(xiàn)較大的電容,所以可以實現(xiàn)跨越式的阱容提升,2018年的報道是用3.2um的像素實現(xiàn)了75萬載流子的阱容。
3.14.8 DCG第八種模式由OmniVision提出,原理是每個像素可單獨控制增益(使用下圖中的CG信號),當(dāng)工作在HDR模式時,只進(jìn)行一次曝光,但分兩次讀出,一次使用HCG (high conversion gain)捕捉暗部信息,一次使用LCG(low conversion gain)捕捉亮部信息。
3.15 Retinex 算法人眼會針對局部的圖像特點進(jìn)行自適應(yīng),既能夠增加局部的對比度,同時保留大動態(tài)范圍。1963年E. Land 提出了Retinex 理論作為人類視覺的亮度和顏色感知模型,后人在此基礎(chǔ)上發(fā)展了Retinex 系列算法,在彩色圖像增強、圖像去霧、彩色圖像恢復(fù)方面具有很好的效果,也可以用于WDR融合。由于這種算法計算比較復(fù)雜,目前在sensor 端還暫未見產(chǎn)品應(yīng)用,但是在圖像后處理領(lǐng)域已經(jīng)得到了非常好的應(yīng)用。隨著技術(shù)的發(fā)展可以預(yù)見Retinex 算法有一天將應(yīng)用在camera ISP上甚至是直接集成到sensor上。
4 CMOS Sensor接口
一個CMOS sensor 至少會有兩個接口,一個控制接口用于與MCU通信接受配置參數(shù),一個數(shù)據(jù)接口用于輸出像素數(shù)據(jù)。下圖是一個實際sensor的框圖。下面時一款OVsensor的框圖,它的特點是自帶AWB和AEC算法,可以省去后端ISP的成本。
下面時一款19MP CMOS sensor的框圖,使用SPI控制接口和16-lane LVDS數(shù)據(jù)端口。
4.1 控制接口
目前主流的CMOS sensor多使用I2C串行總線接收主控MCU發(fā)來的的寄存器讀寫命令,I2C總線的最大時鐘頻率是400kHz。I2C總線是在SCLK為高電平的中間點對數(shù)據(jù)信號SDAT進(jìn)行采樣,因此數(shù)據(jù)信號需要在SCLK為低電平期間完成變化。I2C Read4.2 數(shù)據(jù)接口
早期的sensor常采用DVP等并口方式傳輸圖像數(shù)據(jù)。隨著sensor分辨率不斷增加,體積不斷縮小,并口的局限性越來越明顯,難以滿足帶寬、體積、功耗等指標(biāo)要求,所以目前主流的CMOS sensor已轉(zhuǎn)為使用基于高速串行總線的MIPI接口,尤其是500萬像素以上的sensor幾乎全部采用MIPI接口。- 接入1個lane,時鐘頻率425MHz,數(shù)據(jù)速率850Mbps;
- 接入2個lane,共享同一時鐘,時鐘頻率225MHz,數(shù)據(jù)速率900Mbps。
4.3 幀結(jié)構(gòu)
Sensor的實際像點數(shù)量通常比標(biāo)準(zhǔn)的圖像分辨率(如2048x1536,1920x1080等)要大一些,多出來的像點主要有兩種作用,- 黑像素,即dark pixel,像點上方覆蓋的是不透光的金屬,相當(dāng)于零輸入的情況,用于檢測像素的暗電流水平
- 濾波像素,即filter pixel,很多ISP算法會使用3x3或5x5大小的濾波窗口,因此需要在輸出分辨率的基礎(chǔ)上增加若干行、列使濾波窗口內(nèi)全是有效像素。
以上圖為例,sensor輸出的每一行由以下單元組成
- 每一幀開始時同步信號VSYNC有效并持續(xù)4行時間(4 tline),
- 每一行開始時同步信號HSYNC有效并持續(xù)64個tp (1tp=2PCLK),
- 在HREF為高電平時每一行有效時間為640tp,無效時間為144tp,每一行時間為tline=784tp;
- 每一幀總行數(shù)是510,其中有效行數(shù)是480
- 采集一幀數(shù)據(jù)的時間是784*510tp。
4.4 曝光控制時序一般而言,用戶向sensor 寄存器中寫入的控制參數(shù)并不時立即生效的,而且不同參數(shù)生效的具體時間也不盡相同。舉例來說,假設(shè)此時此刻sensor 正在采集第N幀之中,即第N幀的Frame Start 信號已經(jīng)過去而Frame End 信號尚未到來,如果此時向sensor 寄存器寫入新的積分時間,則對于某型號的Panasonic sensor,新的積分時間將在第N 2幀開始生效;如果此時向sensor 寫入新的增益,則新的增益將在第N 1幀即開始生效。這個問題會導(dǎo)致第N 1幀采用不正確的增益進(jìn)行曝光,畫面會出現(xiàn)瞬間閃爍,這是不可接受的。為了使積分時間和增益能夠同時生效,必須通過軟件把兩個參數(shù)分開配置,第N幀寫入積分時間,第N 1幀寫入增益,兩個參數(shù)在第N 2幀同時生效,如下圖所示。
4.5 多sensor同步有一類camera需要同時捕捉多路sensor的圖像,通過一定的算法將多路圖像拼接成一個整體,以獲得更大的視野。
4.6 Companding 模式
目前主流的CMOS sensor幾乎都是輸出Bayer mosaic格式的數(shù)據(jù),數(shù)據(jù)的位寬一般有8位、10位、12位、14位等級別。Bayer格式和數(shù)據(jù)位寬一般是sensor的固定參數(shù),sensor型號一旦確定后,后續(xù)的MIPI和ISP必須能夠支持或兼容該sensor的參數(shù),否則系統(tǒng)將無法正常工作。多數(shù)sensor支持線性輸出模式,即輸出的像素值與像素采集的光信號成正比。也有一些sensor支持companding輸出模式,對線性數(shù)據(jù)進(jìn)行壓縮編碼,使編碼數(shù)據(jù)可以用更少的帶寬傳輸,降低器件成本。下圖使一種典型的companding模式,將12位線性數(shù)據(jù)(0~4095)壓縮編碼成10位數(shù)據(jù)(0~1023)。這種輸出方式要求后續(xù)的ISP必須支持decompanding,將10位數(shù)據(jù)恢復(fù)成12位數(shù)據(jù)才能獲得正確的圖像。5. 圖像偽影 (Artifact)
5.1 摩爾紋 (Moiré)
摩爾紋源于法語,moiré 是一種紡織品,它的紋路類似于水波。在物理學(xué)中,摩爾紋指的是兩列或兩列以上的波在空間中重疊時發(fā)生疊加,從而形成新波形的現(xiàn)象。在圖像處理領(lǐng)域,當(dāng)sensor像素陣列的空間頻率低于信號本身的頻率時j就會發(fā)生頻譜混疊(aliasing),圖像上的表現(xiàn)就是出現(xiàn)摩爾紋,如下圖所示。5.2 迷宮格 (Maze)
當(dāng)圖像中存在平行線時,經(jīng)常會出現(xiàn)平行線的邊緣剛好覆蓋半個像素的情況,后續(xù)的ISP算法必須要決定這個像素到底是屬于A物體還是B物體。就像拋硬幣一樣,ISP會有一半的概率做出相反的決定。如果平行線的間距足夠小,則會有相當(dāng)?shù)母怕拾l(fā)生兩條平行線搭接到一起的情況。如下圖所示。5.3 紫邊 (Purple Fringing)
Chromatic Aberration
5.4 眩光與鬼影 (Flare)
由強光造成的照片發(fā)白、形成光暈的現(xiàn)象稱作眩光(Flare)。當(dāng)光源在畫面上移動時,光暈也會在畫面上漂浮游動,忽上忽下,忽左忽右,有如幽靈一般,所以稱之為鬼影。我們知道鏡頭是由多枚鏡片構(gòu)成的,而鏡片則是采用玻璃或塑料等材料制造,如果不進(jìn)行特殊處理,鏡片表面會反射大約5%左右的入射光線。當(dāng)強光進(jìn)入鏡頭時,各枚鏡片的表面反射的光線會在鏡頭和攝像機內(nèi)部多次反射,最終在sensor上映射出一連串的光暈,這就是眩光和鬼影產(chǎn)生的原因。5.5 面紗眩光 (Veiling glare)
實際的鏡頭內(nèi)總會存在一些雜散光。所謂雜散光就是那些不是按照設(shè)計路徑傳播的光線,它們在鏡片和鏡筒內(nèi)部多次反射和散射,最終會擴散到sensor上形成光暈。當(dāng)鏡頭面向大面積強光的時候,雜散光的強度迅速提高,其作用范圍也不再局限于圖像的局部,而是像洪水一樣擴散到整個sensor面積上,整體抬升了像素值,造成全局性的對比度下降,圖像看起來像是蒙上了一層紗,所以這種現(xiàn)象稱為面紗眩光,下圖是一些實際的例子。5.6 條紋偽影 (Streaking Artifact)
Streak 原意是裸奔的意思,這里特指一些像素值溢出到相鄰區(qū)域形成的偽影。CCD sensor 存在blooming/smearing現(xiàn)象會引發(fā)streak,但是這種機制在CMOS sensor 中并不存在。如果get="_blank">CMOS 圖像中出現(xiàn)streak偽影,則多半是由算法原因引起的(濾波器、編碼器等),比如下圖的例子。