當(dāng)前位置:首頁(yè) > 智能硬件 > 智能硬件
[導(dǎo)讀]基于傳統(tǒng)六晶體管(6T)存儲(chǔ)單元的靜態(tài)RAM存儲(chǔ)器塊一直是許多嵌入式設(shè)計(jì)中使用ASIC/SoC實(shí)現(xiàn)的開(kāi)發(fā)人員所采用的利器,因?yàn)檫@種存儲(chǔ)器結(jié)構(gòu)非常適合主流的CMOS工藝流程,不需要增添任何額外的工藝步驟。

基于傳統(tǒng)六晶體管(6T)存儲(chǔ)單元的靜態(tài)RAM存儲(chǔ)器塊一直是許多嵌入式設(shè)計(jì)中使用ASIC/SoC實(shí)現(xiàn)的開(kāi)發(fā)人員所采用的利器,因?yàn)檫@種存儲(chǔ)器結(jié)構(gòu)非常適合主流的CMOS工藝流程,不需要增添任何額外的工藝步驟。

如圖1a中所示的那樣,基本交織耦合鎖存器和有源負(fù)載單元組成了6T存儲(chǔ)單元,這種單元可以用于容量從數(shù)位到幾兆位的存儲(chǔ)器陣列。

經(jīng)過(guò)精心設(shè)計(jì)的這種存儲(chǔ)器陣列可以滿足許多不同的性能要求,具體要求取決于設(shè)計(jì)師是否選用針對(duì)高性能或低功率優(yōu)化過(guò)的CMOS工藝。高性能工藝生產(chǎn)的SRAM塊的存取時(shí)間在130nm工藝時(shí)可以輕松低于5ns,而低功率工藝生產(chǎn)的存儲(chǔ)器塊的存取時(shí)間一般要大于10ns。

存儲(chǔ)單元的靜態(tài)特性使所需的輔助電路很少,只需要地址譯碼和使能信號(hào)就可以設(shè)計(jì)出解碼器、檢測(cè)電路和時(shí)序電路。

隨著一代代更先進(jìn)工藝節(jié)點(diǎn)的發(fā)展,器件的特征尺寸越來(lái)越小,使用傳統(tǒng)六晶體管存儲(chǔ)單元制造的靜態(tài)RAM可以提供越來(lái)越短的存取時(shí)間和越來(lái)越小的單元尺寸,但漏電流和對(duì)軟故障的敏感性卻呈上升趨勢(shì),設(shè)計(jì)師必須增加額外電路來(lái)減小漏電流,并提供故障檢測(cè)和糾正機(jī)制來(lái)“擦除”存儲(chǔ)器的軟故障。

當(dāng)前6T SoC RAM單元的局限性

然而,用來(lái)組成鎖存器和高性能負(fù)載的六晶體管導(dǎo)致6T單元尺寸很大,從而極大地限制了可在存儲(chǔ)器陣列中實(shí)現(xiàn)的存儲(chǔ)容量。

這種限制的主因是存儲(chǔ)器塊消耗的面積以及由于用于實(shí)現(xiàn)芯片設(shè)計(jì)的技術(shù)工藝節(jié)點(diǎn)(130,90,65nm)導(dǎo)致的單元漏電。隨著存儲(chǔ)器陣列的總面積占整個(gè)芯片面積的比率增加,芯片尺寸和成本也越來(lái)越大。

漏電流也可能超過(guò)整個(gè)功率預(yù)算或限制6T單元在便攜式設(shè)備中的應(yīng)用。更大面積或高漏電芯片最終可能無(wú)法滿足應(yīng)用的目標(biāo)價(jià)格要求,因此無(wú)法成為一個(gè)經(jīng)濟(jì)的解決方案。

作為6T RAM單元替代技術(shù)的1T單元

對(duì)那些要求大容量片上存儲(chǔ)(通常大于256kb)但不要求絕對(duì)最快存取時(shí)間的應(yīng)用來(lái)說(shuō)還有另外一種解決方案技術(shù)。這種解決方案所用的存儲(chǔ)器陣列功能類似SRAM,但基于的是類似動(dòng)態(tài)RAM中使用的單晶體管/單電容(1T)存儲(chǔ)器單元(圖1b)。

圖1a:典型的六晶體管靜態(tài)RAM存儲(chǔ)單元。圖1b:典型的單晶體管/單電容動(dòng)態(tài)存儲(chǔ)器存儲(chǔ)單元。
圖1a:典型的六晶體管靜態(tài)RAM存儲(chǔ)單元。圖1b:典型的單晶體管/單電容動(dòng)態(tài)存儲(chǔ)器存儲(chǔ)單元。

這種存儲(chǔ)器陣列在相同芯片面積上的密度可以達(dá)到6T存儲(chǔ)器陣列的2到3倍。當(dāng)嵌入式存儲(chǔ)器要求超過(guò)幾兆位時(shí)可以使用簡(jiǎn)單的動(dòng)態(tài)RAM陣列,但這種陣列要求系統(tǒng)控制器和邏輯理解存儲(chǔ)器的動(dòng)態(tài)特性,并正確地提供刷新控制和時(shí)序信號(hào)。

嵌入簡(jiǎn)單DRAM存儲(chǔ)器塊的另外一種方法是將DRAM陣列和它自身的控制器捆綁在一起,使它看起來(lái)像是易于使用的SRAM陣列。通過(guò)整合高密度1T存儲(chǔ)單元和提供刷新信號(hào)的一些支持邏輯,存儲(chǔ)單元的動(dòng)態(tài)特性對(duì)ASIC/SoC設(shè)計(jì)師來(lái)說(shuō)是看不見(jiàn)的,設(shè)計(jì)師在實(shí)現(xiàn)ASIC和SoC解決方案時(shí)可以將它們當(dāng)作靜態(tài)RAM使用(圖2)。

圖2:DRAM存儲(chǔ)器陣列周圍增加的控制和接口支持邏輯使得該陣列用起來(lái)像靜態(tài)RAM,因此可以提高存儲(chǔ)器密度。
圖2:DRAM存儲(chǔ)器陣列周圍增加的控制和接口支持邏輯使得該陣列用起來(lái)像靜態(tài)RAM,因此可以提高存儲(chǔ)器密度。

一些公司和代工廠已經(jīng)開(kāi)發(fā)的1T單元除了標(biāo)準(zhǔn)CMOS層外還需要額外的掩模層。因此這種方法增加了晶圓成本,并且與具體的代工廠密切相關(guān),只能將制造過(guò)程限制于特定的代工廠。為了彌合額外的晶圓處理成本,芯片中使用的總的DRAM陣列尺寸一般必須超過(guò)裸片面積的一半以上。另外,大部分DRAM宏是尺寸、長(zhǎng)寬比和接口都受限的硬宏。

SoC設(shè)計(jì)則需要更具性價(jià)比的IP宏,根據(jù)成本或容量的需要,這些IP宏可以方便地在任何代工廠中制造,或者從一個(gè)代工廠轉(zhuǎn)移到另一個(gè)代工廠。在版圖和配置階段,這種宏還能向ASIC設(shè)計(jì)師提供更多的靈活性。

多家代工廠擁有這種所謂的“單晶體管SRAM”技術(shù),并作為可授權(quán)的知識(shí)產(chǎn)權(quán)。這樣一種以編譯器為主導(dǎo)的方法已見(jiàn)用于bulk CMOS工藝中,由于沒(méi)有額外的掩模步驟,因此可以降低15-20%的晶圓成本,并可縮短產(chǎn)品上市時(shí)間。

對(duì)于系統(tǒng)的其它部分來(lái)說(shuō),上述方法形成的存儲(chǔ)塊接口看起來(lái)就像是一個(gè)靜態(tài)RAM,但與采用6T單元的存儲(chǔ)器陣列相比,它的密度(單位面積的位數(shù))可以達(dá)到后者的2到3倍(在將作為面積計(jì)算一部分的支持電路開(kāi)銷進(jìn)行平均后)。存儲(chǔ)器陣列越大,支持電路需要的總面積就越小,存儲(chǔ)塊就有更高的面積效率。

為了創(chuàng)建理想的存儲(chǔ)器陣列,可以使用像MemQuest這樣的存儲(chǔ)器編譯器工具。這些工具允許設(shè)計(jì)師實(shí)現(xiàn)更冷、更快或更高密度的coolSRAM-1T配置,這些配置可以在不同的代工廠和技術(shù)節(jié)點(diǎn)間移植(見(jiàn)圖3),從而可以避免人工陣列實(shí)現(xiàn)所需的非重復(fù)性工程費(fèi)用。

圖3:便攜式coolSRAM-1T設(shè)計(jì)用于特別低功率的設(shè)備,它通過(guò)自適應(yīng)電路尺寸調(diào)整、虛擬接地、自適應(yīng)后向偏置和其它電路技術(shù)來(lái)降低漏電流。
圖3:便攜式coolSRAM-1T設(shè)計(jì)用于特別低功率的設(shè)備,它通過(guò)自適應(yīng)電路尺寸調(diào)整、虛擬接地、自適應(yīng)后向偏置和其它電路技術(shù)來(lái)降低漏電流。

編譯器還可以幫助用戶使用最優(yōu)的內(nèi)核尺寸、接口和長(zhǎng)寬比并實(shí)現(xiàn)最短的上市時(shí)間,并向設(shè)計(jì)師提供它編譯的存儲(chǔ)器陣列的電氣、物理、仿真(Verilog和VHDL)、測(cè)試和綜合結(jié)果。

在一個(gè)1Mb的存儲(chǔ)器陣列實(shí)例中,例如coolSRAM-1T配置,存在著室溫下為數(shù)微安的漏電流,對(duì)于供電電壓和時(shí)鐘速率來(lái)說(shuō)這是一個(gè)典型的邊界條件(圖3)。

在采用100kHz或100kHz以下的典型刷新速率以及128k字×8位的組織結(jié)構(gòu)時(shí),1Mb coolSRAM-1T陣列有一個(gè)空閑功率能使數(shù)據(jù)保持時(shí)間與同樣容量的SRAM相當(dāng)。(coolSRAM-6T的1Mb實(shí)例在采用臺(tái)積電公司的130nm G工藝制造時(shí)將占用約2.6平方毫米的面積,每兆赫茲消耗功率小于100微瓦)

雖然SRAM-1T功能如同SRAM,但內(nèi)部卻具有DRAM的特征-當(dāng)采用130nm工藝實(shí)現(xiàn)時(shí),室溫下的存儲(chǔ)單元可以保持?jǐn)?shù)據(jù)數(shù)十毫秒的時(shí)間。支持的刷新控制邏輯透明地提供刷新功能,并能根據(jù)溫度調(diào)節(jié)刷新周期。

如果設(shè)計(jì)師想用SoC管理刷新,也可以選擇旁路掉存儲(chǔ)器陣列中的刷新控制器,使用來(lái)自SoC邏輯的刷新信號(hào)。這樣可以有效地節(jié)省SoC中的一些動(dòng)態(tài)功耗,因?yàn)橄到y(tǒng)邏輯可以“按需”而不是“自動(dòng)”實(shí)現(xiàn)SRAM-1T的嵌入式刷新邏輯。

SRAM-1T實(shí)例中的存儲(chǔ)單元也支持睡眠和待機(jī)模式。在睡眠模式時(shí),可以通過(guò)抑制大部分存儲(chǔ)器陣列的時(shí)鐘來(lái)極大地降低功耗。

當(dāng)陣列“被喚醒時(shí)”,數(shù)據(jù)必須被重新裝載進(jìn)存儲(chǔ)單元。在待機(jī)模式時(shí),存儲(chǔ)器通過(guò)使用低頻刷新操作使數(shù)據(jù)得以保持,此時(shí)功耗是很小的。當(dāng)返回到工作模式時(shí),存儲(chǔ)器可以立即投入使用,數(shù)據(jù)不需要重新被裝載進(jìn)存儲(chǔ)器陣列。

設(shè)計(jì)師還能通過(guò)配置讓存儲(chǔ)器陣列以不同的行尺寸-256、512、1024或2048位進(jìn)行刷新,甚至實(shí)現(xiàn)多行同時(shí)刷新。還允許設(shè)計(jì)師有選擇的只刷新陣列的一小部分以保持關(guān)鍵數(shù)據(jù)不丟失,同時(shí)切斷陣列其余部分的供電。

對(duì)任何存儲(chǔ)器陣列來(lái)說(shuō),制造工藝的變化總是有可能導(dǎo)致存儲(chǔ)器陣列中出現(xiàn)一二個(gè)壞的位。這樣的芯片不一定要廢棄,設(shè)計(jì)師只需增加列和行冗余機(jī)制就能提高良品率。

如果芯片交付后發(fā)生位故障,可以采用內(nèi)置自修復(fù)功能以及一次性可編程coolOTP存儲(chǔ)器修復(fù)存儲(chǔ)器陣列。另外,內(nèi)置自檢功能也可以增加進(jìn)存儲(chǔ)器IP塊中,它不會(huì)影響芯片的性能。

當(dāng)存儲(chǔ)器陣列的基本性能不能滿足系統(tǒng)需要時(shí),設(shè)計(jì)師可以使用一些結(jié)構(gòu)化技術(shù)從存儲(chǔ)器陣列中獲得更高的性能。然而,使用這些技術(shù)需要付出一定的代價(jià),它們會(huì)影響芯片的功耗、尺寸和復(fù)雜性,因此必須認(rèn)真地進(jìn)行權(quán)衡分析,確定最佳的存儲(chǔ)器陣列和芯片架構(gòu)組合,這樣才能實(shí)現(xiàn)理想的性能和成本目標(biāo)。

對(duì)芯片架構(gòu)設(shè)計(jì)師來(lái)說(shuō)使用寬字架構(gòu)是一種不錯(cuò)的選擇,它能將存儲(chǔ)器組織成在內(nèi)部提供128、256或1024位寬數(shù)據(jù)字,然后向下復(fù)用成想要的字寬度(見(jiàn)圖4)。

圖4:在典型的SoC設(shè)計(jì)中,寬的內(nèi)部存儲(chǔ)器總線可以用來(lái)快速傳送圖形和DSP處理中的實(shí)時(shí)性數(shù)據(jù)。
圖4:在典型的SoC設(shè)計(jì)中,寬的內(nèi)部存儲(chǔ)器總線可以用來(lái)快速傳送圖形和DSP處理中的實(shí)時(shí)性數(shù)據(jù)。

這種技術(shù)可以將視在時(shí)鐘速率(apparent clock rate)提高2倍或4倍,從而減少實(shí)際存取時(shí)間,最終降低功耗。在這種情況下,由于需要解復(fù)用邏輯將寬字減小到適合SoC其余部分使用的合適寬度字,會(huì)對(duì)IP設(shè)計(jì)產(chǎn)生面積上的消極影響。

另外一種方法是將存儲(chǔ)器劃分成多個(gè)實(shí)例(區(qū)),并設(shè)置存儲(chǔ)器控制器,讓它以連續(xù)周期交替訪問(wèn)這些實(shí)例(instance),這樣通過(guò)區(qū)與區(qū)之間的切換就可以隱藏掉某段存取時(shí)間(見(jiàn)圖5a)。

圖5a:通過(guò)增加一些額外的控制和時(shí)序電路可以實(shí)現(xiàn)多個(gè)存儲(chǔ)實(shí)例(區(qū))的交叉存取,從而將到主處理器的數(shù)據(jù)速率提高2倍、3倍甚至4倍(取決于區(qū)的數(shù)量)。
圖5a:通過(guò)增加一些額外的控制和時(shí)序電路可以實(shí)現(xiàn)多個(gè)存儲(chǔ)實(shí)例(區(qū))的交叉存取,從而將到主處理器的數(shù)據(jù)速率提高2倍、3倍甚至4倍(取決于區(qū)的數(shù)量)。

在非交織存取系統(tǒng)中,存儲(chǔ)器子系統(tǒng)必須工作在系統(tǒng)時(shí)鐘速度,此時(shí)如果存儲(chǔ)器訪問(wèn)不能同步于時(shí)鐘,那么整個(gè)系統(tǒng)的運(yùn)行速度就會(huì)慢下來(lái)(見(jiàn)圖5b)。

圖5b:在非交叉存取系統(tǒng)中,存儲(chǔ)器區(qū)的訪問(wèn)時(shí)間會(huì)在訪問(wèn)存儲(chǔ)器陣列時(shí)限制系統(tǒng)時(shí)鐘速度。
圖5b:在非交叉存取系統(tǒng)中,存儲(chǔ)器區(qū)的訪問(wèn)時(shí)間會(huì)在訪問(wèn)存儲(chǔ)器陣列時(shí)限制系統(tǒng)時(shí)鐘速度。

但在交織存取的存儲(chǔ)器系統(tǒng)中,時(shí)鐘頻率可以2倍、3倍、4倍的提升,具體取決于區(qū)的數(shù)量。但當(dāng)交織存取超過(guò)兩個(gè)區(qū)時(shí),系統(tǒng)復(fù)雜性會(huì)有相當(dāng)大的增加。

對(duì)于雙區(qū)系統(tǒng),時(shí)鐘頻率可以是每個(gè)存儲(chǔ)區(qū)可處理的最大速度的2倍,但由于每個(gè)實(shí)例是以時(shí)鐘頻率的一半循環(huán)的,單個(gè)區(qū)不能感受到時(shí)鐘速度的變化(見(jiàn)圖5c)。

圖5c:在交叉存取的多區(qū)系統(tǒng)中,時(shí)鐘速度可以達(dá)到非交叉存取時(shí)鐘速度的數(shù)倍(時(shí)鐘x區(qū)數(shù)量)。
圖5c:在交叉存取的多區(qū)系統(tǒng)中,時(shí)鐘速度可以達(dá)到非交叉存取時(shí)鐘速度的數(shù)倍(時(shí)鐘x區(qū)數(shù)量)。

而且,圍繞存儲(chǔ)區(qū)的一些全局邏輯以雙倍于存儲(chǔ)器速度運(yùn)行,并在交替時(shí)鐘周期中向兩個(gè)區(qū)中的每個(gè)區(qū)傳遞地址信息。這種全局邏輯可以在多個(gè)區(qū)中共享,從而可以節(jié)省面積和功率。

數(shù)據(jù)輸入/輸出端口的附加邏輯對(duì)數(shù)據(jù)進(jìn)行復(fù)用或解復(fù)用,并向主機(jī)系統(tǒng)以雙倍數(shù)據(jù)速率提供數(shù)據(jù),或以輸入速率的一半向存儲(chǔ)區(qū)提供數(shù)據(jù)。因此存儲(chǔ)器子系統(tǒng)的有效吞吐量提高了一倍,而有效功率比兩倍存儲(chǔ)容量的單個(gè)塊要低。

雖然這種方法可以將存取時(shí)間縮短近50%,但也帶來(lái)了額外的支持電路和設(shè)計(jì)/時(shí)序復(fù)雜性。此時(shí)對(duì)存儲(chǔ)器的數(shù)據(jù)訪問(wèn)一般都要被延遲一個(gè)周期(單周期延遲訪問(wèn)),并且訪問(wèn)是準(zhǔn)隨機(jī)性的,系統(tǒng)無(wú)法在每個(gè)周期訪問(wèn)相同的內(nèi)部區(qū)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉