真值表/卡諾圖
1.建立時間和保持時間
Setup time, Tsu 建立時間 在時鐘沿到來之前數(shù)據(jù)穩(wěn)定不變的時間,如果建立的時間不滿足,那么數(shù)據(jù)將不能在這個時鐘上升沿被穩(wěn)定的打入觸發(fā)器
Hold time, Th 保持時間 時鐘沿到來之后數(shù)據(jù)穩(wěn)定不變的時間,如果保持時間不滿足,那么數(shù)據(jù)同樣也不能被穩(wěn)定的打入觸發(fā)器
Clock-to-Output Delay,Tco 數(shù)據(jù)輸出延遲,輸出響應時間 當時鐘有效沿變化后,數(shù)據(jù)從輸入端到輸出端的最小時間間隔。
觸發(fā)器輸出的響應時間,也就是觸發(fā)器的輸出在clk時鐘上升沿到來之后多長的時間內發(fā)生變化,也即觸發(fā)器的輸出延時。
數(shù)據(jù)到達時間Tda:
數(shù)據(jù)建立時間Tsu:
建立時間裕量(Setup Slack):
保持時間裕量(hold slack):
上述時序關系也解釋了為什么時鐘頻率過快或者數(shù)據(jù)延時太大,都會導致錯誤的時序。(與STA靜態(tài)時序分析有關)
2.施密特觸發(fā)器
當輸入電壓高于正向閾值電壓,輸出為高;當輸入電壓低于負向閾值電壓,輸出為低;當輸入在正負向閾值電壓之間,輸出不改變。
這種雙閾值動作被稱為遲滯現(xiàn)象,表明施密特觸發(fā)器有記憶性。
施密特觸發(fā)器有兩個穩(wěn)定狀態(tài),可以把邊沿變化緩慢的周期性信號變換為邊沿很陡的矩形脈沖信號。例如將三角波、正弦波等變成矩形波。
3.格雷碼
任意兩個相鄰的碼字只有一位二進制數(shù)不同。
可以使裝置做數(shù)字步進時只改動最少的位元數(shù)以降低誤碼率。
4.鎖存器(latch)和觸發(fā)器(flip-flop)
都是時序邏輯(輸出不但與當前輸入有關還和上一次的輸出有關)
Latch是電平觸發(fā),輸出同所有輸入信號有關,輸入信號變化,latch就變化;
Flip-flop受時鐘控制,只有在時鐘觸發(fā)時才采樣當前輸入,產(chǎn)生輸出。
區(qū)別:latch沒有時鐘端,無法做到同步,輸出容易產(chǎn)生毛刺;如果用門電路來搭建,latch消耗的門資源比ff要少。
觸發(fā)器的電路圖由邏輯門組合而成,其結構均由R-S鎖存器派生而來。
在R-S鎖存器的前面加一個由兩個與門和一個非門構成的附加電路,則構成D觸發(fā)器。
為什么需要觸發(fā)器:觸發(fā)器能保存數(shù)據(jù),保存電路狀態(tài);觸發(fā)器是在時鐘邊沿觸發(fā),用時鐘同步是讓整個電路能同步整齊劃一的工作;乘法器的計算部分是組合邏輯,不需要觸發(fā)器,計算后的結果可以用觸發(fā)器保存起來。
5.阻塞賦值(=)和非阻塞賦值(<=)
在同一個always塊中,阻塞賦值先計算RHS表達式,不允許其他verilog語句干擾,然后賦值給LHS,才允許其他賦值語句執(zhí)行。(其后的賦值語句是在前一句賦值語句結束后再開始賦值的)
非阻塞賦值開始時計算RHS的表達式,同時就更新LHS,賦值結束時停止更新。(也可以理解為一直在計算RHS,最后時刻更新LHS)這個過程中,其他verilog語句都能同時操作。
注意:
1.非阻塞賦值只能對寄存器變量賦值(reg),只能在initial和always塊中。
2.時序電路/鎖存器 建?!亲枞x值
用always塊建立組合邏輯電路——阻塞賦值
在同一個always塊建立時序和組合邏輯電路——非阻塞賦值
3.在一個always塊中不要既用阻塞由用非阻塞;不要在一個以上always塊中對同一個變量賦值
6.同步電路與異步電路
這里指的是時序電路。
組合邏輯電路:任意時刻的輸出僅僅取決于該時刻的輸入,與電路原來的狀態(tài)無關。
時序邏輯電路:任意時刻的輸出不僅取決于當時的輸入,還取決于電路原來的狀態(tài)。(具有記憶功能)
根據(jù)各級觸發(fā)器時鐘端的連接方式可以將時序電路分為同步/異步。
同步時序電路所有操作都是在同一時鐘嚴格的控制下步調一致地完成的。
異步時序電路,不存在單一的主控時鐘,主要是用于產(chǎn)生地址譯碼器、FIFO和異步RAM的讀寫控制信號脈沖。
關于延時:
異步電路的延時:buffer或者兩級非門
同步電路的延時:大的延時:計數(shù)器;小的延時:D觸發(fā)器打節(jié)拍
7.跨時鐘域數(shù)據(jù)交換
進行同步處理。
單bit數(shù)據(jù):打兩拍(兩級并不能完全消除亞穩(wěn)態(tài)危害,但是大大減少其發(fā)生概率)
多bit數(shù)據(jù):異步FIFO(或雙口RAM)(以某個時鐘讀,在以某個時鐘寫,空/滿標志是關鍵)
多位數(shù)據(jù)也可以采用保持寄存器加握手信號的方法(多數(shù)據(jù),控制信號,地址信號)
8.關于亞穩(wěn)態(tài)
原因:在FPGA系統(tǒng)中,如果數(shù)據(jù)傳輸中不滿足觸發(fā)器的Tsu和Th,或者復位過程中復位信號的釋放相對于有效時鐘沿的恢復時間(recovery time)不滿足,就可能產(chǎn)生亞穩(wěn)態(tài),此時觸發(fā)器輸出端Q在有效時鐘沿之后比較長的一段時間處于不確定的狀態(tài),在這段時間里Q端在0和1之間處于振蕩狀態(tài),而不是等于數(shù)據(jù)輸入端D的值。這段時間稱為決斷時間(resolution time)。經(jīng)過resolution time之后Q端將穩(wěn)定到0或1上,但是穩(wěn)定到0或者1,是隨機的,與輸入沒有必然的關系。
只要系統(tǒng)中有異步元件,亞穩(wěn)態(tài)就無法避免
1.數(shù)據(jù)傳輸:數(shù)據(jù)在目的寄存器Tsu-Th時間窗口發(fā)生變化
2.異步復位:異步復位信號的撤銷時間在Trecovery(恢復時間)和Tremoval(移除時間)之內
3.同步復位:輸入端Din為高電平,而且復位信號的撤銷時間在clk的Tsu和Th內時候
常用FPGA器件的Tsu+Th約等于1ns,復位移除和恢復時間相加約等于1ns。
亞穩(wěn)態(tài)發(fā)生概率 = (建立時間 + 保持時間)/ 采集時鐘周期
——>
(1) 降低系統(tǒng)工作時鐘,增大系統(tǒng)周期,亞穩(wěn)態(tài)概率就會減小;
(2) 采用工藝更好的FPGA,也就是Tsu和Th時間較小的FPGA器件;
解決方法:
1.降低系統(tǒng)時鐘頻率
2.用反應更快的FF(Tsu和Th時間較小)
3.對異步信號進行同步處理:
多級D觸發(fā)器級聯(lián):大部分資料都說的是第一級寄存器產(chǎn)生亞穩(wěn)態(tài)后,第二級寄存器穩(wěn)定輸出概率為90%,第三極寄存器穩(wěn)定輸出的概率為99%(一般就搞個兩級);
采用FIFO對跨時鐘域數(shù)據(jù)通信進行緩沖;
4.對復位電路采用異步復位、同步釋放方式處理。
最終用sys_rst_n做系統(tǒng)的復位信號
5.改善時鐘質量,用邊沿變化快速的時鐘信號
9.靜態(tài)功耗與動態(tài)功耗
靜態(tài):晶體管狀態(tài)穩(wěn)定不變時的功耗(漏電流導致)
動態(tài):晶體管開關狀態(tài)變化(電路翻轉)產(chǎn)生的功耗(大頭 70%~90%)
10.同步復位和異步復位
也可能綜合出:
優(yōu)點:保證信號同步;綜合為更小的觸發(fā)器;復位時時鐘可以過濾毛刺
使用同步復位可能使綜合工具無法分辨分辨復位信號和其他控制信號,導致進行復位的控制邏輯遠離觸發(fā)器:
不好的:
優(yōu)點:復位路徑上沒有延時;綜合工具能自動推斷出異步復位而不必加入任何綜合指令
異步復位的同步釋放:
11.補碼
在計算機系統(tǒng)中,數(shù)值一律用補碼來表示和存儲。原因在于,使用補碼,可以將符號位和數(shù)值域統(tǒng)一處理;同時,加法和減法也可以統(tǒng)一處理。此外,補碼與原碼相互轉換,其運算過程是相同的,不需要額外的硬件電路。
12.低功耗設計(系統(tǒng)問題)
設計層次越高,功耗改善的程度越大:
工藝級
版圖和晶體管級
PTL級和邏輯級
系統(tǒng)級
RTL級:
時鐘是大頭:門控時鐘:無計算任務的部分時鐘停下
預計算技術:在一定的輸入條件下,使所有或部分輸入寄存器的負載無效,從而降低功耗
邏輯優(yōu)化:減少信號的翻轉
組合邏輯優(yōu)化:提取重復出現(xiàn)表達式、表達式替換、選擇性消除節(jié)點
路徑平衡:幾個輸入通過不同的路徑到達同一個門,要想辦法使各個路徑差不多長
系統(tǒng)級:
軟硬件劃分
指令級優(yōu)化
電源管理
cache低功耗設計
總線低功耗設計
總線信號編碼,減少翻轉 例如格雷碼
算法的優(yōu)化,包括流水線設計,并行設計
13.狀態(tài)機
以幾何圖形的方式描述時序邏輯的狀態(tài)轉移。
分類:
Moore:輸出(下一狀態(tài))只與當前狀態(tài)有關
Mealy:輸出不僅與當前狀態(tài)有關,還與當前輸入有關
狀態(tài)編碼:
二進制編碼、 格雷碼 (Gray) 、獨熱碼 (one-hot) 、自定義編碼。
在小設計中可以考慮使用 Gray 碼或 one-hot。大設計中,不擔心邏輯資源不夠的話,可以考慮使用one-hot 編碼以提高速度。至于順序二進制編碼,一般不予考慮。但是要達到最佳性能,需要使用更高級的編碼算法,針對給定的狀態(tài)機進行分析。
描述方法:
兩段式:兩個always模塊,其中一個always模塊采用同步時序的方式描述狀態(tài)轉移,而另一個模塊采用組合邏輯的方式判斷狀態(tài)轉移條件、描述狀態(tài)轉移規(guī)律
三段式:
三個 always 模塊,一個 always 模塊采用同步時序的方式描述狀態(tài)轉移,一個采用組合邏輯的方式判斷狀態(tài)轉移條件、描述狀態(tài)轉換規(guī)律,第三個 always模塊使用同步時序電路描述每個狀態(tài)的輸出
電梯:
當前狀態(tài)current status——事件event——轉移狀態(tài)next status
自動售貨機
14.FPGA內部的資源
IOB:可編程輸入輸出單元,芯片與外界電路接口,完成不同電氣特性下對輸入輸出信號的驅動與匹配要求
CLB:可編程邏輯快,多個Slice和附加邏輯構成(Xilinx),可以實現(xiàn)組合邏輯、時序邏輯、配置成分布式RAM(LUT配置成)
BRAM:塊RAM,靈活,可以配置成單端口RAM,雙端口RAM,F(xiàn)IFO,CAM(內容地址存儲器)等,可以根據(jù)需要改變位寬和長度
DCM:數(shù)字時鐘管理模塊,
專用硬核:CPU,乘法器,DSP等
【 存儲資源:Block RAM(一些固定大小的存儲塊,要用就用一整塊,不占用邏輯資源,速度快);分布式RAM(靈活)】
【 可以實現(xiàn)RAM/ROM/CAM 的資源:block ram,flip-flop,LUT 】
15.FPGA開發(fā)流程
個人習慣:分析系統(tǒng)劃分模塊——個子模塊HDL實現(xiàn)——各子模塊前仿真——組成系統(tǒng)功能仿真——邏輯綜合——布局布線——靜態(tài)時序分析——后仿真——上板測試
盡量在底層模塊做邏輯,在高層盡量做例化,頂層模塊只做例化
前仿真:純粹的功能仿真,驗證電路的功能是否符合設計要求,不考慮電路門延遲與線延遲。
后仿真:綜合后的功能仿真和布局布線后的時序仿真。是指電路已經(jīng)映射到特定的工藝環(huán)境下,綜合考慮電路的路徑延遲與門延遲的影響,驗證電路是否在一定時序條件下滿足設計構想的過程,是否存在時序違規(guī)。(必做)
16.FPGA——乘法器的設計
常見的有移位相加法,加法樹法,查表法,混合法……
1.移位相加
begin
dout=0;
for(i=0;i
dout=dout+((din_a_buf[i]==1)?(din_b_buf<
end
2.加法樹
上面的設計中,會產(chǎn)生大量組合邏輯,這就帶來了大量的延遲從而使乘法器的速率受到限制,為了提高速度,可以采用流水線的方法,將組合邏輯分割成一個一個小的組合邏輯,中間加上觸發(fā)器用來鎖存數(shù)據(jù),這樣就可以大大提高頻率,引入觸發(fā)器僅僅是帶來了延遲而已
begin//流水線實現(xiàn)
din_a_buf<=din_a;
din_b_buf<=din_b;
buf0<=din_b_buf[0]?din_a_buf:0;
buf1<=din_b_buf[1]?din_a_buf<<1:0;
buf2<=din_b_buf[2]?din_a_buf<<2:0;
buf3<=din_b_buf[3]?din_a_buf<<3:0;
buf4<=din_b_buf[4]?din_a_buf<<4:0;
buf5<=din_b_buf[5]?din_a_buf<<5:0;
buf6<=din_b_buf[6]?din_a_buf<<6:0;
buf7<=din_b_buf[7]?din_a_buf<<7:0;
buf01<=buf0+buf1;
buf23<=buf2+buf3;
buf45<=buf4+buf5;
buf67<=buf6+buf7;
buf02<=buf01+buf23;
buf46<=buf45+buf67;
dout<=buf02+buf46;
end
3.查找表
查表法,就是建一個表,里面存放了所有的乘法結果,乘數(shù)和被乘數(shù)用來作為地址去查找里面的乘積,此種方法可以大大提高乘法的速率,但是當乘法位數(shù)很大時會要求產(chǎn)生很大的表格,所以此種方法適合位數(shù)較小的乘法,特別適合有一個乘數(shù)為固定的乘法,如濾波器中的乘法就可以采用此種方法設計
【查找表本質上是一個RAM,例如4輸入的LUT可以看成有4位地址線的16x1的RAM,使用時輸入地址-查表-輸出】
17.FPGA——除法器的設計
對于2:長除法: 比較 相減 移位(狀態(tài)機實現(xiàn))
16位 / 8位https://blog.csdn.net/stanary/article/details/77426697
首先被減數(shù)16位在前邊拼接7位0,拼接后不會改變被除數(shù)的大小,而且方便向下操作。拼接后將此23位數(shù)稱為mid。之后取mid的高8位與除數(shù)作比較,若大于除數(shù),則減去除數(shù),結果低位拼接一。若小于除數(shù),則驗證最高位是不是0,若是則左移一位,結果拼接0.若不是則用高九位減去除數(shù),結果拼接兩個0.然后將差和后15位以及末尾一個0拼接,實現(xiàn)結果循環(huán)向前。在計算的同時用計數(shù)器計數(shù)來確定運行到的位數(shù)。在進行以上操作,最終得到結果。
8位 / 8位http://blog.chinaaet.com/justlxy/p/5100052068
將被除數(shù),擴展成16位的數(shù)據(jù),低8位為被除數(shù)的值,高八位的值全為0。有開始信號,對16位數(shù)據(jù)data賦值,然后開始運算。比較data的高八位和除數(shù)的值,如果大于0,說明被除數(shù)大,將此時商置1,賦值給data的最低位,然后將被除數(shù)高八位減去除數(shù)。然后將data向左移位一位,繼續(xù)比較。最終計算8次后。Data的高8位數(shù)據(jù)就為所求的余數(shù),低八位就為所求的商。
或者把除法轉換成了查表、乘法和移位:
18.奇數(shù)分頻
19.靜態(tài)時序分析
STA,Static Timing Analysis
靜態(tài)時序分析(STA)告訴我們電路的實際表現(xiàn)如何,而提供約束(SDC文件,對時序的一些要求)來告訴分析工具我們希望電路的表現(xiàn)應該是怎樣。
20.競爭與冒險
某一輸入變量經(jīng)過不同的傳播路徑,到達電路某個匯合點的時間有先有后,這種現(xiàn)象叫競爭;
由于競爭使輸出發(fā)生瞬時錯誤的現(xiàn)象叫冒險。
判斷方法:代數(shù)法(布爾表達式中有相反的信號);卡諾圖(有兩個相切的卡諾圈,并且相切處沒有被其他的卡諾圈包圍);實驗法:示波器觀察
解決方法:加濾波電路,消除毛刺;加選通信號,避開毛刺;增加冗余項,消除邏輯冒險