兼容51指令的8位MCU IPCORE設(shè)計(jì)

時(shí)間：2012-10-24 14:06:43

關(guān)鍵字： MCU 指令 IPCORE BSP

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]1 前言當(dāng)前,在微電子及其應(yīng)用領(lǐng)域正在發(fā)生一場前所未有的變革,這場變革是由片上系統(tǒng)(SOC)技術(shù)研究應(yīng)用和發(fā)展引起的.從技術(shù)層面看SOC技術(shù)是超大規(guī)模集成電路發(fā)展的必然趨勢(shì)和主流,它以超深亞微米VDSM(Very Deep Submi

1 前言

當(dāng)前,在微電子及其應(yīng)用領(lǐng)域正在發(fā)生一場前所未有的變革,這場變革是由片上系統(tǒng)(SOC)技術(shù)研究應(yīng)用和發(fā)展引起的.從技術(shù)層面看SOC技術(shù)是超大規(guī)模集成電路發(fā)展的必然趨勢(shì)和主流,它以超深亞微米VDSM(Very Deep Submicon)工藝和知識(shí)產(chǎn)權(quán)IP核復(fù)用技術(shù)為支撐。在眾多的IP核中，MCU CORE以其在SOC中嵌入后能充分發(fā)揮其處理靈活、軟件可升級(jí)、硬件開銷少的特點(diǎn)，在很大程度上成為SOC芯片必需模塊。INTEL公司的MCS-51系列MCU 可以說是目前國內(nèi)應(yīng)用時(shí)間最長、最普及、可獲得應(yīng)用資料最多的功能強(qiáng)大的8位MCU , 所以建立兼容51指令MCU可綜合IP核對(duì)于各種嵌入式系統(tǒng)和片上系統(tǒng)(SOC)的應(yīng)用具有重要意義。

圖1 IPCORE 內(nèi)部結(jié)構(gòu)

2 總體構(gòu)架設(shè)計(jì)

本設(shè)計(jì)采用自頂向下的設(shè)計(jì)方法成功設(shè)計(jì)了與MCS-51 系列微處理器指令集完全兼容的8位嵌入式MCU核, 此核的內(nèi)部結(jié)構(gòu)如圖1所示(整個(gè)設(shè)計(jì)過程也是圍繞其產(chǎn)開)。

3 核內(nèi)單元(主要單元設(shè)計(jì)的概述)

3.1 ALU 單元的設(shè)計(jì)：

ALU單元由一些基本操作功能模塊(加/減法模塊、乘法模塊、除法模塊、十進(jìn)制調(diào)整模塊和邏輯模塊)構(gòu)成，整個(gè)操作是通過多路選擇器來完成的。在ALU單元的結(jié)構(gòu)上，將乘、除法單元各自獨(dú)立出來完成算術(shù)運(yùn)算指令中的乘、除法運(yùn)算。這樣可以回避傳統(tǒng)典型微處理器基于累加器ACC的ALU結(jié)構(gòu)，并且由于ALU單元被設(shè)計(jì)成純組合邏輯，因而速度較快,從而提高算術(shù)運(yùn)算指令的執(zhí)行效率。

3.2 時(shí)序設(shè)計(jì)

主要從簡化控制器設(shè)計(jì)、提高核的性能出發(fā)，本設(shè)計(jì)沒有采用Intel MCS-51雙相時(shí)鐘的復(fù)雜時(shí)序設(shè)計(jì)，而是采用單相時(shí)鐘(單相時(shí)鐘因?yàn)樵跁r(shí)序和傳輸上比較簡單可靠，被一些高性能芯片使用)、全同步設(shè)計(jì)，所有時(shí)序電路均采用邊沿觸發(fā)的觸發(fā)器。采用單相時(shí)鐘全同步設(shè)計(jì)會(huì)使芯片面積有所增加，但降低了設(shè)計(jì)的復(fù)雜度，減少了生產(chǎn)工藝不確定性對(duì)系統(tǒng)性能的影響，提高了設(shè)計(jì)的成功率。

3.3 控制單元的設(shè)計(jì)

控制器本質(zhì)上是一個(gè)結(jié)構(gòu)及狀態(tài)轉(zhuǎn)移非常復(fù)雜的有限狀態(tài)機(jī)(FSM)。從程序執(zhí)行的宏觀角度看，每一條指令對(duì)應(yīng)著這個(gè)復(fù)雜的有限狀態(tài)機(jī)的一個(gè)狀態(tài)，一條一條指令的依次執(zhí)行，就是一系列狀態(tài)轉(zhuǎn)移?？刂破鞯膶?shí)現(xiàn)主要有兩種:硬布線實(shí)現(xiàn)方式和微程序?qū)崿F(xiàn)方式?？紤]到本次設(shè)計(jì)的是一個(gè)用于SOC的IP核所以采用PLA技術(shù)，就是用存儲(chǔ)技術(shù)實(shí)現(xiàn)硬布線邏輯，可以認(rèn)為它是硬布線邏輯控制器和微程序控制器兩者的折衷方案。由于PLA微控制器集中了硬布線邏輯控制器與微程序控制器兩者的優(yōu)點(diǎn)，與硬布線邏輯控制器相比，它的設(shè)計(jì)工作量小，修改、維護(hù)都比較方便。與微程序控制器相比，它的速度較快。這些優(yōu)點(diǎn)都適合其作為內(nèi)核整合在SOC中。為了提高FSM的效率,我們把控制單元中組合邏輯和時(shí)序邏輯分開設(shè)計(jì),組合邏輯主要輸出控制信號(hào)并且產(chǎn)生次態(tài)邏輯,時(shí)序邏輯主要實(shí)現(xiàn)存儲(chǔ)單元的讀寫。

3.3.1 指令狀態(tài)的設(shè)計(jì)

圖2 指令狀態(tài)機(jī)狀態(tài)圖

如圖2 所示狀態(tài)機(jī)共有五種狀態(tài),每個(gè)狀態(tài)轉(zhuǎn)換時(shí)間都對(duì)應(yīng)一個(gè)時(shí)鐘周期,所有指令共有狀態(tài)為取指狀態(tài)(取指令操作碼)和開始狀態(tài)(復(fù)位后的狀態(tài)),中間的執(zhí)行狀態(tài)根據(jù)不同指令來分別采取1 到3 個(gè)執(zhí)行步驟,比如ADD A RN 需要一個(gè)執(zhí)行步驟,ADD A #DATA 需要兩個(gè)執(zhí)行步驟等。這樣所有的指令就可以在一到四個(gè)時(shí)鐘周期內(nèi)完成整個(gè)指令的執(zhí)行過程。

3.3.2 指令狀態(tài)機(jī)的實(shí)現(xiàn)

51指令按功能分為五類:數(shù)據(jù)傳送類;算術(shù)操作類;邏輯操作類;控制程序轉(zhuǎn)移類;布爾變量操作類。出于減少內(nèi)部連線和控制方便的考慮，我們將不同類的指令放在了不同的模塊中解碼執(zhí)行。

算術(shù)操作類指令和邏輯操作類指令由指令譯碼控制模塊實(shí)現(xiàn)譯碼,產(chǎn)生操作數(shù)和ALU控制命令,然后傳送給算術(shù)邏輯運(yùn)算單元ALU 完成運(yùn)算,ALU 模塊將運(yùn)算結(jié)果送回指令譯碼控制模塊,再由指令譯碼控制模塊將結(jié)果寫回目的單元。

數(shù)據(jù)傳送類指令中的MOVX指令的實(shí)現(xiàn)需要所有外部控制時(shí)序信號(hào)的配合。在輸出控制邏輯中直接產(chǎn)生MOVX所需的控制信號(hào)。數(shù)據(jù)的輸入輸出則在指令譯碼控制模塊中實(shí)現(xiàn)。數(shù)據(jù)傳送類中其他指令和布爾變量操作類指令中的非轉(zhuǎn)移指令都直接在指令譯碼控制模塊中實(shí)現(xiàn),通過內(nèi)部總線實(shí)現(xiàn)內(nèi)部存儲(chǔ)器、寄存器，外部存儲(chǔ)器之間的數(shù)據(jù)傳送。

控制程序轉(zhuǎn)移類指令由于與程序計(jì)數(shù)器直接相關(guān),因而這一類指令中的長調(diào)用指令、絕對(duì)調(diào)用指令、長轉(zhuǎn)移指令、絕對(duì)轉(zhuǎn)移指令、相對(duì)轉(zhuǎn)移指令、子程序返回指令的PC計(jì)算放在了狀態(tài)機(jī)時(shí)序部分PC計(jì)算模塊,完成取指操作;而條件轉(zhuǎn)移指令和布爾變量操作類中的測(cè)試轉(zhuǎn)移指令則由指令譯碼控制模塊完成測(cè)試比較操作,將比較結(jié)果送回PC計(jì)算模塊使其根據(jù)比較結(jié)果來完成轉(zhuǎn)移操作;由于數(shù)據(jù)傳送類指令中的MOVC指令直接操作程序計(jì)數(shù)器,因而它的實(shí)現(xiàn)也放在了這個(gè)模塊中。

4 核內(nèi)其他單元的設(shè)計(jì)

4.1 中斷單元的實(shí)現(xiàn): 此次IPCORE 共有5 個(gè)中斷包括兩個(gè)外部中斷,三個(gè)中斷。中斷源的檢測(cè)是在狀態(tài)機(jī)時(shí)序部分完成,執(zhí)行中斷程序之前操作如PC 裝載中斷向量值,PC 值的保存,清除中斷標(biāo)志等是在狀態(tài)機(jī)的組合邏輯部分實(shí)現(xiàn)。

4.2 定時(shí)計(jì)數(shù)單元和UART 的設(shè)計(jì):兩個(gè)多功能16 位定時(shí)/ 計(jì)數(shù)器,我們用兩個(gè)進(jìn)程分別來實(shí)現(xiàn)。定時(shí)/ 計(jì)數(shù)器1 與定時(shí)/ 計(jì)數(shù)器0 類似,但它輸出一個(gè)溢出脈沖到串行接口,給串行接口提供波特率。溢出中斷標(biāo)志輸出到中斷處理模塊。串行口是一個(gè)全雙工通信接口,它可作UART 用,也可以作同步移位寄存器用。我們用兩個(gè)進(jìn)程來分別實(shí)現(xiàn)其收發(fā)功能。收發(fā)所需時(shí)鐘在進(jìn)程外實(shí)現(xiàn),模式1、2、3 的區(qū)別只是時(shí)鐘和位數(shù)不同,故放在一起實(shí)現(xiàn)。

4.3 存儲(chǔ)器設(shè)計(jì):核內(nèi)包含256B 的存儲(chǔ)器,其中低128 單元作為用戶RAM,高128 單元作為SFR.外部RAM 和ROM 可根據(jù)需要任意擴(kuò)展到64KB。此次設(shè)計(jì)采用哈佛總線結(jié)構(gòu),ROM 和RAM 區(qū)由控制模塊分別提供數(shù)據(jù),地址傳送總線以及控制信號(hào)線。內(nèi)部RAM 和外部RAM 的讀寫也采用不同的控制線獨(dú)立控制。這樣的并行結(jié)構(gòu)加速了指令執(zhí)行的過程,有利于速度的提升。

5 功能和時(shí)序仿真的結(jié)果

5.1 功能測(cè)試

編完代碼后,將所有模塊整合,接下來就需要搭建測(cè)試平臺(tái)(testbench),寫激勵(lì)文件,進(jìn)行功能仿真。在源代碼調(diào)試階段,編寫一簡單的指令來進(jìn)行仿真,然后看波形就可以了。當(dāng)所有指令的調(diào)試基本通過的時(shí)候,就要對(duì)其進(jìn)行全功能仿真,因此,針對(duì)此核的不同功能,如外中斷、定時(shí)器/計(jì)數(shù)器、UART等需要編寫不同的測(cè)試文件,以保證其在多種情況下都能正常工作。

測(cè)試平臺(tái)見圖

圖3 測(cè)試平臺(tái)的建立模式

利用Mentor Graphics 的工具M(jìn)ODELSIM SE/對(duì)模型進(jìn)行了模擬驗(yàn)證。此處僅給出了一個(gè)簡單的指令執(zhí)行后的模擬結(jié)果(見圖4)。圖中所示為ADD A RN指令的波形圖,可以看出,模擬結(jié)果與指令執(zhí)行結(jié)果一致。該模型也通過了MODELSIM的可綜合性檢查。

圖4 指令A(yù)DD A RN 執(zhí)行結(jié)果

5.2 時(shí)序測(cè)試

在時(shí)序測(cè)試中我們選用了ALTERA 公司的不同系列FPGA 芯片來對(duì)次IPCORE 進(jìn)行綜合，綜合后的性能如下表所示：

從上表我們可以看出雖然不同的器件綜合后的結(jié)果不相同，但是本文設(shè)計(jì)的8 位MCUIPCORE 可以完全可以容納到一個(gè)相對(duì)門數(shù)為20 萬門以上的FPGA 中，并且具有較好的時(shí)鐘頻率特性。

6 結(jié)論

雖然這里只設(shè)計(jì)了一款八位的MCU IP CORE,但我們所提出的架構(gòu)和模塊設(shè)計(jì)新思路可以推廣到16位、32位以及64位MCU的設(shè)計(jì)中。因?yàn)椴还苁嵌嗌傥坏腗CU CORE,設(shè)計(jì)中需要重點(diǎn)考慮的架構(gòu)以及指令系統(tǒng)基本上是一致的,所不同的只是一些總線位數(shù)以及寄存器的位數(shù)而已。當(dāng)然隨著位數(shù)的增加,一些驗(yàn)證和測(cè)試的復(fù)雜度也將顯著增加,但從設(shè)計(jì)思路的角度來講,它們是一樣的。在具體的推廣中,要根據(jù)應(yīng)用領(lǐng)域的不同,對(duì)這些方法進(jìn)行適當(dāng)?shù)娜∩峄蜻m當(dāng)?shù)母倪M(jìn),以更加符合某些具體應(yīng)用領(lǐng)域的要求。

本文創(chuàng)新點(diǎn)：本文設(shè)計(jì)了一種新結(jié)構(gòu)的兼容51指令的MCU IPCORE。設(shè)計(jì)中引入了純組合的ALU單元，增加了并行乘除法器，重新設(shè)計(jì)了外圍組件，在設(shè)計(jì)控制單元的時(shí)候，重新設(shè)計(jì)了指令的時(shí)序，并且把指令狀態(tài)機(jī)的時(shí)序和組合部分分開設(shè)計(jì)，提高了狀態(tài)機(jī)的執(zhí)行效率。從結(jié)果上看，時(shí)鐘頻率提高了很多，可由用戶根據(jù)需要選擇合適的ROM和RAM 的大小，并且完全可以把此核放在一個(gè)相對(duì)門數(shù)在20萬門以上的FPGA的中。