軟硬件搭橋改善SoC驗(yàn)證效率
掃描二維碼
隨時(shí)隨地手機(jī)看文章
ce="Verdana">隨著系統(tǒng)級芯片(SoC)的復(fù)雜度不斷提高,軟、硬件開發(fā)融合所帶來的挑戰(zhàn)已經(jīng)不可小覷。這些功能強(qiáng)大的系統(tǒng)現(xiàn)在由復(fù)雜的軟件、固件、嵌入式處理器、GPU、存儲(chǔ)控制器和其它高速外設(shè)混合而成。更高的功能集成度與更快的內(nèi)部時(shí)鐘速度以及復(fù)雜的高速I/O相結(jié)合,意味著提供正常運(yùn)行、并經(jīng)過全面驗(yàn)證的系統(tǒng)比以前變得更難。
傳統(tǒng)上,軟件驗(yàn)證和調(diào)試及硬件驗(yàn)證和調(diào)試一直是兩個(gè)不同的世界。通常情況下,軟件團(tuán)隊(duì)和硬件團(tuán)隊(duì)各自為政,前者專注于編程模型內(nèi)部的軟件執(zhí)行,后者則在硬件開發(fā)框架內(nèi)進(jìn)行調(diào)試,其中時(shí)鐘周期精度、并行運(yùn)行及調(diào)試數(shù)據(jù)回溯原始設(shè)計(jì)的關(guān)系是關(guān)鍵。理論上,經(jīng)過全面調(diào)試后,軟件和硬件應(yīng)無差錯(cuò)地協(xié)同運(yùn)行。但在實(shí)際環(huán)境中,無差錯(cuò)協(xié)同運(yùn)行的情況不多,正因如此,經(jīng)常會(huì)導(dǎo)致關(guān)鍵成本上升及產(chǎn)品開發(fā)周期延誤。
為在合理的成本和時(shí)間范圍內(nèi)實(shí)現(xiàn)更高的集成度,業(yè)界必須轉(zhuǎn)向新的方法:設(shè)計(jì)的洞察。換句話說,如果我們想能夠高效地持續(xù)驗(yàn)證和調(diào)試這些系統(tǒng),工程師們必須提前設(shè)計(jì)成能夠提供全面的系統(tǒng)視圖。其中的關(guān)鍵是能夠了解涵蓋硬件領(lǐng)域和軟件領(lǐng)域的各種行為之間的臨時(shí)關(guān)系。本文介紹了使用嵌入式儀器調(diào)試SoC的一種方法,說明了通過整合硬件調(diào)試視圖和軟件調(diào)試視圖,可以更快、更高效地調(diào)試整個(gè)系統(tǒng)。
構(gòu)建測試臺(tái)
圖1所示的SoC由一塊32位RISC指令集處理器及一條AMBA APB外設(shè)總線組成,處理器連接到AMBA AHB系統(tǒng)總線上。SoC還包含一個(gè)DDR2存儲(chǔ)控制器、一個(gè)千兆位以太網(wǎng)網(wǎng)絡(luò)適配器、一個(gè)Compact Flash控制器、VGA控制器及多個(gè)低速外設(shè)接口。SoC運(yùn)行Debian GNU Linux操作系統(tǒng)第4版,這一操作系統(tǒng)運(yùn)行v2.6.21內(nèi)核。處理器核心工作頻率為60MHz,DDR存儲(chǔ)控制器工作頻率為100MHz,其它I/O外設(shè)在33MHz~12MHz之間的基本頻率上運(yùn)行。整個(gè)SoC在Virtex-5開發(fā)板卡上實(shí)現(xiàn)。
圖1. SoC基線測試臺(tái)。
總體上看,這一系統(tǒng)是一臺(tái)全功能計(jì)算機(jī),能夠提供基于終端的用戶接入,能夠連接互聯(lián)網(wǎng),運(yùn)行應(yīng)用程序,安裝文件系統(tǒng)等等。SoC的這些特點(diǎn)產(chǎn)生了復(fù)雜的調(diào)試場景,給硬件調(diào)試設(shè)施和軟件調(diào)試設(shè)施的功能帶來了壓力。在大多數(shù)情況下,關(guān)鍵操作都同時(shí)涵蓋硬件和軟件。
調(diào)試基礎(chǔ)設(shè)施
處理器核心開發(fā)人員一般會(huì)提供調(diào)試基礎(chǔ)設(shè)施,要么是某個(gè)核心的一套固定特性,要么是一群核心的可配置插件。不管是哪種形式,調(diào)試基礎(chǔ)設(shè)施都變成了被制造的核心的一部分。然后調(diào)試軟件使用這個(gè)基礎(chǔ)設(shè)施,為軟件開發(fā)人員提供調(diào)試特性。
與大多數(shù)現(xiàn)代處理器類似,如英特爾處理器、AMD處理器、IBM處理器、Oracle處理器和ARM處理器,這里突出顯示的處理器核心支持一套基本調(diào)試功能。在本例中,可以通過JTAG訪問的“后門”,允許軟件調(diào)試程序(如GDB)讀取和寫入系統(tǒng)中的存儲(chǔ)器,檢測處理器的運(yùn)行狀態(tài)。通過這些機(jī)制及訪問原始軟件源代碼,GDB和其它軟件調(diào)試程序可以提供軟件斷點(diǎn)、單步操作、變量值檢查、堆棧跟蹤、初始條件配置、交替存儲(chǔ)器值及恢復(fù)功能。
在大多數(shù)情況下,硬件調(diào)試設(shè)施并不是與構(gòu)成SoC的硬件IP核心一起提供的。相反,硬件調(diào)試設(shè)施通常疊加到現(xiàn)有的SoC設(shè)計(jì)上。造成這種差異的原因有很多。首先,與軟件調(diào)試不同,硬件要求的底層功能具有多樣化特點(diǎn),通常只有在SoC組裝時(shí)才能得到全面了解。此外,每種新的SoC通常要求不同的調(diào)試基礎(chǔ)設(shè)施。最后,作為新興領(lǐng)域,硬件調(diào)試的標(biāo)準(zhǔn)化程度不高,生態(tài)系統(tǒng)建設(shè)不夠。因此,硬件調(diào)試設(shè)施通常被留給各個(gè)設(shè)計(jì)人員,這些設(shè)計(jì)人員會(huì)創(chuàng)建針對不同功能領(lǐng)域的特定調(diào)試特性。在大型機(jī)構(gòu)中,通常會(huì)開發(fā)擁有內(nèi)部支持的工具和結(jié)構(gòu)。但是,隨著SoC的復(fù)雜程度不斷提高,創(chuàng)建高效硬件調(diào)試設(shè)施的復(fù)雜程度也在不斷提高,內(nèi)部開發(fā)工作難以為繼。
作為替代方案,測試和測量廠商可以提供完整的設(shè)計(jì)工具、IP庫和工作流程,創(chuàng)建硬件調(diào)試設(shè)施。圖2所示的設(shè)置稱為Tektronix Clarus Post-Silicon Validation Suite,這一驗(yàn)證套件由多種可以重復(fù)配置的嵌入式儀器組成,這些儀器可以連接起來,分布在整個(gè)SoC中,創(chuàng)建滿足特定功能要求的調(diào)試基礎(chǔ)設(shè)施。Implementer工具可以在RTL級(Vreilog、System Verilog和VHDL)把硬件設(shè)計(jì)中任何層級的任何信號儀器化。Analyzer通過JTAG或以太網(wǎng)連接,配置和控制嵌入式儀器。最后,Investigator把嵌入式儀器收集的數(shù)據(jù)向回映射到原始RTL(在仿真環(huán)境中),實(shí)現(xiàn)更復(fù)雜的調(diào)試。
圖2: Clarus Post-Silicon Vlidtion Suite套件的結(jié)構(gòu)。
嵌入式儀器被應(yīng)用到SOC中,提供調(diào)試基礎(chǔ)設(shè)施,如圖3所示。其中一個(gè)重要方面是能夠在調(diào)試過程中重新配置儀器,針對SoC不同領(lǐng)域中的各種信號和場景?;緝x器稱為捕獲站,其獨(dú)立管理觀測數(shù)據(jù)的選擇、壓縮、處理和存儲(chǔ)。多臺(tái)捕獲站通常一起使用,為某個(gè)SoC創(chuàng)建特定設(shè)計(jì)基礎(chǔ)設(shè)施。在插入過程中,捕獲站配置一系列關(guān)心的潛在信號、最高同時(shí)觀測數(shù)量以及最大RAM容量。捕獲站一般被分配給特定時(shí)鐘域,同時(shí)捕獲觀測數(shù)據(jù)。Analyzer從每個(gè)捕獲站中收集數(shù)據(jù),顛倒壓縮算法,把每個(gè)站中捕獲的數(shù)據(jù)對準(zhǔn),在所有捕獲站中生成時(shí)間相關(guān)的視圖。
圖3: 硬件調(diào)試基礎(chǔ)設(shè)施。
本例中使用的SoC有四個(gè)捕獲站:一個(gè)位于處理器時(shí)鐘域,標(biāo)為1號捕獲站(60MHz),針對362個(gè)信號;一個(gè)位于RX以太網(wǎng)域,標(biāo)為2號捕獲站(25MHz),針對17個(gè)信號;一個(gè)位于TX以太網(wǎng)域,標(biāo)為3號捕獲站(25MHz),針對17個(gè)信號;最后一個(gè)位于閃存時(shí)鐘域,標(biāo)為4號捕獲站(33MHz),針對178個(gè)信號。每個(gè)捕獲站都并行運(yùn)行,能夠選擇性地觀測任意信號組合。Analyzer工具的最終輸出是一個(gè)表示實(shí)際硅片器件中時(shí)鐘周期準(zhǔn)確信號事務(wù)的波形,如圖4所示。
圖4: SoC波形實(shí)例。
盡管軟件調(diào)試設(shè)施和硬件調(diào)試設(shè)施在目標(biāo)平臺(tái)上觀測只限于軟件問題或硬件問題時(shí)效果很好,但在了解涉及軟件和硬件交互的行為時(shí),則面臨著明顯挑戰(zhàn)。表1列出了我們的測試臺(tái)開發(fā)過程中遇到的部分問題,以及我們在業(yè)界看到的代表性問題。
主要挑戰(zhàn)在于,盡管使用軟件調(diào)試設(shè)施或硬件調(diào)試設(shè)施能夠“看到”非預(yù)期行為的影響,但通常很難確定觀測到的不正確行為到底是因還是果。這個(gè)問題經(jīng)常變成軟件中非預(yù)計(jì)的行為是硬件行為不正確的結(jié)果,還是其它方式。關(guān)鍵在于確定多個(gè)事件之間的臨時(shí)關(guān)系,這要求軟件調(diào)試視圖和硬件調(diào)試視圖之間有一個(gè)公共參照物。
事件管理
重建軟件調(diào)試視圖和硬件調(diào)試視圖之間臨時(shí)關(guān)系的能力,涉及兩種調(diào)試設(shè)施中調(diào)試狀態(tài)和事件處理的整合,或綜合硬件管理,如圖5所示。
圖5: 綜合事件管理。
在本例中,Clarus Suite提供的分布式異步儀器使得每個(gè)捕獲站可以視作自治設(shè)備。為支持儀器之間的“交叉觸發(fā)”,有一條共享事件總線及一個(gè)集中式事件處理器。集中式事件處理器在圖5中標(biāo)為接入控制(Access Control),把調(diào)試事件和狀態(tài)傳送給Analyzer軟件,Analyzer軟件管理著整個(gè)調(diào)試基礎(chǔ)設(shè)施。這可以對多個(gè)功能單元和時(shí)鐘域同時(shí)進(jìn)行高效硬件調(diào)試。為創(chuàng)建綜合事件管理,這些信息傳播到軟件調(diào)試設(shè)施中,并從軟件基礎(chǔ)設(shè)施中收集數(shù)據(jù)。通過采用綜合事件管理,基礎(chǔ)設(shè)施可以檢測軟件斷點(diǎn)事件,調(diào)試處理器的狀態(tài)。同樣,軟件調(diào)試設(shè)施能夠檢測硬件觸發(fā),調(diào)試硬件調(diào)試設(shè)施的狀態(tài)。
綜合事件管理的兩大優(yōu)勢是軟件調(diào)試發(fā)起的事件能夠控制硬件觸發(fā),硬件調(diào)試發(fā)起的事件能夠控制軟件調(diào)試。更具體地說,軟件斷點(diǎn)可以映射到特定硬件行為,硬件觸發(fā)可以在某個(gè)點(diǎn)中斷軟件。圖6和圖7分別說明了這兩種場景的實(shí)例。
圖6:由軟件發(fā)起的事件。
圖7:由硬件發(fā)起的事件。
為演示綜合調(diào)試系統(tǒng)中軟件發(fā)起的斷點(diǎn)功能,我們修改了Linux內(nèi)核,在磁盤扇區(qū)0x00041d90上發(fā)生讀取時(shí)打印消息“BLOCK”.然后,把目標(biāo)對準(zhǔn)調(diào)試設(shè)施中來自“sysace”Compact Flash控制器的軌跡。我們使用GDB,在xsysace.c文件第714行上設(shè)置了一個(gè)硬件斷點(diǎn)(printk發(fā)生的行)。然后配置測試設(shè)施,使用綜合事件管理監(jiān)測軟件調(diào)試設(shè)施。最后,“find/”命令強(qiáng)制內(nèi)核讀取整個(gè)磁盤。如圖6所示,軟件斷點(diǎn)在希望的行上暫停了內(nèi)核執(zhí)行,另外還觸發(fā)了硬件調(diào)試設(shè)施。結(jié)果,可以在軟件斷點(diǎn)時(shí)間上看到詳細(xì)的硬件行為。
我們使用硬件適配器,演示綜合調(diào)試系統(tǒng)中硬件發(fā)起的觸發(fā)功能。我們設(shè)置成在Linux內(nèi)核清除以太網(wǎng)適配器中的“RX Packet Ready Interrupt Bit”時(shí)發(fā)生硬件觸發(fā)。我們把綜合事件管理界面配置成把硬件事件映射到軟件調(diào)試設(shè)施。到系統(tǒng)中路由器IP地址的ping從SoC到路由器應(yīng)答位置發(fā)起一個(gè)發(fā)送包。在應(yīng)答發(fā)生時(shí),這個(gè)包到達(dá)以太網(wǎng)物理層,由以太網(wǎng)適配器處理。然后處理器被中斷,Linux內(nèi)核服務(wù)中斷。在中斷服務(wù)結(jié)束時(shí),中斷被清除。這導(dǎo)致硬件觸發(fā)和軟件被暫停,如圖7所示。得到的視圖顯示了從物理層直到操作系統(tǒng)的整個(gè)復(fù)雜系統(tǒng)中硬件和軟件的同步行為或時(shí)間相關(guān)行為。
小結(jié)
ce="Verdana"> 通過在軟件調(diào)試設(shè)施和硬件調(diào)試設(shè)施之間創(chuàng)建綜合事件管理界面,可以圍繞軟件調(diào)試事件和硬件調(diào)試事件實(shí)現(xiàn)單事件同步。這種同步可以有意義地表示同時(shí)來自這兩種基礎(chǔ)設(shè)施的調(diào)試數(shù)據(jù)。這樣一個(gè)完整的系統(tǒng)視圖為觀察涵蓋軟件和硬件的各種SoC功能之間的臨時(shí)關(guān)系打開了一扇窗戶,可以更快、更高效地調(diào)試日益復(fù)雜的SoC設(shè)計(jì)。