引言
隨著消費者數(shù)據(jù)需求量的不斷攀升,全球范圍內(nèi)的運營商無一不面臨著對無線帶寬前所未有的增長需求。值得慶幸的是,包括標準制定機構(gòu) 3GPP 等在內(nèi)的整個行業(yè)都在竭盡全力來支持這種需求。LTE 正是為幫助運營商滿足這一指數(shù)級數(shù)據(jù)增長需求應(yīng)運而生的最佳技術(shù)選擇。由于 LTE 部署實施已趨成熟,基站制造商紛紛熱衷于采用片上系統(tǒng)架構(gòu) (SoC),以使運營商可在維持并提升服務(wù)質(zhì)量的同時還能大幅降低網(wǎng)絡(luò)成本。
助力向 LTE 的成功過渡需要在基站 SoC 設(shè)計方面實現(xiàn)大量的突破性創(chuàng)新。德州儀器 (TI) 已成功開發(fā)了功能強大且極富創(chuàng)新性的 KeyStone 多內(nèi)核 SoC 架構(gòu),旨在優(yōu)化 WCDMA 、LTE 性能的同時還能降低基站成本和能耗。對于無線基站的應(yīng)用而言,KeyStone 最基本的組成部分是在無線標準的物理層 (PHY),即第一層,實施可配置協(xié)處理器。本文不僅介紹了 TI 基于 KeyStone 多內(nèi)核 SoC 架構(gòu)的 TCI6618 無線片上系統(tǒng) (SoC) 將如何實現(xiàn)可為制造商縮短開發(fā)周期的優(yōu)化型 PHY LTE解決方案,而且還將展示其獨具競爭優(yōu)勢且所需資產(chǎn)投資和運營成本更低的 eNodeB 解決方案如何在性能方面實現(xiàn)強大的潛力.
全球移動數(shù)據(jù)應(yīng)用的指數(shù)級增長給無線運營商帶來了巨大挑戰(zhàn)。但值得慶幸的是,無線技術(shù)不斷演進發(fā)展,且應(yīng)運而生的長期演進技術(shù)已成為迎接 這一挑戰(zhàn)的首選的全球標準。世界前25 強無線運營商已決定部署LTE;其中部分運營商于2010 年開始進行試運行,預(yù)計將在2012 年迎來多個市場的增 長契機。采用LTE 技術(shù)表明能夠通過提高頻譜效率來更好地使用運營商的頻譜資源,這意味著相對以往技術(shù)而言每赫茲能夠傳輸更多比特數(shù)。運營商部署LTE 解決方案的速度既要跟上海量數(shù)據(jù)的流量激增,同時還要確保盡可能地降低每比特開銷,從而減少碳足跡并實現(xiàn)從3G 到LTE 的平穩(wěn)過渡。
對LTE 系統(tǒng)需求的變化給運營商、基站廠商及其提供商帶來了全新的挑戰(zhàn)。 已開發(fā)出一款功能強大且極富創(chuàng)新性的片上系統(tǒng)(SoC) 架構(gòu),能夠大幅減 少LTE 產(chǎn)品的成本,使生制造商能從領(lǐng)先的基站技術(shù)中顯著獲益。 多內(nèi)核SoC 架構(gòu)建立在TI 業(yè)經(jīng)驗證的多內(nèi)核DSP 平臺之上,并集成了適用于4G系統(tǒng)的創(chuàng)新浮點架構(gòu)和協(xié)處理器。對于運算增強功能而言,更重大的創(chuàng)新是背板和內(nèi)部數(shù)據(jù)能夠?qū)崿F(xiàn)遷移,這對于高速4G SoC 獲得全面性能至關(guān)重要。
TI 新架構(gòu)將推動整個行業(yè)更快速地朝著實現(xiàn)高價值4G 系統(tǒng)特性的部署方向 LTE 可支持靈活的通道帶寬(1.4 20 MHz)、頻分多路復(fù)用(FDD 和時分多路復(fù)用(TDD),從而可在所屬頻譜范圍內(nèi)實現(xiàn)靈活部署。LTE 通信協(xié)議棧的基礎(chǔ)是物理層(PHY),有時也稱為第1 層(L1) 。PHY 層是固定基站到移動設(shè)備連接的基礎(chǔ);若無線連接不穩(wěn)定,通話會掉線,下載會中斷,同時視頻也會停頓中的高級PHY是行業(yè)可靠性能的黃金標準,而TI 技術(shù)基于可支持多種流行無線標準的成熟穩(wěn)定的的可配置協(xié)處理器之上,從而可在通 用平臺上實現(xiàn)3G 向4G 的成功升級和無縫過渡。
德州儀器 LTE 無線電廣播LTE 是第三代合作伙伴項目(3GPP; 的最新移動標準。LTE 在3G 移動技術(shù)基礎(chǔ)上實現(xiàn)了重大架構(gòu) 技術(shù)進步,可在20MHz 頻譜范圍提供至少100 Mbps 的峰值下行速率以及至少50 Mbps的 峰值上行速率。
(無線電廣播資源控制[RRC] 層)接口相連,并能為更高層提供數(shù)據(jù)傳輸服務(wù)。PHY 可處理信道編碼、PHY 混合自動中繼請求(HARQ) 處理調(diào)制和多天線處理,并能將信號映射至相關(guān)的物理時頻資源。
LTE 下行鏈路物理層處理可接收從MAC 層以傳輸模塊的形式傳輸?shù)臄?shù)據(jù)流和控制流,計算循環(huán)冗余校驗(CRC) 開始處理,并將其附加在傳輸模塊。如果傳輸模塊的大小超過編碼模塊最大允許的6,144 比特,則應(yīng)執(zhí)行編碼模塊分割。新的CRC 計算出來后即可在信道編碼前將其附加給每個代碼模塊。圖1 描述了LTE 下行鏈路的主要功能模塊 圖12 高性能物理層解決方案
多種調(diào)制方案 (正交相移鍵控[QPSK)、16 QAM [ 正交幅度調(diào)制,或64 QAM)均可用于實現(xiàn)LTE 層映射,而且其預(yù)編碼支持多天線傳輸。最后,還可將正交頻分多路復(fù)用(OFDM)符號的資源組件映射至可實現(xiàn)空中傳輸?shù)拿總€天線端口。
LTE 技術(shù)演進 LTE 可充分利用眾多用于3G HSPA+ (高速分組接入)的先進技術(shù),其中包括Turbo 編碼、HARQ 和多天線方案。 的下行鏈路速率以及50 Mbps 以上的上行鏈路速率。TI TCI6618 解決方案具備加值與推進[!--empirenews.page--]
算法的信號處理開銷,能夠支持雙通道20 MHz、300 Mbps 下行鏈接、150 Mbps 上行鏈接的2x2 多輸入多輸出(MIMO) 解決方案。此外,與3G 系統(tǒng)相比,LTE 還可使用OFDM 和上下行鏈路多輸入與多輸出(MIMO) 技術(shù)實現(xiàn)顯著的性能提升。
LTE 使用OFDM 支持無線電廣播傳輸,從而能夠提供穩(wěn)定的傳輸機制來避免惡劣信道條件下的性能衰減、窄帶同頻串擾、碼間干擾和衰減。此外,其還可提供對時間同步錯誤的高頻譜效率及低靈敏度。
LTE 下行鏈路處理使用帶循環(huán)前綴的多載波OFDM 傳輸方式。在上行鏈路,帶有循環(huán)前綴的寬帶單載波OFDM 傳輸能夠大幅減少所傳輸信號的瞬時功耗變化??焖俑道锶~變換(FFT)能夠為OFDM 調(diào)制解調(diào)提供低復(fù)雜度的高效率實施方案。
圖2LTE MIMO 信道模型為了提升性能,LTE 同時在發(fā)送器和接收機中都采用了使用MIMO 天線的智能無需額外增加帶寬或發(fā)送功率就能顯著提高數(shù)據(jù)吞吐量并擴大頻率覆蓋
多天線上行鏈路MIMO 接收機技術(shù)能夠有助于提高信噪比。在接收機主要受噪音損害時
最大比合并(MRC) 是一種非常有效的天線合并策略。在干擾幅度非常強的信道條件下,最小均方誤差(MMSE) 結(jié)合技術(shù)是確定最小化均方誤差的天線加權(quán)矢量的極佳方案。MMSE
MIMO 均衡的浮點實施可顯著減低計算復(fù)雜度,并實現(xiàn)極高性能,從而成就了高效率的
LTE MIMO 接收機。
LTE 推動器 TCI6618 SoC 是TI TMS320C66x DSP 多內(nèi)核系列成員。其基于TI 最新的KeyStone多內(nèi)核架構(gòu)之上,適用于高性能的無線基礎(chǔ)局端應(yīng)用,是用以應(yīng)對LTE 設(shè)計挑戰(zhàn)的完美方案。圖3 闡述了該器件的特性和處理組件。
高性能物理層解決方案方框圖
TCI6618 針對LTE 的多內(nèi)核架構(gòu)在業(yè)界率先提供了一種可將精簡指令集計算機(RISC)和DSP 內(nèi)核同專
主要特性 用協(xié)處理器和I/O 高度集成在一起的高性能結(jié)構(gòu)。此外,KeyStone 也是業(yè)界第一款能夠為所有處理內(nèi)核、外設(shè)、協(xié)處理器以及I/O 提供足夠內(nèi)部帶寬以實現(xiàn)非阻塞、零延遲接入的多內(nèi)核架構(gòu)。這主要得益于4 種硬件的支持,如多內(nèi)核導(dǎo)航器、TeraNet、多內(nèi)核共享存 儲器控制器及超鏈接。多內(nèi)核導(dǎo)航器是一種基于分組的創(chuàng)新型管理器,能夠?qū)?,192 個隊列進行控制。當向向各隊列分配任務(wù)時,多內(nèi)核導(dǎo)航器可提供硬件加速的調(diào)度,以直接將任務(wù)指向相關(guān)的可用硬件?;诜纸M的SoC 可使用2Tbp 容量的TeraNet 交換中心資源進行分組傳輸。多內(nèi)核共享存儲器控制器能夠在無需耗用容量的情況下允許處理內(nèi)核直接訪問共享存儲器,因而能夠避免因存儲器接入造成分組傳輸?shù)难舆t。超鏈接可提供50 Gbps 的芯片級互連,使SoC 能夠協(xié)同工作。其極低的協(xié)議開銷和高吞吐量特性使超鏈接成為芯片對芯片互連的理想接口。超鏈接與多內(nèi)核導(dǎo)航器協(xié)同工作,可將任務(wù)透明性地分派給串聯(lián)設(shè)備,而且執(zhí)行這些任務(wù)就如同在其本地資源上運行一樣。
C66x 內(nèi)核TCI6618 具有四個支持定點與浮點運算操作的1.2-GHz C66x 內(nèi)核。其可提供1.2條件下每秒153.6 GMAC 的定點運算性能以及每秒76.8 GFLOP 的浮點運算性能。指令集架構(gòu)新增了90 條全新的高性能指令,尤其是浮點指令與矢量信號處理指令,從而能夠支持16 位數(shù)據(jù)的雙路單指令多數(shù)據(jù)(SIMD) 操作以及8 位數(shù)據(jù)的四路SIMD 操作。該款超長指令字架構(gòu)可支持8 個同步問題,并為復(fù)數(shù)計算和矩陣處理進行了優(yōu)化。其具有更低時延的浮點能力與對MAC 性能的4 倍速增強,不僅顯著加速了LTE MIMO 的均衡,同時還提高了LTE 所需的大部分DSP 處理能力。
[!--empirenews.page--]
比特率協(xié)處理器(BCP) 是一款可減輕無線信號鏈中總體比特率處理工作的多標準加速引擎。BCP 對以下處理功能進行了增強:調(diào)制 速率匹配解調(diào)速率解匹配交錯 CRC 附加 解交錯與卷積編碼 除了能夠從這些功能上減輕DSP 內(nèi)核開銷,BCP 也可實現(xiàn)Turbo 干擾消除等高級接收機算法。Turbo 干擾消除可將信噪比(SNR) 提高3 dB,從而使頻譜效率最多可提高40%,這也是無線系統(tǒng)的關(guān)鍵性能指標。BCP 能夠在提供2.2 Gbps 下行吞吐量和1.1Gbps 上行吞吐量的同時,還能大約減輕DSP 周期的15 GHz 負載。
第三代Turbo 解碼器協(xié)處理器(TCP3d) 是對LTE 上行鏈路處理進行Turbo 解碼的可編程外設(shè)。TCP3d 輸入采用針對系統(tǒng)和校驗位的軟信道決策,而輸出則采用硬信道決策。
TCP3d 可生成Turbo 交錯表,能夠執(zhí)行Turbo 解碼并支持基于編碼模塊的CRC 計算。TCP3d
具有非常小的驅(qū)動器開銷,卻比此前的TCP2 系列產(chǎn)品快了7 倍。TCI6618 包含三個TCP3d協(xié)處理器,總吞吐能力經(jīng)6 次疊加可高達582 Mbps。
第三代Turbo 編碼器協(xié)處理器(TCP3e) 是一種可對LTE Turbo 代碼進行編碼以實現(xiàn)下行鏈路處理的可編程外設(shè)。TCP3e 的輸入為信息位,而輸出則為已編碼的系統(tǒng)化校驗位。
其能夠支持基于編碼模塊的CRC、Turbo 編碼及Turbo 交錯表生成。TCP3e 能以150 Mbps 的下行鏈路吞吐量速率對每秒450 Mbycles 的CPU 處理減輕負擔。TCI6618 具有4 個TCP3e 協(xié)處理器,總吞吐量高達2572 Mbps。
快速傅里葉變換協(xié)處理器(FFTC)是一款與DSP內(nèi)核松散耦合的加速器??蓪⑵溥B接至TeraNet并使用多內(nèi)核導(dǎo)航器輸入、輸出需要FFT功能的分組。FFTC 具有循環(huán)前綴可插拔特性,能夠?qū)ζ溥M行編程以便在分組數(shù)據(jù)的開始部分忽略或添加樣本;這允許在無需使用軟件對循環(huán)前綴進行處理的情況下實現(xiàn)天線接口與FFTC 之間的無縫連接。此外, FFTC 也可根據(jù)LTE 要求對輸入數(shù)據(jù)進行頻率切換。以下列舉了在LTE 中使用FFTC 的應(yīng)用
2x2 MIMO 配置的LTE 系統(tǒng)中,該FFTC 集群可減少超過1.6 GHz 的DSP 內(nèi)核處理開銷。換句 話說,其可為SoC 節(jié)省比一個完整DSP 內(nèi)核還多的資源。
瑞克搜索加速器(RSA) 可用于LTE 編碼塊解碼。TCI6618 擁有兩個與兩個DSP 內(nèi)核中的任一一個都能緊密配合的RSA 。RSA 可為相關(guān)性和搜索算法提供硬件加速,允許通過物理上行共享信道(PUSCH) 解碼高效實施上行控制信息(UCI) 。使用RSA 可為基于PUSCH 解碼算法的UCI 節(jié)省超過1GHz 的DSP 處理資源。
TCI6618 第二代天線接口(AIF2) 是一個專有外設(shè)模塊,可在上下行基帶DSP 內(nèi)核與高 速串行接口(連接至數(shù)字無線電廣播前端)之間支持基帶同相與正交(IQ) 數(shù)據(jù)的傳輸。AIF2 可支持LTE 的頻分多路復(fù)用(FDD)、時分多路復(fù)用(TDD)、通用公共無線電廣播接口(CPRI) 以及開放式基站架構(gòu)發(fā)起組織(OBSAI) 協(xié)議。AIF2 則能支持6 個鏈路,其中每個鏈路均帶 一個6 GHz 的SERDES 和每鏈路64 個最大天線載波。
AIF2 內(nèi)置多內(nèi)核導(dǎo)航器,并能直接與FFTC 連接,從而為LTE 系統(tǒng)提供了低時延的天線流量。此外,AIF2 也具有用于幀時序和同步的可編程無線電廣播定時器,以支持多種標準。
其能夠提供12 Gbps 的最大入口帶寬和12 Gbps 的最大出口帶寬。網(wǎng)絡(luò)協(xié)處理器 網(wǎng)絡(luò)協(xié)處理器可提供主要用于LTE L2 處理的以太網(wǎng)分組加速和安全加速功能。其內(nèi)置CRC 引擎可用于實現(xiàn)LTE PHY 傳輸模塊的CRC 計算。
高效 FFTC 前端數(shù)據(jù)分派– KeyStone 多內(nèi)核架構(gòu)可在AIF2 和FFTC 之間實現(xiàn)無縫接口,而無 需運行于DSP內(nèi)核之上的軟件的干預(yù)。此外,其還使用多內(nèi)核導(dǎo)航器基礎(chǔ)局端支持多內(nèi)核負載均衡。
AIF2 和FFTC 專為LTE OFDM 處理而精心優(yōu)化。兩者繼續(xù)沿用多內(nèi)核導(dǎo)航器的分組直接存儲器存取(DMA) 引擎,從而能夠在無需DSP 內(nèi)核干預(yù)的情況下通過隊列直接在AIF2 和FFTC 形成數(shù)據(jù)傳輸通道。
圖4闡述了如何在LTE 上行符號處理過程中采用多內(nèi)核導(dǎo)航器來實現(xiàn)負載均衡、調(diào)度、系統(tǒng)分區(qū)以及存儲器占用的減少。
在該例中,可將4 個天線信號流饋送到FFTC 中,分區(qū)及調(diào)度信息被編程固化在FFTC 輸入隊列描述符中。每個內(nèi)核均具有3 個專用的FFTC 輸出隊列,隊列中具有使用多內(nèi)核導(dǎo)航器以逐包方式重新分配到不同內(nèi)核的所需天線及數(shù)據(jù)符號信息。
通過使用多內(nèi)核導(dǎo)航器隊列描述符報頭協(xié)議專用信息,可對FFTC 輸出數(shù)據(jù)進行排序,以讓一個隊列接收FFTC 輸出數(shù)據(jù)符號,另一個隊列接收輸出導(dǎo)頻信號。第三個隊列包含可中斷內(nèi)核以啟動數(shù)據(jù)處理的符號數(shù)據(jù)。內(nèi)核能夠高效處理前端FFTC 數(shù)據(jù)而無需進行任何數(shù)據(jù)預(yù)處理開銷。FFTC 通過將部分數(shù)據(jù)及導(dǎo)頻符號路由到將執(zhí)行信道估計以及均衡的每個內(nèi)核來實現(xiàn)負載均衡。
圖4 –利用多內(nèi)核導(dǎo)航器實現(xiàn)負載均衡、調(diào)度以及系統(tǒng)分區(qū)[!--empirenews.page--]
通過為FFTC 輸出數(shù)據(jù)采用多內(nèi)核導(dǎo)航器隊列,L2 使用多區(qū)段主機分組描述符的存儲器空 間可節(jié)省下來??蓪⒅鞣柷昂蟮母蓴_保護音調(diào)存放在存儲器段中,通過每次傳輸快速回收。僅將有用數(shù)據(jù) (主符號)存儲在L2 中以備后續(xù)處理。其結(jié)果是為FFTC 前端處理減少了50% 的存儲器; 緩沖器使用量。圖5; 闡述了如何采用多內(nèi)核導(dǎo)航器隊列鏈接的描述符來減少存儲器的使用。
2
高性能物理層解決方案 圖5 使用多內(nèi)核導(dǎo)航器分組隊列減少存儲器使用包含適用于BCP、FFTC、TCP3d、TCP3e、多內(nèi)核導(dǎo)航器、 網(wǎng)絡(luò)協(xié)處理器、增強型直接存儲器接入(EDMA) 以及芯片支持庫等的驅(qū)動器。其可實現(xiàn)即裝即用的精彩用戶體驗,同時能夠大幅縮短研發(fā)周期。
采用TCI6618 的 TI 也提供LTE PHY 軟件,從而能夠為針對C66x 內(nèi)核而高度優(yōu)化的客戶PUY 解決方案提供構(gòu)LTE解決方案 建模塊。BCP 可減輕整個比特處理以及硬件中PUCCH 格式2、2a 與2b 解碼的負荷。LTE 庫包括PUSCH 符號、PUCCH 格式1、1a 與1b 解碼、PRACH 接收機處理和物理下行共享信道(PDSCH) 符號速率處理的相關(guān)軟件。圖6 顯示了使用TI 具有TCI6618 加速器的LTE 庫對下行 From L2 Modulation 處理高性能LTE 上行處理需要有效的CPU 周期來實現(xiàn)PUSCH 信道估計與均衡。根據(jù)天線數(shù)量,C66x 擴展指令集架構(gòu)與浮點算術(shù)運算相對于C64x+ 架構(gòu)而言可將MRC 均衡器的周期降低4 倍。由于具備浮點計算能力,諸如分塊矩陣轉(zhuǎn)置等更為高效的算法可用于實現(xiàn)同等性能p> 相對于MMSE MIMO 均衡器更為復(fù)雜的定點Cholesky 分解算法,其減少的周期數(shù)可達5 倍。
BCP 提供的控制信道解碼可大幅減少軟件周期數(shù),且能夠比軟件應(yīng)用中的典型算法提供更高的性能。在某些情況下,這能夠節(jié)省多達1.4 GHz 的DSP 處理主頻,相當于節(jié)約了一個多DSP 內(nèi)核。圖7 顯示了使用TCI6618 及其高度優(yōu)化的LTE 庫軟件而進行的PUSCH 處理 處理
此外,F(xiàn)FTC 也可用于信道估計以減輕DSP 處理負荷。在LTE 中,可基于嵌入在上行幀中的參考信號 (資源模塊中第4 類信號)來執(zhí)行信道估計。TI 的LTE 庫軟件可提供信道估計功能(在子幀中的每個數(shù)據(jù)承載資源組件中執(zhí)行)。信道估計的第一階段可利用FFTC 來構(gòu)建頻率平滑估計器。執(zhí)行IDFT 需要將信道估計從頻域向時域轉(zhuǎn)換,并利用矩形窗口來截取時域信道帶以獲得時域信道。或作為備選方案,還可選定能夠減少噪聲的閾值。隨后,執(zhí)行DFT 可生成頻域信道估計。信道估計的第二個階段可通過對第一階段估計結(jié)果的線性插值法/ 外插法,根據(jù)每個子載波進行計算。 圖8 顯示了PUSCH 信道估計處理進程。
圖8除了可用于上行PRACH 處理中的各個階段,也可將FFTC 用于PUSCH 信道頻偏補償和估計。
TCI6618 中的兩個FFTC 加速器能夠顯著降低DSP 內(nèi)核的LTE 信號處理負荷。通過充分利用 TI C66x DSP 內(nèi)核上的LTE 庫軟件,和TCI6618 硬件加速器,我們可在同一TCI6618 器件中度集成物理上行共享信道(PUSCH)、物理上行控制信道(PUCCH)、物理下行共享信道(PDSCH)、 物理下行控制信道(PDCCH) 以及物理隨機訪問信道(PRACH) 通道的LTE PHY 處理??芍С謨蓚€20MHz 帶寬區(qū)段的FDD LTE,以及2x2 個使用高級接收機算法獲取的150 Mbps 下行和75 Mbps 上行吞吐帶寬的MIMO。 多內(nèi)核架構(gòu)和無與倫比的TCI6618 系統(tǒng)、外設(shè)、加速器帶寬及吞吐量使得低成本的LTE 移動寬帶成為現(xiàn)實,同時也為市場帶來了高性價比的LTE 解決方案。
結(jié)論 以TI 多年無線基站系統(tǒng)知識和業(yè)經(jīng)驗證具有卓越性能的技術(shù)為依托,TCI6618 是在此基礎(chǔ)上持續(xù)創(chuàng)新的成果。TI KeyStone SoC 架構(gòu)可為LTE 及其持續(xù)技術(shù)演進提供最高的吞吐量以及符合未來要求的架構(gòu)。4 款同時集成了定點與浮點功能的高性能DSP 內(nèi)核可為LTE PHY處理提供業(yè)界功能最強大的內(nèi)核。豐富系列的硬件加速器不僅可減少LTE 系統(tǒng)時延,而且還能完全釋放CPU 資源,從而實現(xiàn)最佳的LTE 系統(tǒng)性能以及獨具競爭優(yōu)勢的差異化功能。TMS320TCI6618 可提供結(jié)合了業(yè)界開發(fā)生態(tài)系統(tǒng)且包含全面優(yōu)化型LTE PHY庫軟件的 最穩(wěn)健硬件平臺。平臺開發(fā)軟件可大幅加速開發(fā)進程,以確保為客戶提供業(yè)界一流的LTE PHY 解決方案。