當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]在演算法交易領(lǐng)域的最新進(jìn)展是導(dǎo)入一些更低延遲的解決方案,其中最佳的方式是使用FPGA搭建的客制硬體。這些FPGA硬體可說(shuō)是硬編碼ASIC的極致性能和CPU的靈活度之間的橋梁,提

在演算法交易領(lǐng)域的最新進(jìn)展是導(dǎo)入一些更低延遲的解決方案,其中最佳的方式是使用FPGA搭建的客制硬體。這些FPGA硬體可說(shuō)是硬編碼ASIC的極致性能和CPU的靈活度之間的橋梁,提供大量的資源且可加以配置,使其得以較軟體解決方案更大幅縮短往返交易延遲。

高性能運(yùn)算對(duì)于許多應(yīng)用至關(guān)重要。在其中一些最競(jìng)爭(zhēng)的應(yīng)用領(lǐng)域,開(kāi)發(fā)人員經(jīng)常能為其嵌入式系統(tǒng)問(wèn)題找到解決方案。例如,高頻交易(HFT)是一種演算交易的形式,其交易量占美國(guó)證券交易量的絕大部份。高頻交易使用機(jī)器學(xué)習(xí)演算法處理市場(chǎng)資料、擬定策略,以及在幾微秒的時(shí)間內(nèi)執(zhí)行訂單。

為了獲得每次交易中哪怕只有幾分之一美分的利潤(rùn),高頻交易員以很高的交易量短期進(jìn)出交易所。使用HFT演算法的系統(tǒng)持續(xù)監(jiān)測(cè)價(jià)格波動(dòng)情況,以利于調(diào)整短線交易策略。由于這是非常短期的交易策略,HFT企業(yè)無(wú)需耗費(fèi)大量資本、累積頭寸或隔夜持有其投資組合。目前,高頻交易量占美國(guó)證券交易量的75%。

在21世紀(jì)初,HFT交易側(cè)重于優(yōu)質(zhì)的演算法和交易策略。現(xiàn)在,由于最普及的幾種系統(tǒng)僅存在幾秒的延遲,決勝的關(guān)鍵不再是速度,而是策略。到了2010 年,由于演算法的進(jìn)展已不足以獲得交易優(yōu)勢(shì),為了戰(zhàn)勝彼此,參與者開(kāi)始縮短tick-to-trade的交易延遲,從而使交易時(shí)間縮短至數(shù)微秒。

在次毫秒級(jí)買賣交易訂單的刺激下,HFT平臺(tái)開(kāi)始了一場(chǎng)競(jìng)爭(zhēng)激烈的速度競(jìng)賽,以便將市場(chǎng)資料的往返延遲縮短至微秒級(jí)。由于僅僅幾奈秒的差別往往帶來(lái)巨大的‘潛伏套利’競(jìng)爭(zhēng)優(yōu)勢(shì)(或稱為‘搶先交易’),交易企業(yè)一直在尋找更快的交易伺服器。

采用軟體途徑處理訂單

傳統(tǒng)上,HFT交易一向使用軟體工具。這些工具利用了高性能運(yùn)算系統(tǒng),能夠高效地執(zhí)行復(fù)雜的交易策略(圖1)。這些系統(tǒng)中的作業(yè)系統(tǒng)核心控制對(duì)其CPU和記憶體資源的存取,而應(yīng)用堆疊則負(fù)責(zé)處理所有的交易策略,由網(wǎng)路介面卡(NIC)連接系統(tǒng)至證券交易所。

 

圖1:采用軟體途徑處理訂單的配置(來(lái)源:Cypress)

然而,這種配置存在交易延遲的缺點(diǎn):

標(biāo)準(zhǔn)NIC并未專為處理TCP/IP和專用交易協(xié)定進(jìn)行最佳化,而且無(wú)法板載處理市場(chǎng)資料饋送

主系統(tǒng)和乙太網(wǎng)路(Ethernet)卡之間的PCI Express匯流排會(huì)增加數(shù)微秒的延遲

核心OS原生的基于中斷途徑就會(huì)導(dǎo)致較長(zhǎng)的延遲

這些解決方案基于共享記憶體資源的多核心處理器。在處理來(lái)自證券交易所的資料饋送時(shí)時(shí),確定性延遲至關(guān)重要,存取共用記憶體絕不是一個(gè)最佳方式

在演算法交易領(lǐng)域的最新進(jìn)展是導(dǎo)入了一些更低延遲的解決方案,其中最佳的方式是使用現(xiàn)場(chǎng)可程式邏輯閘陣列(FPGA)搭建的客制硬體。這些設(shè)備可說(shuō)是硬編碼ASIC的極致性能和CPU靈活度之間的橋梁。透過(guò)FPGA提供大量的資源且可加以配置,使其得以較軟體解決方案更大幅縮短往返交易延遲。

采用FPGA途徑處理訂單

除了靈活之外,F(xiàn)PGA還可以進(jìn)行編程設(shè)計(jì),以便自行處理資料擷取、風(fēng)險(xiǎn)評(píng)估與訂單處理等關(guān)鍵任務(wù)。這種自給自足的特性使其較軟體演算法更快、更可靠。讓基于FPGA的解決方案能夠大幅提升電子交易性能的關(guān)鍵因素是:它們能讓過(guò)去由軟體處理的過(guò)程直接在FPGA上進(jìn)行。

 

圖2:采用FPGA途徑處理訂單的配置

相較于軟體演算法,F(xiàn)GPA的配置具有這些優(yōu)勢(shì),原因就在于以下的功能被分流到FPGA:

處理TCP/IP訊息

解碼FAST或類似的交易專用協(xié)定,以及擷取相關(guān)資料

進(jìn)行交易決策,而不至于導(dǎo)致任何基于核心的中斷延遲

透過(guò)管理FPGA中的訂單簿(order book)和交易記錄以降低風(fēng)險(xiǎn)

憑藉著這些優(yōu)勢(shì),基于FPGA的解決方案能夠提供超低延遲的資料饋送處理功能,以及更快的訂單執(zhí)行和風(fēng)險(xiǎn)評(píng)估速度。它們還能實(shí)現(xiàn)最高的每瓦功耗性能,盡可能地降低能耗和熱量要求。FPGA解決方案的另一個(gè)優(yōu)勢(shì)是透過(guò)擴(kuò)展部署‘FPGA現(xiàn)場(chǎng)’配置的能力。

組成基于FPGA途徑關(guān)鍵之一在于巧妙地整合4倍資料率(QDR)記憶體,實(shí)現(xiàn)確定性記憶體存取速率以及經(jīng)過(guò)最佳化的VHDL程式碼。在FPGA的記憶體中需要維護(hù)的兩個(gè)最重要資料集是用于維護(hù)訂單簿的證券資訊和用于分析風(fēng)險(xiǎn)的資料與時(shí)間戳記。二者均對(duì)快取記憶體提出了不同的要求。資料封包的資料與時(shí)間戳記對(duì)于保存交易決策的準(zhǔn)確記錄、重現(xiàn)過(guò)去的事件非常重要。這些記錄所需的精密度達(dá)數(shù)十奈秒,這使得記憶體延遲(即為記憶體提供位址以及從資料匯流排取得資料之間的時(shí)間延遲)更加至關(guān)重要。

另一個(gè)資料集-訂單簿-是所有訂單的資料庫(kù),包含交易系統(tǒng)需要維護(hù)的符號(hào)和價(jià)格。這個(gè)資料庫(kù)通常根據(jù)交易客戶感興趣的證券而包含所有金融工具的一部份。訂單簿必須根據(jù)從客戶而來(lái)的資訊同步進(jìn)行更新與存取。訂單簿中的相關(guān)資料與從交易所收到的資料進(jìn)行比較,然后再根據(jù)交易演算法做出買、賣或保留金融工具的決策。

由于來(lái)自證券交易所的輸入資料串流并不是以確定順序方式接收的,因此,執(zhí)行交易策略的記憶體存取也是隨機(jī)的,以小量資料的叢發(fā)進(jìn)行,并以最低延遲獲取資料。以記憶體術(shù)語(yǔ)來(lái)說(shuō),執(zhí)行這種隨機(jī)存取的能力是由一種名為隨機(jī)交易率(RTR)的指標(biāo)衡量的。RTR表示記憶體在一定時(shí)間內(nèi)可支援的隨機(jī)讀取或?qū)懭胱鳂I(yè)次數(shù),其衡量指標(biāo)是:交易次數(shù)/秒的倍數(shù)(例如MT/s或GT/s)。在大多數(shù)記憶體中,隨機(jī)存取時(shí)間是由周期延遲(tRC)定義。最大的RTR約為tRC的倒數(shù)(1/tRC)。

快取記憶體的選擇經(jīng)常限制基于FPGA的硬體能力。大多數(shù)的FPGA只采用傳統(tǒng)基于DRAM的記憶體,因?yàn)樗鼈兙邆涑杀緝?yōu)勢(shì),而且密度較高。但是,這些記憶體極其緩慢,而且容易發(fā)生軟錯(cuò)誤??紤]到這些系統(tǒng)每秒的交易量,我們不能犧牲速度和可靠性。

從純技術(shù)的角度探討兩種運(yùn)用最廣泛的DRAM:同步DRAM(SDRAM)和低延遲DRAM(RLDRAM)。過(guò)去10年來(lái),SDRAM的tRC并沒(méi)有很大變化(將來(lái)可能也不會(huì)),一直維持在48ns左右,對(duì)應(yīng)21 MT/s RTR,其它基于DRAM的記憶體設(shè)計(jì)則以犧牲密度改進(jìn)了tRC。例如,RLDRAM 3的tRC為8ns,對(duì)應(yīng)于125MT/s RTR?;旧?,DRAM是為那些依序存取確定性運(yùn)算演算法而最佳化的,但高頻交易并非采用這樣的方式。[!--empirenews.page--]

一個(gè)更好的選擇是同步 SRAM。雖然基于DRAM的記憶體具備較高的記憶體容量,但它們無(wú)法滿足交易平臺(tái)使用快取記憶體的延遲和性能要求。數(shù)十年來(lái),SRAM一直是大多數(shù)高性能應(yīng)用的首選記憶體?;赟RAM的解決方案可能比一般基于DRAM的解決方案更快高達(dá)24倍。

在SRAM中,QDR系列SRAM的性能比任何類型的記憶體都要高。QDR SRAM是專為突發(fā)和隨機(jī)存取而設(shè)計(jì)的。藉由一個(gè)讀寫(xiě)專用埠,QDR記憶體是訂單簿管理等讀寫(xiě)均衡作業(yè)的理想選擇。例如賽普拉斯半導(dǎo)體(Cypress Semiconductor)最新推出的QDR SRAM——QDR-IV,更進(jìn)一步提供了兩個(gè)雙向埠。當(dāng)讀寫(xiě)作業(yè)不均衡時(shí),例如當(dāng)查詢TCP/IP處理和資料串流處理等操作時(shí),采用QDR-IV將會(huì)非常高效。

下表比較各種核心記憶體技術(shù)采用的解決方案:

 

表1:各種核心記憶體技術(shù)方案的特性比較

QDR-IV記憶體的RTR為2132MT/s,延遲為7.5ns。考慮到隨機(jī)存取性能對(duì)于FPGA解決方案的重要性,這些記憶體有助于大幅縮短交易的總延遲。該款SRAM較高的作業(yè)頻率和雙埠作業(yè)特性,可為那些要求嚴(yán)苛的網(wǎng)路環(huán)境搭建超低延遲的資料封包緩沖區(qū)。此外,QDR-IV無(wú)與倫比的RTR可加快需要即時(shí)查詢或其它資料結(jié)構(gòu)的客制應(yīng)用。而DRAM則更適合儲(chǔ)存資料大量的資料記錄資訊,而高性能的SRAM可與其配合作業(yè),儲(chǔ)存延遲關(guān)鍵型路徑的運(yùn)算查詢或緩存資料。

各種記憶體的RTR性能比較

 

圖3:各種記憶體技術(shù)的RTR比較 (來(lái)源:Cypress)

除了RTR和延遲優(yōu)勢(shì)之外,很多SRAM還包含一系列新的特性,例如可實(shí)現(xiàn)高可靠性的錯(cuò)誤糾正碼(ECC)、晶片上終端(ODT)以及可提高訊號(hào)完整性的偏斜校正(De-skew)訓(xùn)練。

有鑒于幾奈秒所能帶來(lái)的競(jìng)爭(zhēng)優(yōu)勢(shì),在打造一個(gè)基于FPGA的客制化解決方案時(shí),所采用的記憶體類型也是一項(xiàng)關(guān)鍵因素。由于QDR記憶體所具備的固有優(yōu)勢(shì),很多FPGA廠商正為其最新一代基于FPGA的高性能交易解決方案導(dǎo)入QDR記憶體。相較于那些使用傳統(tǒng)記憶體解決方案的交易員,采用這些FPGA的交易員擁有先發(fā)制人的優(yōu)勢(shì)。QDR記憶體還獲得了Altera、Xilinx等業(yè)界主要FPGA供應(yīng)商的支持。Altera最新發(fā)布的Arria 10 FPGA即可支援QDR-IV。預(yù)計(jì)Xilinx等者很快也會(huì)宣布在其產(chǎn)品中提供類似的支援。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉