當(dāng)前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]簡單來講在現(xiàn)代計算機(jī)環(huán)境下的日常使用中,整點運算性能影響如壓縮與解壓縮,計算機(jī)進(jìn)程調(diào)度,編譯器語法分析,計算機(jī)電路輔助設(shè)計,游戲AI處理類型的操作。而浮點運算單元主要影響CPU的科學(xué)計算性能,如流體力

簡單來講在現(xiàn)代計算機(jī)環(huán)境下的日常使用中,整點運算性能影響如壓縮與解壓縮,計算機(jī)進(jìn)程調(diào)度,編譯器語法分析,計算機(jī)電路輔助設(shè)計,游戲AI處理類型的操作。

而浮點運算單元主要影響CPU的科學(xué)計算性能,如流體力學(xué),量子力學(xué)等,而更貼近我們?nèi)粘D芤姷降膽?yīng)用就是多媒體相關(guān)的應(yīng)用,如音視頻的編解碼,圖像處理等操作。


ZEN的核心架構(gòu)圖

而我們通常在測試CPU時使用如Sandra 2018,Super Pi,wPrime,F(xiàn)ritz Chess Benchmark,WinRAR,7-zip,x264 FHD Benchmark等軟件,這些測試軟件就能夠體現(xiàn)處理器理論整數(shù)運算單元和浮點運算單元性能的。

在具體使用的軟件中,如壓縮解壓軟件WinRAR,7-zip,程序員使用的GCC編譯器,網(wǎng)絡(luò)路由的選擇,游戲中的AI以及我們?nèi)粘T囉貌僮飨到y(tǒng)調(diào)度都是整點運算。而我們在使用lightroom等圖像處理軟件,語音識別,視頻的編解碼,以及科學(xué)家使用Matlab進(jìn)行科學(xué)計算時都用到了浮點運算能力。

對于玩家最關(guān)心的就是這些到底對游戲有什么影響。首先CPU承擔(dān)著整個計算機(jī)中的任務(wù)進(jìn)程分配問題,所以如果游戲代碼優(yōu)化不好,進(jìn)行頻繁的Draw Call操作,會非常消耗CPU任務(wù)調(diào)度資源。同時現(xiàn)在游戲AI做操作行為判斷時,也是使用整點運算單元的。而現(xiàn)在很多游戲加入了防盜版機(jī)制,在運行游戲時頻繁的加解密會消耗浮點運算性能。所以有朋友使用較老的硬件運行新游戲時,會非常影響游戲運行幀率。

所以整點運算性能和浮點運算性能都反映了CPU處理數(shù)據(jù)的能力。但是整點運算性能還反映了控制程序流的的能力。

在計算機(jī)中,定點數(shù)不一定是整數(shù),而浮點數(shù)也不一定是小數(shù)。在計算機(jī)中,定點數(shù)是指小數(shù)點固定的數(shù),而浮點數(shù)是指小數(shù)點不固定的數(shù)。在計算機(jī)中采用IEEE 754標(biāo)準(zhǔn)進(jìn)行浮點數(shù)的存儲的,他可以精確的的表示某一個數(shù)據(jù)。

在早期浮點運算單元并沒有一開始就加入到CPU設(shè)計中的。但是在計算機(jī)中,運算單元都是邏輯電路,由浮點數(shù)的定義我們可以知道,在早期僅有整點數(shù)運算單元而不帶有浮點數(shù)處理單元的 處理器上,處理浮點數(shù)的階碼、尾數(shù)的計算以及規(guī)格化就成為了很困難的事情,導(dǎo)致早期CPU在科學(xué)計算中依舊非常的緩慢。所以Intel就設(shè)計了獨立于8086和8088處理器外的8087數(shù)學(xué)輔助處理器。到后來隨著計算機(jī)不再是科學(xué)家的工具,也逐漸進(jìn)入了公眾視野,Intel在80486DX處理器核心內(nèi)首次集成了浮點運算單元。


Intel 8087協(xié)處理器


Intel Core i7 7700k處理器的CPU-Z信息

早期的Intel x87系列數(shù)學(xué)運算輔助處理器只是作為一個提高浮點運算速度的處理器,而在現(xiàn)代處理器中,浮點計算功能會通過SIMD(Single Instruction Multiple Data,單指令多數(shù)據(jù)流)的技術(shù)實現(xiàn)并行計算能力。在打開CPU-Z后,開支持指令集一欄可以看到,現(xiàn)代處理器帶有的SSE指令集就有處理浮點運算的能力。而在之后的發(fā)展中,也逐漸引入了SSE2,SSE3,SSE4,AVX,F(xiàn)MA等更加適用于現(xiàn)代軟件開發(fā)的擁有強(qiáng)大浮點運算能力的指令集。

那接下來就有問題了,現(xiàn)代處理器加入了很多高度并行化的浮點運算單元,相較以往單純CPU的浮點運算能力有了非常大的飛躍,但是相對于現(xiàn)代的圖形處理器來說,這么些浮點運算能力是不夠看的,那為什么不像幾十年前一樣不在CPU中集成浮點運算單元呢??


Nvidia Geforce 256核心照片

對于這個問題,首先大家要了解為什么會獨立出來圖形處理器這種專有硬件的。在20世紀(jì)90年代,計算機(jī)多媒體逐漸開始興盛起來,在1998年到1999年間,Intel和AMD的CPU中已經(jīng)擁有了SSE或3DNow!這樣的SIMD浮點運算指令集。但是隨著電子游戲的發(fā)展,計算機(jī)的使用者對于計算機(jī)的圖形性能有了更高的要求,但是此時的CPU內(nèi)浮點運算性能并不滿足需求,所以在此后圖形處理器開始負(fù)擔(dān)更多的浮點運算工作。


NvidiaCUDA核心工作流程

但圖形處理器的使用者看到如此高效能的浮點運算處理器的時候就在思考如何能讓這類設(shè)備承擔(dān)除了圖形計算之外的浮點計算性能。乘著GPGPU(General-purpose GPU)概念的逐漸興起,顯卡上的統(tǒng)一渲染架構(gòu)的出現(xiàn),也讓這種計算方式真正成為現(xiàn)實。Nvidia在2007年正式發(fā)布了CUDA并行計算平臺。之后也出現(xiàn)了如openCL的通用計算API(應(yīng)用程序編程接口)。

到此我們突然發(fā)現(xiàn),GPU都來搶CPU的浮點運算飯碗了,但為什么CPU非但沒有取消浮點運算單元,反而其浮點運算性能越來越強(qiáng)??


AMD推土機(jī)架構(gòu)示意圖

其實并不是沒有人想到這樣的情況,而是已經(jīng)與產(chǎn)品這么做了,就是AMD的推土機(jī)架構(gòu)。這個架構(gòu)放棄了之前的一個核心就由一套整數(shù)運算單元和浮點運算單元的組合,而是讓兩個核心共享一個浮點運算單元組成一個簇,而AMD將這種架構(gòu)叫做CMT,又稱為群集多線程技術(shù),之后又將相對與Intel有優(yōu)勢的GPU核心集成進(jìn)CPU中,產(chǎn)生了APU處理器。

AMD當(dāng)時還為此成立了HSA基金會,為解決CPU和GPU的內(nèi)存統(tǒng)一尋址問題,也提出了hUMA技術(shù)并用在了Sony的PS4游戲機(jī)上。


Sony Playstation 4主機(jī),CPU和GPU共享8GB GDDR5內(nèi)存

那為什么廠商做了這么多還是做不到用大規(guī)模的GPU取代CPU中的浮點運算單元呢?運算精度才是重點。CPU中的浮點運算單元是為了更高精度浮點運算準(zhǔn)備的。如在最新Intel處理器中的AVX指令集可以處理512位擴(kuò)展數(shù)據(jù),這樣大大提升了計算精度和速度。而GPU中的處理器都是為高度并行計算而設(shè)計的結(jié)構(gòu)相對簡單的核心,這些核心每一個都是SIMD處理器,但是能夠處理的數(shù)據(jù)精度是有限的,在Nvidia以及AMD圖形處理器上支持的數(shù)據(jù)精度大多是單精度和雙精度浮點計算(FP32和FP64),甚至隨著機(jī)器學(xué)習(xí),深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)的流行,最新的圖形處理器甚至支持了半精度浮點運算(FP16)。

其次,由于在計算精度上相較于CPU中的浮點運算單元不高,所以在這些處理器中也沒有內(nèi)置數(shù)據(jù)校驗和數(shù)據(jù)補(bǔ)償處理的運算單元。所以對于使用GPU進(jìn)行科學(xué)計算的人,需要在編程階段就避免這樣的問題。同時CPU和GPU在設(shè)計上就是非常不同的,CPU的浮點單元個數(shù)很少,但是單個浮點運算單元所提供的性能是很強(qiáng)的。而GPU中是用過海量的SIMD單元堆砌出來的浮點運算能力。在CPU設(shè)計時,還需要設(shè)計大量的多級緩存來提高CPU的運算速度。而GPU中通常只為這些SIMD處理單元內(nèi)置不多的緩存,而提供大量的內(nèi)存(顯存)。

所以綜合上面的分析,我們可以得出的結(jié)論是雖然GPU擁有更強(qiáng)大的浮點運算性能,但是限于其計算單元的設(shè)計,統(tǒng)一內(nèi)存架構(gòu)的設(shè)計,其還是不能完全取代CPU中的浮點運算核心。CPU中的整點運算單元在肩負(fù)著如壓縮解壓,編譯器編譯程序,網(wǎng)絡(luò)路由,控制程序流等任務(wù)同時,其浮點運算核心也依舊在處理著圖像處理,科學(xué)計算等需要更高精度計算的任務(wù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉