CUDA

關(guān)注人關(guān)注

我要報(bào)錯(cuò)

加速替代CUDA！摩爾線程開源vLLM-MUSA 加速國產(chǎn)GPU AI

11月5日消息，近日，摩爾線程上線了大語言模型高速推理框架開源項(xiàng)目vLLM的MUSA移植版本，為開發(fā)者提供基于摩爾線程全功能GPU進(jìn)行開源項(xiàng)目MUSA移植的范例。

通信先鋒
2024-11-06

CUDA 摩爾線程
Fortran程序CUDA并行化總結(jié)

摘要：雖然Fortran常用來進(jìn)行科學(xué)計(jì)算，但是面對(duì)計(jì)算量大的程序仍然很耗時(shí)。通常人們用MPI進(jìn)行粗粒度的并行來提高程序的運(yùn)行效率，近年來隨著GPU計(jì)算能力的提高，將程序進(jìn)行細(xì)粒度GPU并行化成為一種趨勢(shì)。文章基于NVIDIA公司的CUDA框架，就Fortran程序向CUDA移植過程中的一些問題進(jìn)行總結(jié)，并給出了相應(yīng)的解決方案。

《物聯(lián)網(wǎng)技術(shù)》雜志
2021-08-22

C Fortran Fortran程序 CUDA
為安培架構(gòu)優(yōu)化，NVIDIA正式發(fā)布CUDA 11工具包

嵌入式分享
2020-05-21

NVIDIA 11 cuda
NVIDIA、蘋果徹底決裂：CUDA不再支持macOS

NVIDIA和蘋果的關(guān)系一直很糟糕，十幾年沒有過合作，現(xiàn)在雙方的最后一絲關(guān)系也破裂了。 NVIDIA今天公布了CUDA并行計(jì)算開發(fā)平臺(tái)的更新規(guī)劃說明，其中特別提到，CUDA 10.2(包括工具包和驅(qū)動(dòng)

充電吧
2019-12-19

NVIDIA 蘋果 macos cuda
攀升i5 9400F/GTX1060：1408個(gè)CUDA核心

這篇文章中，小編將為大家介紹一款游戲電競主機(jī)——攀升i5 9400F/GTX1060。它的具體情況如何呢?一起來看看吧。

智能硬件
2019-11-18

攀升 cuda 攀升i5 9400f/gtx1060
CUDA支持ARM實(shí)現(xiàn)百億億次超算：NVIDIA和ARM的好機(jī)會(huì)？

超級(jí)計(jì)算機(jī)（Supercomputer）通常簡稱超算，在科學(xué)界常被視作一個(gè)國家技術(shù)領(lǐng)軍能力的指標(biāo)，因?yàn)樗軌驗(yàn)锳I、空氣動(dòng)力、大氣科學(xué)、能源科學(xué)等重要技術(shù)的研究提供算力支撐。如今強(qiáng)國之間的競爭已經(jīng)進(jìn)入

充電吧
2019-07-16

NVIDIA ARM 超級(jí)計(jì)算機(jī) cuda
cuda網(wǎng)格的限制

限制于計(jì)算能力有關(guān)。只有一張圖~

充電吧
2019-07-08

cuda
CUDA command Profiler

這里我不使用默認(rèn)設(shè)置：timestamp gpustarttimestamp gpuendtimestamp gridsize threadblocksize dynsmemperblock stas

充電吧
2019-07-08

cuda
CUDA5.5 的環(huán)境變量設(shè)置

為了方便，我寫了這個(gè)文件用于設(shè)置cuda5.5的環(huán)境變量。其中有些環(huán)境變量可能用不到，大家根據(jù)需要修改就是了。 export?CUDA_HOME=/usr/local/cuda-5.5 export

充電吧
2019-07-08

cuda
圖文解說：配置CUDA程序編譯環(huán)境，使得配置的工程能與VS的編譯聯(lián)合使用

首先要安裝 CUDA 8.0 和 VS 2013。最重要的是：請(qǐng)確保你有一張支持CUDA的顯卡。特別注意：希望你的系統(tǒng)是64位系統(tǒng)。如果你是新手，在安裝上面的軟件的時(shí)候，能選擇安裝的內(nèi)容盡可能的都選上

充電吧
2018-10-19

c++ cuda
CUDA和OpenGL互操作的實(shí)現(xiàn)及分析

CUDA和OpenGL互操作的基本方式是使用CUDA生成數(shù)據(jù)，再利用OpenGL在屏幕上繪制出數(shù)據(jù)所表示的圖形。兩者的結(jié)合可以通過使用OpenGL的PBO(像素緩沖區(qū)對(duì)象)或VBO(頂點(diǎn)緩沖區(qū)對(duì)象)兩種方式來實(shí)現(xiàn)。描述了CUDA和OpenGL互操作的步驟并展示了一個(gè)使用PBO的實(shí)例。該實(shí)例運(yùn)行結(jié)果表明，互操作的方式比單純使用OpenGL方式快了7~8倍。

嵌入式硬件
2018-09-24

opengl cuda 總線與接口像素緩沖
GPU/FPGA和CPU有什么關(guān)系？

作為NVIDIA全球GTC大會(huì)中最重要的一站之一，GTC China于9月26日正式登陸北京。本次大會(huì)，教主黃仁勛奉上了一場(chǎng)題為“一個(gè)全新的計(jì)算時(shí)代(A NEW COMPUTING ERA)”的主題演講，并正式發(fā)布了首款可編程推理加速平臺(tái)NVIDIA TensorRT 3、自動(dòng)駕駛開放平臺(tái)NVIDIA DRIVE、首款自主機(jī)器處理器Xavier。同時(shí)，他宣布與阿里、騰訊、百度中國三大云服務(wù)提供商達(dá)成合作協(xié)議，為后者提供人工智能GPU芯片。主題大會(huì)結(jié)束后，教主黃仁勛參加了媒體的見面會(huì)，接受了媒體采訪。

嵌入式動(dòng)態(tài)
2017-09-30

NVIDIA 技術(shù)前沿黃仁勛 cuda
NVIDIA投入CUDA計(jì)劃，迎來在AI市場(chǎng)的大爆發(fā)

過去幾年桌上型電腦(DT)與筆記型電腦(NB)銷售量大幅下滑，英特爾(Intel)的年成長率也下滑至9%，市場(chǎng)展望似乎對(duì)電腦芯片制造商不利，不過就在英特爾CPU銷量持續(xù)下滑的同時(shí)，NVIDIA的GPU卻穩(wěn)步成長，2016年第4季營收甚至大增55%，當(dāng)然這和電腦游戲沒有太大關(guān)系，而是歸功于人工智能(AI)市場(chǎng)的爆發(fā)。

嵌入式動(dòng)態(tài)
2017-09-19

NVIDIA 英特爾 GPU cuda 行業(yè)資訊
詳細(xì)解析眾核多計(jì)算模式系統(tǒng)的構(gòu)建

0 引言在航空航天、醫(yī)療服務(wù)、地質(zhì)勘探等復(fù)雜應(yīng)用領(lǐng)域，需要處理的數(shù)據(jù)量急劇增大，需要高性能的實(shí)時(shí)計(jì)算能力提供支撐。與多核處理器相比，眾核處理器計(jì)算資源密度更高、片

嵌入式硬件
2017-03-16

嵌入式處理器 cuda 眾核處理器

CUDA

加速替代CUDA！摩爾線程開源vLLM-MUSA 加速國產(chǎn)GPU AI

Fortran程序CUDA并行化總結(jié)

為安培架構(gòu)優(yōu)化，NVIDIA正式發(fā)布CUDA 11工具包

NVIDIA、蘋果徹底決裂：CUDA不再支持macOS

攀升i5 9400F/GTX1060：1408個(gè)CUDA核心

CUDA支持ARM實(shí)現(xiàn)百億億次超算：NVIDIA和ARM的好機(jī)會(huì)？

cuda網(wǎng)格的限制

CUDA command Profiler

CUDA5.5 的環(huán)境變量設(shè)置

圖文解說：配置CUDA程序編譯環(huán)境，使得配置的工程能與VS的編譯聯(lián)合使用

CUDA和OpenGL互操作的實(shí)現(xiàn)及分析

GPU/FPGA和CPU有什么關(guān)系？

NVIDIA投入CUDA計(jì)劃，迎來在AI市場(chǎng)的大爆發(fā)

詳細(xì)解析眾核多計(jì)算模式系統(tǒng)的構(gòu)建

相關(guān)標(biāo)簽

關(guān)注此標(biāo)簽的用戶(人)

熱門活動(dòng)

課程視頻