CUDA command Profiler
這里我不使用默認(rèn)設(shè)置:
timestamp gpustarttimestamp gpuendtimestamp gridsize threadblocksize dynsmemperblock stasmemperblock regperthread memtransferdir memtransfersize memtransferhostmemtype streamid localblocksize
將上面的內(nèi)容添加到一個(gè)新的文本文件中。假設(shè)這個(gè)文件叫prof.cfg
假設(shè)你的程序是a.exe
用下面的命令啟動(dòng)執(zhí)行
CUDA_PROFILE=1?CUDA_PROFILE_CONFIG=prof.cfg?./a.exe
此時(shí)會(huì)有一個(gè)文件產(chǎn)生在你的目錄下,打開看看吧。