當前位置:首頁 > 廠商動態(tài) > 廠商文章
[導讀]像半導體設計這樣如此具有挑戰(zhàn)性的工作并不多見。在顯微鏡下,NVIDIA H100 Tensor Core GPU(上圖)這樣最先進的芯片看起來就像一個精心規(guī)劃的大都市,由數(shù)百億個晶體管組成,把它們連接起來的線比人的頭發(fā)絲還細 1 萬倍。

芯片工程師展示了一個高度專業(yè)化的行業(yè)如何使用NVIDIA NeMo 來定制大語言模型,以獲得競爭優(yōu)勢。

10 月31 日,NVIDIA發(fā)布的一篇研究論文描述了生成式AI 如何助力芯片設計,后者是當今最復雜的工程工作之一。

這項工作展示了高度專業(yè)化領域的公司如何利用內(nèi)部數(shù)據(jù)訓練大語言模型,從而開發(fā)提高生產(chǎn)力的AI 助手。

像半導體設計這樣如此具有挑戰(zhàn)性的工作并不多見。在顯微鏡下,NVIDIA H100 Tensor Core GPU(上圖)這樣最先進的芯片看起來就像一個精心規(guī)劃的大都市,由數(shù)百億個晶體管組成,把它們連接起來的線比人的頭發(fā)絲還細1 萬倍。

多個工程團隊進行協(xié)作,需要長達兩年的時間才能構建出這樣一個數(shù)字化超級大都市。

一些小組定義芯片的整體架構,一些小組負責各種超小型電路的設計與布局,還有一些小組負責測試工作。每項工作都需要采取專門的方法、軟件程序和計算機語言。

大語言模型廣闊的前景

該論文的主要作者、NVIDIA 研究總監(jiān)Mark Ren 表示:“我相信,隨著時間的推移,大語言模型將全面助力所有流程?!?

在同日舉行的國際計算機輔助設計會議上,NVIDIA 首席科學家Bill Dally 發(fā)表主題演講并公布了這篇論文。這個年度盛會每年都會吸引數(shù)百名電子設計自動化(EDA)領域的工程師參加。

此次會議在舊金山舉行。Dally 在會上表示:“這標志著在將大語言模型用于復雜的半導體設計方面邁出了重要一步。這項工作表明,即使高度專業(yè)化的領域也可以利用內(nèi)部數(shù)據(jù)來訓練極具價值的生成式AI 模型?!?

ChipNeMo 浮出水面

這篇論文詳細介紹了NVIDIA 工程師如何創(chuàng)建名為ChipNeMo 的定制大語言模型,供內(nèi)部使用。該模型使用公司內(nèi)部數(shù)據(jù)進行訓練并生成和優(yōu)化軟件,以更好地協(xié)助人類設計師。

Ren 在EDA 領域從業(yè)超過20 多年,他表示,從長遠來看,工程師們希望生成式AI 能夠用于芯片設計的各個階段,從而大幅提升整體生產(chǎn)力。

在針對可能的使用場景對NVIDIA 工程師進行調(diào)研之后,研究團隊一開始選擇了三個場景:聊天機器人、代碼生成器和分析工具。

初始用例

維護已知bug 的更新描述需要耗費大量時間,而上述分析工具中的后者能夠實現(xiàn)此類任務的自動化,并已得到廣泛的采用。

一個聊天機器人原型可以回答有關GPU 架構和設計的問題,并且已經(jīng)幫助許多工程師在早期測試中快速找到技術文檔。

代碼生成器將幫助設計者編寫芯片設計軟件。

一個正在開發(fā)中的代碼生成器(如上圖所演示)已經(jīng)用兩種芯片設計師專用語言創(chuàng)建了大約10-20 行軟件的片段。它將與現(xiàn)有工具集成,為工程師們提供一個方便的助手來進行設計。

使用NVIDIA NeMo 定制AI 模型

這篇論文主要關注該團隊收集設計數(shù)據(jù)并使用這些數(shù)據(jù)創(chuàng)建專門的生成式AI 模型,這個過程可以移植到任何行業(yè)。

作為起點,該團隊選擇了一個基礎模型,并使用NVIDIA NeMo 對其進行了定制。作為NVIDIA AI Enterprise 軟件平臺的一部分,NVIDIA NeMo 是一個用于構建、定制和部署生成式AI 模型的框架。定的NeMo 模型具有430 億個參數(shù),這衡量了它對模式的理解力。它使用超過一萬億個文本和軟件中的token、單詞和符號進行了訓練。

ChipNeMo 提供了一個技術團隊如何用自己的數(shù)據(jù)改進預訓練模型的示例。

然后,該團隊在兩輪訓練中完善了該模型。第一輪使用了相當于大約240 億個token 的內(nèi)部設計數(shù)據(jù),第二輪使用了約13 萬個對話和設計示例。

這項工作是半導體行業(yè)進行生成式AI 概念研究和印證的幾個例子之一, 這一趨勢剛剛開始在實驗室興起。

分享經(jīng)驗

Ren 的團隊學到的一個最重要的經(jīng)驗就是定制大語言模型的重要性。

芯片設計任務中,只有130 億個參數(shù)的定制ChipNeMo 模型的性能達到或超過了更大的通用大語言模型(例如包含700 億個參數(shù)的LLaMA2)。在某些使用場景中,ChipNeMo 模型甚至好很多。

他補充道,在這一過程中,用戶需要謹慎地確定他們收集什么數(shù)據(jù)以及如何清理數(shù)據(jù)以用于訓練。

最后,Ren 建議用戶及時了解可以加快和簡化工作的最新工具。

NVIDIA Research 在全球各地擁有數(shù)百名科學家和工程師,專注于AI、計算機圖形學、計算機視覺、自動駕駛汽車、機器人學等領域。近期的其它半導體項目包括使用AI 設計更小、更快的電路,以及優(yōu)化大型模塊的布局。

希望構建自己的定制大語言模型的企業(yè)現(xiàn)在可以從使用GitHub 和NVIDIA NGC 目錄中的NeMo 框架開始。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉