當(dāng)前位置:首頁 > 芯聞號 > 美通社全球TMT
[導(dǎo)讀]北京2024年7月2日 /美通社/ -- AIGC作為當(dāng)下最火的技術(shù)話題,其業(yè)務(wù)流程涉及到數(shù)據(jù)的采集、處理、訓(xùn)練、推理和歸檔五個階段,每個階段都面臨著不同的存儲需求和挑戰(zhàn)。隨著數(shù)據(jù)量的爆炸性增長,特別是隨著多模態(tài)數(shù)據(jù)的快速增長,對存儲系統(tǒng)的擴(kuò)展性和服務(wù)兼容性也提出了新的挑戰(zhàn)。 ...

北京2024年7月2日 /美通社/ -- AIGC作為當(dāng)下最火的技術(shù)話題,其業(yè)務(wù)流程涉及到數(shù)據(jù)的采集、處理、訓(xùn)練、推理和歸檔五個階段,每個階段都面臨著不同的存儲需求和挑戰(zhàn)。隨著數(shù)據(jù)量的爆炸性增長,特別是隨著多模態(tài)數(shù)據(jù)的快速增長,對存儲系統(tǒng)的擴(kuò)展性和服務(wù)兼容性也提出了新的挑戰(zhàn)。

在2024年數(shù)據(jù)基礎(chǔ)設(shè)施技術(shù)峰會上,浪潮信息分布式存儲產(chǎn)品線架構(gòu)師Lance Sun博士發(fā)表了題目為"高效數(shù)據(jù)編排,加速釋放數(shù)據(jù)潛能"的主旨演講,詳細(xì)討論了高效數(shù)據(jù)編排對于解決上述挑戰(zhàn),并釋放數(shù)據(jù)潛能的重要性。

浪潮信息Lance SUN:高效數(shù)據(jù)編排,加速數(shù)據(jù)在AI場景釋放潛能


AIGC帶來的存儲挑戰(zhàn)凸顯了數(shù)據(jù)的重要性

首先,Lance Sun博士詳細(xì)介紹了AIGC對存儲提出的需求和挑戰(zhàn),讓我們對AIGC的業(yè)務(wù)流程和對數(shù)據(jù)存儲的需求有了更深入的認(rèn)識。

第一個是巨量多模態(tài)數(shù)據(jù)的挑戰(zhàn)。很多大語言模型都采用了來自Common Crawl的數(shù)據(jù)集,這個組織在過去17年已經(jīng)采集了2500億網(wǎng)頁,現(xiàn)在還在持續(xù)收集更多。IDC預(yù)測,到2025年,全球數(shù)據(jù)總量將超過175ZB,這種增長對存儲系統(tǒng)的多樣性和擴(kuò)展性帶來了挑戰(zhàn)。

第二個挑戰(zhàn)是對超大讀寫帶寬的需求。在訓(xùn)練階段,checkpoint的管理是關(guān)鍵,良好的存儲性能應(yīng)在12分鐘內(nèi)完成checkpoint的讀寫操作,確保不拖慢整個訓(xùn)練過程。同時,由于GPU成本高昂,更高的存儲性能可以減少顯卡的等待時間,減少資源浪費(fèi)。

第三個挑戰(zhàn)是對于讀寫IOPS的更高需求。千億級文件的快速訪問對IOPS有著極高要求,在某些采用shuffle洗牌策略的訓(xùn)練過程,如果IOPS性能不夠,會導(dǎo)致元數(shù)據(jù)服務(wù)器產(chǎn)生大量的通信阻塞,同時會造成GPU集群等待,影響訓(xùn)練效率,造成資源浪費(fèi)。

第四個挑戰(zhàn)在于數(shù)據(jù)全生命周期管理。在數(shù)據(jù)清洗和標(biāo)注算法日益發(fā)展的今天,數(shù)據(jù)作為企業(yè)的核心資產(chǎn),企業(yè)需要對數(shù)據(jù)進(jìn)行長期保存。于是,如何將數(shù)據(jù)以較低的成本安全存儲起來,也成為更重要的課題。

為了說明高質(zhì)量數(shù)據(jù)的重要性,Lance Sun博士還提到了ImageNet數(shù)據(jù)集。作為高質(zhì)量的數(shù)據(jù)集,它極大地推動了深度學(xué)習(xí)算法的發(fā)展。2012年,AlexNet在ImageNet挑戰(zhàn)賽上取得成功,這不僅驗證了深度學(xué)習(xí)模型處理復(fù)雜視覺任務(wù)的能力,也激發(fā)了后續(xù)研究和多種新算法的產(chǎn)生。

由此可見,數(shù)據(jù)的采集和高質(zhì)量的數(shù)據(jù)清洗,對AI的發(fā)展至關(guān)重要的。過去十多年的時間里,語言類模型的數(shù)據(jù)集規(guī)模,模型參數(shù)規(guī)模,AI芯片計算能力和數(shù)據(jù)存儲需求都發(fā)生了顯著變化。

AIGC在數(shù)據(jù)歸集面臨的挑戰(zhàn)與浪潮信息的解決之道

在數(shù)據(jù)存儲方面,隨著數(shù)據(jù)集規(guī)模和多樣性增加,越發(fā)依賴更大規(guī)模的存儲服務(wù)器集群。Lance Sun博士介紹稱,很多傳統(tǒng)行業(yè)都積累了大量數(shù)據(jù),這些數(shù)據(jù)需要在不同的存儲系統(tǒng)間進(jìn)行高效的數(shù)據(jù)流轉(zhuǎn)以支持AI和大數(shù)據(jù)分析,這在現(xiàn)有的存儲架構(gòu)中造成了數(shù)據(jù)流動的效率問題。

事實上,多數(shù)據(jù)中心和異構(gòu)存儲環(huán)境中數(shù)據(jù)遷移面臨很多挑戰(zhàn),對此,Lance Sun博士總結(jié)了三點(diǎn):

第一點(diǎn),數(shù)據(jù)訪問分散。數(shù)據(jù)遷移的過程對用戶來說是不透明的,嚴(yán)重依賴第三方遷移軟件,而且受網(wǎng)絡(luò)波動和存儲性能的影響,容易導(dǎo)致數(shù)據(jù)遷移時間過長,增加操作的不確定性和復(fù)雜性。

第二點(diǎn),空間和時間成本的浪費(fèi)。遷移過程常用糾刪或副本機(jī)制來提高可靠性,但這會導(dǎo)致時間和空間成本大幅增加。此外,這一過程還嚴(yán)重依賴于第三方遷移軟件的性能,不同存儲平臺的使用容量差異可能導(dǎo)致數(shù)據(jù)副本遷移時出現(xiàn)容量不均衡問題。

第三點(diǎn),運(yùn)維復(fù)雜性增加。由于不同存儲產(chǎn)品的特性差異,使得存儲廠商各自發(fā)展出不同的運(yùn)維管理系統(tǒng),數(shù)據(jù)的頻繁遷移或長時間遷移導(dǎo)致數(shù)據(jù)管理混亂,導(dǎo)致運(yùn)維時間和成本顯著增加。

為了應(yīng)對多數(shù)據(jù)中心和異構(gòu)存儲環(huán)境中數(shù)據(jù)管理和遷移挑戰(zhàn),浪潮信息存儲進(jìn)行了大量工作,基于AS13000構(gòu)建了一套全局?jǐn)?shù)據(jù)管理平臺。

浪潮信息Lance SUN:高效數(shù)據(jù)編排,加速數(shù)據(jù)在AI場景釋放潛能


在全局?jǐn)?shù)據(jù)管理平臺的最上層,通過一個統(tǒng)一的全局命名空間提供用戶視角的完全統(tǒng)一,確保所有數(shù)據(jù)都可以通過一個統(tǒng)一的入口進(jìn)行訪問和管理,極大地簡化了數(shù)據(jù)操作流程。

第二個層面,系統(tǒng)支持多種標(biāo)準(zhǔn)協(xié)議接口,包括Linux的NFS、對象存儲的S3、大數(shù)據(jù)的HDFS、容器化的CSI接口以及Windows環(huán)境下的SMB協(xié)議。這樣的設(shè)計使得平臺能夠廣泛兼容各種應(yīng)用和環(huán)境,滿足不同場景的需求。

最后一層,AS13000引入了智能數(shù)據(jù)編排和緩存系統(tǒng)。智能數(shù)據(jù)編排引擎利用人工智能算法自動讓數(shù)據(jù)在熱、溫、冷存儲之間的流轉(zhuǎn),優(yōu)化數(shù)據(jù)存儲效率。而高效的緩存系統(tǒng)可以為短期內(nèi)頻繁使用的極熱數(shù)據(jù)提供快速訪問能力,加速數(shù)據(jù)的流轉(zhuǎn)。

最終,用戶可以基于AS13000的全局?jǐn)?shù)據(jù)管理平臺實現(xiàn)數(shù)據(jù)在任何地點(diǎn),任何時間以任何類型可視可管可流動。

Lance Sun博士還指出了市場上一些方案的不足。比如,一些方案在數(shù)據(jù)采集階段使用了混閃對象存儲,而在訓(xùn)練階段使用全閃存儲技術(shù)。然而,數(shù)據(jù)在兩個存儲集群的流轉(zhuǎn)非常低效,數(shù)遷移過程中,經(jīng)常由于網(wǎng)絡(luò)波動造成文件斷傳。

相比之下,AS13000由于在一套系統(tǒng)內(nèi)引入了多協(xié)議融合互通技術(shù),直接省去了數(shù)據(jù)遷移的過程,大大提高了訓(xùn)練數(shù)據(jù)的準(zhǔn)備效率,以確保數(shù)據(jù)在訓(xùn)練和處理階段的高效率和低延遲訪問。 

AIGC存儲的技術(shù)展望

AIGC技術(shù)的影響力日益擴(kuò)大,各大存儲廠商對此高度重視,存儲系統(tǒng)的創(chuàng)新和演進(jìn)均將AIGC作為核心考量。在演講的最后,Lance Sun博士詳細(xì)介紹了浪潮信息存儲在AIGC領(lǐng)域的未來發(fā)展關(guān)鍵方向和技術(shù)動向,并表示浪潮存儲將持續(xù)深度融入AI生態(tài)系統(tǒng)。

在行業(yè)技術(shù)方面,GPU直連存儲技術(shù)已在眾多文件系統(tǒng)層面廣泛應(yīng)用,其在大文件讀寫方面的性能表現(xiàn)尤為出色。浪潮信息與英偉達(dá)及業(yè)界廠商緊密合作,致力于推動完整技術(shù)體系和標(biāo)準(zhǔn)的落地。

在行業(yè)基準(zhǔn)評測方面,浪潮信息積極參與權(quán)威的AI性能測試基準(zhǔn)—MLperf Storage評測,并在多項負(fù)載性能評測中表現(xiàn)優(yōu)異,幫助企業(yè)選擇最適用于AI場景的存儲系統(tǒng)。

存儲的安全問題同樣不容忽視。英偉達(dá)在2024年的GTC大會上提到包括加密計算在內(nèi)的多種安全技術(shù),而在存儲層面,同樣需要提供強(qiáng)有力的數(shù)據(jù)保護(hù)措施。浪潮信息存儲正在多租戶權(quán)限隔離、防勒索等數(shù)據(jù)保護(hù)技術(shù)領(lǐng)域進(jìn)行深入探索。

談到未來發(fā)展,Lance Sun博士表示,存儲性能的持續(xù)優(yōu)化是浪潮信息存儲的核心目標(biāo)。浪潮信息將繼續(xù)通過軟硬件結(jié)合的持續(xù)創(chuàng)新,力求在智算產(chǎn)業(yè)和AI產(chǎn)業(yè)中實現(xiàn)快速落地,推動整個行業(yè)的進(jìn)步。

2024年,AIGC依然是最熱技術(shù)話題,其迅猛的發(fā)展速度和廣闊的應(yīng)用前景吸引了眾多關(guān)注和創(chuàng)新力量。憑借在數(shù)據(jù)存儲領(lǐng)域的持續(xù)創(chuàng)新和深耕,浪潮信息正站在這場技術(shù)革新的前沿。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉