讓生成式AI重塑千行百業(yè),亞馬遜云科技拓展從底層芯片到頂層應(yīng)用的全面布局
亞馬遜云科技(AWS)是云服務(wù)的發(fā)明者,而一年一度的AWS re:Invent大會(huì),也被視為是云服務(wù)行業(yè)的風(fēng)向標(biāo)。隨著近日在美國拉斯維加斯的大會(huì)落幕,亞馬遜云科技也馬不停蹄地展開了re:Invent的中國行活動(dòng),我們也滿懷期待地參與了re:Invent中國行的北京站活動(dòng),并為大家?guī)砥渥钚碌脑品?wù)產(chǎn)品和技術(shù)動(dòng)向。
據(jù)亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建介紹,本次re:Invent大會(huì)上一共發(fā)布了200多項(xiàng)新服務(wù)和功能,以及超過350項(xiàng)持續(xù)的更新。而此次北京站分享的重點(diǎn)落在兩部分:一是從云計(jì)算的底層去重塑這些功能;二是如何利用生成式AI重塑未來。
圖:亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建
重塑云計(jì)算底座,讓計(jì)算更強(qiáng)大
AI為數(shù)據(jù)與計(jì)算帶來更龐大的需求。而在不斷增長的數(shù)據(jù)量以及越來越具挑戰(zhàn)的功耗限制等雙重因素影響之下,全球的數(shù)據(jù)中心與網(wǎng)絡(luò)基礎(chǔ)設(shè)施正面臨著巨大壓力。亞馬遜云科技一方面不斷增加數(shù)據(jù)中心的數(shù)量和分布,另一方面在存儲(chǔ)和計(jì)算的底層技術(shù)上進(jìn)行自研突破創(chuàng)新。
作為全球最大的云服務(wù)商,亞馬遜云科技的數(shù)據(jù)中心數(shù)量比行業(yè)第二名多三倍,服務(wù)數(shù)量多了60%,功能多了40%。
而在存儲(chǔ)方面,Amazon S3已經(jīng)支持了全球數(shù)百萬用戶的各級(jí)存儲(chǔ)需求,但隨著數(shù)據(jù)密集型應(yīng)用增加,在一些應(yīng)用上對(duì)于數(shù)據(jù)訪問的速度提出了更高的要求,客戶可能要達(dá)到每分鐘數(shù)百萬次的數(shù)據(jù)集訪問,每一毫秒的延遲都會(huì)對(duì)其業(yè)務(wù)產(chǎn)生影響。針對(duì)這些用戶對(duì)于高性能存儲(chǔ)的需求,亞馬遜云科技此次推出了全新的高性能對(duì)象存儲(chǔ)——Amazon S3 Express One Zone。
據(jù)悉,Amazon S3 Express One Zone是采用專門設(shè)計(jì)的軟硬件來實(shí)現(xiàn)數(shù)據(jù)加速處理,同時(shí)能夠以一致的毫秒級(jí)延遲處理每分鐘數(shù)百萬次的請(qǐng)求,相比Amazon S3標(biāo)準(zhǔn)存儲(chǔ)快了10倍,同時(shí)請(qǐng)求成本降低了50%。從實(shí)際客戶案例來看,這項(xiàng)新存儲(chǔ)服務(wù)幫助Pinterest提升了10倍以上的寫入速度,并將其機(jī)器學(xué)習(xí)驅(qū)動(dòng)的視覺靈感引擎的總成本降低了40%。
圖:Amazon S3 Express One Zone工作原理
除了存儲(chǔ)外,高性能計(jì)算依賴于高性能的芯片。為了緩解未來基礎(chǔ)設(shè)施的壓力,行業(yè)需要依賴強(qiáng)大的生態(tài)系統(tǒng),在高效、可擴(kuò)展的多核計(jì)算基礎(chǔ)上,打造專用處理的能力。
而為了提高云服務(wù)的能效表現(xiàn),亞馬遜云科技早在幾年前就著手開始自研芯片,包括服務(wù)器級(jí)CPU、專用推理芯片和訓(xùn)練芯片,并且成功將諸多服務(wù)部署在自家高性能計(jì)算芯片上,幫助客戶進(jìn)一步節(jié)約了業(yè)務(wù)成本。
值得一提的是,此次re:Invent大會(huì)上發(fā)布的全新的Amazon Graviton4芯片,該芯片采用了96個(gè)Neoverse V2核心,每個(gè)核心獨(dú)享2MB的L2緩存,內(nèi)存方面提供12個(gè)DDR5-5600通道。相比上一代,Amazon Graviton4的平均性能提升30%,對(duì)某些工作負(fù)載的加速更明顯,數(shù)據(jù)庫應(yīng)用程序速度提升40%,大型Java應(yīng)用程序速度提升45%。
圖:Graviton3和Graviton4
據(jù)陳曉建介紹,基于Amazon Graviton 4的Amazon EC2 R8g實(shí)例的預(yù)覽版已經(jīng)推出。而基于Amazon Graviton3的Amazon EC2 C7g、M7g、R7g實(shí)例在亞馬遜云科技中國(北京)區(qū)域和中國(寧夏)區(qū)域也已經(jīng)正式可用,將為中國客戶帶來提供更高性能、更快內(nèi)存,以及更加節(jié)能的體驗(yàn)。
圖:EC2 R8g實(shí)例
推進(jìn)無服務(wù)器服務(wù)創(chuàng)新,讓云服務(wù)更易用
對(duì)于絕大多數(shù)客戶而言,無服務(wù)器(Serverless)提供了更好的成本效率。客戶可以在業(yè)務(wù)高峰時(shí)拓展更多資源,而在低谷時(shí)降低資源占用,并且無需自己進(jìn)行服務(wù)器維護(hù)升級(jí),這使得整體投入和風(fēng)險(xiǎn)降低,并獲得了更好的業(yè)務(wù)靈活性。
Serverless已經(jīng)成為了云服務(wù)的必然趨勢(shì),而針對(duì)Serverless的重塑,也將支持到絕大多數(shù)客戶的業(yè)務(wù)創(chuàng)新。亞馬遜云科技也在re:Invent大會(huì)上宣布了三項(xiàng)無服務(wù)器服務(wù)創(chuàng)新,助力客戶以任意規(guī)模分析和管理數(shù)據(jù)。陳曉建也在北京站的活動(dòng)中針對(duì)這三大無服務(wù)器服務(wù)創(chuàng)新進(jìn)行了分享。
首先是Amazon Aurora Limitless Database,正如其名字Limitless所言,它簡化了跨單臺(tái)服務(wù)器讀寫吞吐量限制進(jìn)行擴(kuò)展,能夠讓客戶超越單個(gè)Aurora寫入器實(shí)例的限制,擴(kuò)展數(shù)據(jù)庫的寫入吞吐量和存儲(chǔ)容量。對(duì)于大規(guī)模應(yīng)用程序而言,客戶無需再構(gòu)建復(fù)雜的跨多個(gè)數(shù)據(jù)庫的方案,可以實(shí)現(xiàn)真正意義上的無擴(kuò)展上線的關(guān)系性數(shù)據(jù)庫。
圖:Amazon Aurora Limitless Database
而另一個(gè)新發(fā)布是Amazon ElastiCache Serverless,可以幫助客戶在一分鐘內(nèi)創(chuàng)建高可用的緩存,并實(shí)時(shí)進(jìn)行垂直和水平擴(kuò)展以支持客戶復(fù)雜的應(yīng)用程序,且無需管理基礎(chǔ)架構(gòu)。
第三個(gè)新發(fā)布的服務(wù)是Amazon Redshift Serverless,它大大簡化了數(shù)據(jù)庫管理的工作,讓企業(yè)的數(shù)據(jù)分析人員無需管理數(shù)據(jù)倉庫基礎(chǔ)設(shè)施即可輕松運(yùn)行任何規(guī)模的分析工作負(fù)載,并且可根據(jù)多個(gè)工作負(fù)載維度自動(dòng)調(diào)整資源并執(zhí)行優(yōu)化操作以完成客戶預(yù)設(shè)的性價(jià)比目標(biāo)。
而以上Serverless創(chuàng)新服務(wù)的基礎(chǔ),來自亞馬遜云科技的關(guān)系型數(shù)據(jù)庫服務(wù)Amazon Aurora。陳曉建也在此次活動(dòng)中揭秘了Amazon Aurora得以支撐各種無服務(wù)器云服務(wù)的兩大底層技術(shù)。首先是底層Grover系統(tǒng),這一系統(tǒng)自2014年以來,幫助Amazon Aurora實(shí)現(xiàn)了數(shù)據(jù)和計(jì)算資源的分離,可提供跨多個(gè)可用區(qū)的數(shù)據(jù)持久化支持,能橫向擴(kuò)展讀取副本,實(shí)現(xiàn)了數(shù)據(jù)庫存儲(chǔ)的無服務(wù)器擴(kuò)展。另一個(gè)底層技術(shù)是“協(xié)同資源管理”的系統(tǒng)Caspian。自2018年以來,Caspian采取重塑全新的Hypervisor+熱點(diǎn)調(diào)度系統(tǒng)的方式來工作,讓Amazon Aurora serverless數(shù)據(jù)庫可以在毫秒內(nèi)響應(yīng)變化的數(shù)據(jù)庫負(fù)載并調(diào)整大小。
圖:Grover讓Amazon Aurora數(shù)據(jù)庫存儲(chǔ)系統(tǒng)IO需求顯著降低
布局生成式AI三大層,助力各類客戶重塑業(yè)務(wù)未來
從去年年底至今,生成式AI的熱度不減。這一技術(shù)已經(jīng)被視為是新一輪的生產(chǎn)力變革,無數(shù)領(lǐng)先企業(yè)紛紛思考和實(shí)踐,如何在自己的業(yè)務(wù)中用好生成式AI,助力業(yè)務(wù)提升。而亞馬遜云科技的目標(biāo),是讓生成式AI降低門檻,讓AI能力做到普惠,重塑千行百業(yè),改變每個(gè)人的生活。
圖:生成式AI三層架構(gòu)
陳曉建表示,要實(shí)現(xiàn)生成式AI的業(yè)務(wù)賦能,需要考慮到方方面面的因素。包括如何兼顧規(guī)模與成本,真正讓業(yè)務(wù)收益;如何選擇最適合業(yè)務(wù)場(chǎng)景的模型,如何用企業(yè)自己的數(shù)據(jù)定制并快速行動(dòng);當(dāng)然還有如何充分保護(hù)數(shù)據(jù)的安全隱私的前提下負(fù)責(zé)人的應(yīng)用生成式AI。而要兼顧所有這些要素的實(shí)現(xiàn),亞馬遜云科技選擇從生成式AI的三層架構(gòu)進(jìn)行全面布局。
首先是在底層,提供用于基礎(chǔ)模型訓(xùn)練和推理的基礎(chǔ)設(shè)施。亞馬遜云科技在此次re:Invent大會(huì)上最新發(fā)布了第二代的自研訓(xùn)練芯片——Amazon Trainium2處理器,該芯片具有65 exaflops的按需超級(jí)計(jì)算性能,可以針對(duì)訓(xùn)練具有數(shù)千億至數(shù)萬億參數(shù)的基礎(chǔ)模型進(jìn)行優(yōu)化,相較上一代有了4倍性能提升。同時(shí),亞馬遜云科技也發(fā)布了全新的Amazon SageMaker HyperPod服務(wù),可幫助客戶大規(guī)模加速基礎(chǔ)模型訓(xùn)練,縮短高達(dá)40%的訓(xùn)練時(shí)間,并可以確保持續(xù)數(shù)周或數(shù)月的不中斷訓(xùn)練過程。
圖:亞馬遜云科技自研推理優(yōu)化芯片和訓(xùn)練優(yōu)化芯片
此外,亞馬遜云科技還與英偉達(dá)強(qiáng)強(qiáng)聯(lián)手,宣布達(dá)成多項(xiàng)最新合作。亞馬遜云科技將提供首款搭載NVIDIA Grace Hopper超級(jí)芯片和亞馬遜云科技UltraClusters技術(shù)的云AI超級(jí)計(jì)算機(jī);首款使用NVIDIA最新芯片GH200 NVL32的NVIDIA DGX云也即將登錄亞馬遜云科技。雙方還將共同開展“Project Ceiba”項(xiàng)目, 將全球最快的GPU驅(qū)動(dòng)AI超級(jí)計(jì)算機(jī)和NVIDIA DGX云超級(jí)計(jì)算機(jī)用于NVIDIA AI的訓(xùn)練、研發(fā)、定制化模型的開發(fā)。這一超級(jí)計(jì)算集群中集成了1.6萬個(gè)GH200超級(jí)芯片,可提供高達(dá)65 ExaFLOPS的驚人算力。
圖:亞馬遜云科技與英偉達(dá)合作推出全球首個(gè)云上GH200 AI超級(jí)計(jì)算集群
看完了在AI底層技術(shù)的布局,再來看下亞馬遜云科技在中間層工具層的創(chuàng)新。工具層面的布局旨在幫助客戶實(shí)現(xiàn)最貼近業(yè)務(wù)場(chǎng)景的模型選擇和定制,實(shí)現(xiàn)更輕松的模型集成,同時(shí)還要確保數(shù)據(jù)安全和隱私。而Amazon Bedrock則是亞馬遜云科技提供的利器,能夠幫助客戶利用大模型構(gòu)建和擴(kuò)展生成式人工智能應(yīng)用的最簡單方法。
圖:Amazon Bedrock簡化模型的選擇、定制和集成
基于多年來的AI和ML的技術(shù)積累,亞馬遜云科技為Amazon Bedrock提供全面的Amazon Titan模型,覆蓋了客戶從文本到多模態(tài)的業(yè)務(wù)場(chǎng)景。此次re:Invernt大會(huì)上,亞馬遜云科技就一口氣發(fā)布了四大新的模型:包括簡單高效的文本聊天模型Amazon Titan Text Lite,支持開放文本生成和對(duì)話聊天的Amazon Titan Text Express,支持多模態(tài)數(shù)據(jù)的Amazon Titan Multimodal Embeddings,以及具備圖像生成能力的Amazon Titan Image Generator預(yù)覽版。
而對(duì)于某些客戶而言,他們具有更強(qiáng)的研發(fā)能力,需要將AI模型與業(yè)務(wù)場(chǎng)景實(shí)現(xiàn)更緊密的耦合,來構(gòu)建企業(yè)的差異化壁壘。針對(duì)這部分客戶需求,亞馬遜云科技為Amazon Bedrock新增了持續(xù)預(yù)訓(xùn)練功能,當(dāng)前Amazon Titan Text Lite與 Express均已支持。此外,Amazon Bedrock還提供了微調(diào)功能,支持的模型包括Cohere Command、Meta Llama 2和Amazon Titan,并將很快支持Anthropic Claude 2。此外,Amazon Bedrock還新增了具有知識(shí)庫的檢索增強(qiáng)生成功能以及支持跨公司系統(tǒng)和數(shù)據(jù)源執(zhí)行多步驟任務(wù)的代理功能。
在頂層的應(yīng)用方面,亞馬遜云科技帶來一個(gè)有意思的AI助手——Amazon Q預(yù)覽版。這不禁讓我們聯(lián)想到了007電影中神秘角色“Q”。作為邦德的御用軍需官,他研發(fā)的五花八門的武器裝備,無數(shù)次幫助邦德化險(xiǎn)為夷。而Amazon Q同樣也是用戶的一個(gè)智能專家,它具備多重化身。一方面,它是一個(gè)云應(yīng)用專家,可以解決各種云服務(wù)相關(guān)的專業(yè)問題,并為用戶提供切實(shí)可行的實(shí)施代碼以及代碼轉(zhuǎn)換功能,幫助加速應(yīng)用的維護(hù)和升級(jí)。另一方面,它又是一個(gè)企業(yè)業(yè)務(wù)專家,企業(yè)可以輕松將其連接至其業(yè)務(wù)數(shù)據(jù)和系統(tǒng)中。此外,它還是一個(gè)商業(yè)智能專家,支持將其引入多種服務(wù)和應(yīng)用中以提供基于生成式AI的幫助。同時(shí),它還是一個(gè)聯(lián)絡(luò)中心專家,能夠根據(jù)實(shí)時(shí)對(duì)話檢測(cè)客戶問題,并能夠自動(dòng)回復(fù)、給出建議以及提供相關(guān)資料。
圖:Amazon Q
而除了上述提到的強(qiáng)大模型能力,生成式AI還需要擁有一個(gè)強(qiáng)大的數(shù)據(jù)底座。一個(gè)強(qiáng)大的數(shù)據(jù)基石,能夠讓企業(yè)的數(shù)據(jù)在不同的環(huán)境之中打通、在不同的產(chǎn)品之間流通。而亞馬遜云科技所提供的是一個(gè)完整的全面的端到端的數(shù)據(jù)服務(wù),從Amazon S3、Amazon Aurora、Amazon DynamoDB到各式各樣的托管數(shù)據(jù)庫均有所支持。而在此次活動(dòng)上,亞馬遜云科技還宣布將新增對(duì)另外一種商用數(shù)據(jù)庫的支持——Amazon RDS for Db2。生成式AI時(shí)代,客戶需要將向量數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)存儲(chǔ)在一起,于是,亞馬遜云科技的服務(wù)中啟用了向量檢索。包括在Amazon OpenSearch Serverless、Amazon DocumentDB和Amazon DynamoDB、Amazon MemoryDB for Redis中均新增了向量搜索的功能,客戶現(xiàn)在可以借助這一功能實(shí)現(xiàn)更快速的向量搜素。此外,亞馬遜云科技還推出了四項(xiàng)新的Zero-ETL特性,助力跨數(shù)據(jù)訪問和分析更加高效便捷。
“無論您在業(yè)務(wù)中想要做什么,都需要端到端的業(yè)務(wù)能力,需要數(shù)據(jù)能夠在整個(gè)全流程過程之中去進(jìn)行最高效的流轉(zhuǎn),同時(shí)也需要數(shù)據(jù)的治理能力?!标悤越ǚ窒淼?,“通過我們提供的Amazon Q、Amazon Bedrock,亞馬遜云科技整個(gè)底層的能力就可以幫助我們每一個(gè)客戶最合理的使用生成式AI,為業(yè)務(wù)賦能?!?
結(jié)語
re:Invent即再造、重塑,這是一個(gè)持續(xù)的、沒有終點(diǎn)的旅程。而在不斷重塑的過程中,每個(gè)不同的階段推動(dòng)重塑的動(dòng)能是不同的。當(dāng)下,生成式AI無疑是實(shí)現(xiàn)業(yè)務(wù)再造升級(jí)的關(guān)鍵技術(shù)動(dòng)能,而亞馬遜云科技希望能夠通過re:Invent,為客戶突破復(fù)雜技術(shù),用重塑實(shí)現(xiàn)科技技術(shù)的普惠,助力各類客戶實(shí)現(xiàn)業(yè)務(wù)重塑。