讓生成式AI重塑千行百業(yè)，亞馬遜云科技拓展從底層芯片到頂層應(yīng)用的全面布局

時(shí)間：2023-12-18 13:37:19

關(guān)鍵字：生成式AI 亞馬遜云科技 AWS Graviton

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]亞馬遜云科技（AWS）是云服務(wù)的發(fā)明者，而一年一度的AWS re:Invent大會(huì)，也被視為是云服務(wù)行業(yè)的風(fēng)向標(biāo)。隨著近日在美國拉斯維加斯的大會(huì)落幕，亞馬遜云科技也馬不停蹄地展開了re:Invent的中國行活動(dòng)，我們也滿懷期待地參與了re:Invent中國行的北京站活動(dòng)，并為大家?guī)砥渥钚碌脑品?wù)產(chǎn)品和技術(shù)動(dòng)向。

亞馬遜云科技（AWS）是云服務(wù)的發(fā)明者，而一年一度的AWS re:Invent大會(huì)，也被視為是云服務(wù)行業(yè)的風(fēng)向標(biāo)。隨著近日在美國拉斯維加斯的大會(huì)落幕，亞馬遜云科技也馬不停蹄地展開了re:Invent的中國行活動(dòng)，我們也滿懷期待地參與了re:Invent中國行的北京站活動(dòng)，并為大家?guī)砥渥钚碌脑品?wù)產(chǎn)品和技術(shù)動(dòng)向。

據(jù)亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建介紹，本次re:Invent大會(huì)上一共發(fā)布了200多項(xiàng)新服務(wù)和功能，以及超過350項(xiàng)持續(xù)的更新。而此次北京站分享的重點(diǎn)落在兩部分：一是從云計(jì)算的底層去重塑這些功能；二是如何利用生成式AI重塑未來。

圖：亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建

重塑云計(jì)算底座，讓計(jì)算更強(qiáng)大

AI為數(shù)據(jù)與計(jì)算帶來更龐大的需求。而在不斷增長的數(shù)據(jù)量以及越來越具挑戰(zhàn)的功耗限制等雙重因素影響之下，全球的數(shù)據(jù)中心與網(wǎng)絡(luò)基礎(chǔ)設(shè)施正面臨著巨大壓力。亞馬遜云科技一方面不斷增加數(shù)據(jù)中心的數(shù)量和分布，另一方面在存儲(chǔ)和計(jì)算的底層技術(shù)上進(jìn)行自研突破創(chuàng)新。

作為全球最大的云服務(wù)商，亞馬遜云科技的數(shù)據(jù)中心數(shù)量比行業(yè)第二名多三倍，服務(wù)數(shù)量多了60%，功能多了40%。

而在存儲(chǔ)方面，Amazon S3已經(jīng)支持了全球數(shù)百萬用戶的各級(jí)存儲(chǔ)需求，但隨著數(shù)據(jù)密集型應(yīng)用增加，在一些應(yīng)用上對(duì)于數(shù)據(jù)訪問的速度提出了更高的要求，客戶可能要達(dá)到每分鐘數(shù)百萬次的數(shù)據(jù)集訪問，每一毫秒的延遲都會(huì)對(duì)其業(yè)務(wù)產(chǎn)生影響。針對(duì)這些用戶對(duì)于高性能存儲(chǔ)的需求，亞馬遜云科技此次推出了全新的高性能對(duì)象存儲(chǔ)——Amazon S3 Express One Zone。

據(jù)悉，Amazon S3 Express One Zone是采用專門設(shè)計(jì)的軟硬件來實(shí)現(xiàn)數(shù)據(jù)加速處理，同時(shí)能夠以一致的毫秒級(jí)延遲處理每分鐘數(shù)百萬次的請(qǐng)求，相比Amazon S3標(biāo)準(zhǔn)存儲(chǔ)快了10倍，同時(shí)請(qǐng)求成本降低了50%。從實(shí)際客戶案例來看，這項(xiàng)新存儲(chǔ)服務(wù)幫助Pinterest提升了10倍以上的寫入速度，并將其機(jī)器學(xué)習(xí)驅(qū)動(dòng)的視覺靈感引擎的總成本降低了40%。

圖：Amazon S3 Express One Zone工作原理

除了存儲(chǔ)外，高性能計(jì)算依賴于高性能的芯片。為了緩解未來基礎(chǔ)設(shè)施的壓力，行業(yè)需要依賴強(qiáng)大的生態(tài)系統(tǒng)，在高效、可擴(kuò)展的多核計(jì)算基礎(chǔ)上，打造專用處理的能力。

而為了提高云服務(wù)的能效表現(xiàn)，亞馬遜云科技早在幾年前就著手開始自研芯片，包括服務(wù)器級(jí)CPU、專用推理芯片和訓(xùn)練芯片，并且成功將諸多服務(wù)部署在自家高性能計(jì)算芯片上，幫助客戶進(jìn)一步節(jié)約了業(yè)務(wù)成本。

值得一提的是，此次re:Invent大會(huì)上發(fā)布的全新的Amazon Graviton4芯片，該芯片采用了96個(gè)Neoverse V2核心，每個(gè)核心獨(dú)享2MB的L2緩存，內(nèi)存方面提供12個(gè)DDR5-5600通道。相比上一代，Amazon Graviton4的平均性能提升30%，對(duì)某些工作負(fù)載的加速更明顯，數(shù)據(jù)庫應(yīng)用程序速度提升40%，大型Java應(yīng)用程序速度提升45%。

圖：Graviton3和Graviton4

據(jù)陳曉建介紹，基于Amazon Graviton 4的Amazon EC2 R8g實(shí)例的預(yù)覽版已經(jīng)推出。而基于Amazon Graviton3的Amazon EC2 C7g、M7g、R7g實(shí)例在亞馬遜云科技中國（北京）區(qū)域和中國（寧夏）區(qū)域也已經(jīng)正式可用，將為中國客戶帶來提供更高性能、更快內(nèi)存，以及更加節(jié)能的體驗(yàn)。

圖：EC2 R8g實(shí)例

推進(jìn)無服務(wù)器服務(wù)創(chuàng)新，讓云服務(wù)更易用

對(duì)于絕大多數(shù)客戶而言，無服務(wù)器（Serverless）提供了更好的成本效率。客戶可以在業(yè)務(wù)高峰時(shí)拓展更多資源，而在低谷時(shí)降低資源占用，并且無需自己進(jìn)行服務(wù)器維護(hù)升級(jí)，這使得整體投入和風(fēng)險(xiǎn)降低，并獲得了更好的業(yè)務(wù)靈活性。

Serverless已經(jīng)成為了云服務(wù)的必然趨勢(shì)，而針對(duì)Serverless的重塑，也將支持到絕大多數(shù)客戶的業(yè)務(wù)創(chuàng)新。亞馬遜云科技也在re:Invent大會(huì)上宣布了三項(xiàng)無服務(wù)器服務(wù)創(chuàng)新，助力客戶以任意規(guī)模分析和管理數(shù)據(jù)。陳曉建也在北京站的活動(dòng)中針對(duì)這三大無服務(wù)器服務(wù)創(chuàng)新進(jìn)行了分享。

首先是Amazon Aurora Limitless Database，正如其名字Limitless所言，它簡化了跨單臺(tái)服務(wù)器讀寫吞吐量限制進(jìn)行擴(kuò)展，能夠讓客戶超越單個(gè)Aurora寫入器實(shí)例的限制，擴(kuò)展數(shù)據(jù)庫的寫入吞吐量和存儲(chǔ)容量。對(duì)于大規(guī)模應(yīng)用程序而言，客戶無需再構(gòu)建復(fù)雜的跨多個(gè)數(shù)據(jù)庫的方案，可以實(shí)現(xiàn)真正意義上的無擴(kuò)展上線的關(guān)系性數(shù)據(jù)庫。

圖：Amazon Aurora Limitless Database

而另一個(gè)新發(fā)布是Amazon ElastiCache Serverless，可以幫助客戶在一分鐘內(nèi)創(chuàng)建高可用的緩存，并實(shí)時(shí)進(jìn)行垂直和水平擴(kuò)展以支持客戶復(fù)雜的應(yīng)用程序，且無需管理基礎(chǔ)架構(gòu)。

第三個(gè)新發(fā)布的服務(wù)是Amazon Redshift Serverless，它大大簡化了數(shù)據(jù)庫管理的工作，讓企業(yè)的數(shù)據(jù)分析人員無需管理數(shù)據(jù)倉庫基礎(chǔ)設(shè)施即可輕松運(yùn)行任何規(guī)模的分析工作負(fù)載，并且可根據(jù)多個(gè)工作負(fù)載維度自動(dòng)調(diào)整資源并執(zhí)行優(yōu)化操作以完成客戶預(yù)設(shè)的性價(jià)比目標(biāo)。

而以上Serverless創(chuàng)新服務(wù)的基礎(chǔ)，來自亞馬遜云科技的關(guān)系型數(shù)據(jù)庫服務(wù)Amazon Aurora。陳曉建也在此次活動(dòng)中揭秘了Amazon Aurora得以支撐各種無服務(wù)器云服務(wù)的兩大底層技術(shù)。首先是底層Grover系統(tǒng)，這一系統(tǒng)自2014年以來，幫助Amazon Aurora實(shí)現(xiàn)了數(shù)據(jù)和計(jì)算資源的分離，可提供跨多個(gè)可用區(qū)的數(shù)據(jù)持久化支持，能橫向擴(kuò)展讀取副本，實(shí)現(xiàn)了數(shù)據(jù)庫存儲(chǔ)的無服務(wù)器擴(kuò)展。另一個(gè)底層技術(shù)是“協(xié)同資源管理”的系統(tǒng)Caspian。自2018年以來，Caspian采取重塑全新的Hypervisor+熱點(diǎn)調(diào)度系統(tǒng)的方式來工作，讓Amazon Aurora serverless數(shù)據(jù)庫可以在毫秒內(nèi)響應(yīng)變化的數(shù)據(jù)庫負(fù)載并調(diào)整大小。

圖：Grover讓Amazon Aurora數(shù)據(jù)庫存儲(chǔ)系統(tǒng)IO需求顯著降低

布局生成式AI三大層，助力各類客戶重塑業(yè)務(wù)未來

從去年年底至今，生成式AI的熱度不減。這一技術(shù)已經(jīng)被視為是新一輪的生產(chǎn)力變革，無數(shù)領(lǐng)先企業(yè)紛紛思考和實(shí)踐，如何在自己的業(yè)務(wù)中用好生成式AI，助力業(yè)務(wù)提升。而亞馬遜云科技的目標(biāo)，是讓生成式AI降低門檻，讓AI能力做到普惠，重塑千行百業(yè)，改變每個(gè)人的生活。

圖：生成式AI三層架構(gòu)

陳曉建表示，要實(shí)現(xiàn)生成式AI的業(yè)務(wù)賦能，需要考慮到方方面面的因素。包括如何兼顧規(guī)模與成本，真正讓業(yè)務(wù)收益；如何選擇最適合業(yè)務(wù)場(chǎng)景的模型，如何用企業(yè)自己的數(shù)據(jù)定制并快速行動(dòng)；當(dāng)然還有如何充分保護(hù)數(shù)據(jù)的安全隱私的前提下負(fù)責(zé)人的應(yīng)用生成式AI。而要兼顧所有這些要素的實(shí)現(xiàn)，亞馬遜云科技選擇從生成式AI的三層架構(gòu)進(jìn)行全面布局。

首先是在底層，提供用于基礎(chǔ)模型訓(xùn)練和推理的基礎(chǔ)設(shè)施。亞馬遜云科技在此次re:Invent大會(huì)上最新發(fā)布了第二代的自研訓(xùn)練芯片——Amazon Trainium2處理器，該芯片具有65 exaflops的按需超級(jí)計(jì)算性能，可以針對(duì)訓(xùn)練具有數(shù)千億至數(shù)萬億參數(shù)的基礎(chǔ)模型進(jìn)行優(yōu)化，相較上一代有了4倍性能提升。同時(shí)，亞馬遜云科技也發(fā)布了全新的Amazon SageMaker HyperPod服務(wù)，可幫助客戶大規(guī)模加速基礎(chǔ)模型訓(xùn)練，縮短高達(dá)40%的訓(xùn)練時(shí)間，并可以確保持續(xù)數(shù)周或數(shù)月的不中斷訓(xùn)練過程。

圖：亞馬遜云科技自研推理優(yōu)化芯片和訓(xùn)練優(yōu)化芯片

此外，亞馬遜云科技還與英偉達(dá)強(qiáng)強(qiáng)聯(lián)手，宣布達(dá)成多項(xiàng)最新合作。亞馬遜云科技將提供首款搭載NVIDIA Grace Hopper超級(jí)芯片和亞馬遜云科技UltraClusters技術(shù)的云AI超級(jí)計(jì)算機(jī)；首款使用NVIDIA最新芯片GH200 NVL32的NVIDIA DGX云也即將登錄亞馬遜云科技。雙方還將共同開展“Project Ceiba”項(xiàng)目，將全球最快的GPU驅(qū)動(dòng)AI超級(jí)計(jì)算機(jī)和NVIDIA DGX云超級(jí)計(jì)算機(jī)用于NVIDIA AI的訓(xùn)練、研發(fā)、定制化模型的開發(fā)。這一超級(jí)計(jì)算集群中集成了1.6萬個(gè)GH200超級(jí)芯片，可提供高達(dá)65 ExaFLOPS的驚人算力。

圖：亞馬遜云科技與英偉達(dá)合作推出全球首個(gè)云上GH200 AI超級(jí)計(jì)算集群

看完了在AI底層技術(shù)的布局，再來看下亞馬遜云科技在中間層工具層的創(chuàng)新。工具層面的布局旨在幫助客戶實(shí)現(xiàn)最貼近業(yè)務(wù)場(chǎng)景的模型選擇和定制，實(shí)現(xiàn)更輕松的模型集成，同時(shí)還要確保數(shù)據(jù)安全和隱私。而Amazon Bedrock則是亞馬遜云科技提供的利器，能夠幫助客戶利用大模型構(gòu)建和擴(kuò)展生成式人工智能應(yīng)用的最簡單方法。

圖：Amazon Bedrock簡化模型的選擇、定制和集成

基于多年來的AI和ML的技術(shù)積累，亞馬遜云科技為Amazon Bedrock提供全面的Amazon Titan模型，覆蓋了客戶從文本到多模態(tài)的業(yè)務(wù)場(chǎng)景。此次re:Invernt大會(huì)上，亞馬遜云科技就一口氣發(fā)布了四大新的模型：包括簡單高效的文本聊天模型Amazon Titan Text Lite，支持開放文本生成和對(duì)話聊天的Amazon Titan Text Express，支持多模態(tài)數(shù)據(jù)的Amazon Titan Multimodal Embeddings，以及具備圖像生成能力的Amazon Titan Image Generator預(yù)覽版。

而對(duì)于某些客戶而言，他們具有更強(qiáng)的研發(fā)能力，需要將AI模型與業(yè)務(wù)場(chǎng)景實(shí)現(xiàn)更緊密的耦合，來構(gòu)建企業(yè)的差異化壁壘。針對(duì)這部分客戶需求，亞馬遜云科技為Amazon Bedrock新增了持續(xù)預(yù)訓(xùn)練功能，當(dāng)前Amazon Titan Text Lite與 Express均已支持。此外，Amazon Bedrock還提供了微調(diào)功能，支持的模型包括Cohere Command、Meta Llama 2和Amazon Titan，并將很快支持Anthropic Claude 2。此外，Amazon Bedrock還新增了具有知識(shí)庫的檢索增強(qiáng)生成功能以及支持跨公司系統(tǒng)和數(shù)據(jù)源執(zhí)行多步驟任務(wù)的代理功能。

在頂層的應(yīng)用方面，亞馬遜云科技帶來一個(gè)有意思的AI助手——Amazon Q預(yù)覽版。這不禁讓我們聯(lián)想到了007電影中神秘角色“Q”。作為邦德的御用軍需官，他研發(fā)的五花八門的武器裝備，無數(shù)次幫助邦德化險(xiǎn)為夷。而Amazon Q同樣也是用戶的一個(gè)智能專家，它具備多重化身。一方面，它是一個(gè)云應(yīng)用專家，可以解決各種云服務(wù)相關(guān)的專業(yè)問題，并為用戶提供切實(shí)可行的實(shí)施代碼以及代碼轉(zhuǎn)換功能，幫助加速應(yīng)用的維護(hù)和升級(jí)。另一方面，它又是一個(gè)企業(yè)業(yè)務(wù)專家，企業(yè)可以輕松將其連接至其業(yè)務(wù)數(shù)據(jù)和系統(tǒng)中。此外，它還是一個(gè)商業(yè)智能專家，支持將其引入多種服務(wù)和應(yīng)用中以提供基于生成式AI的幫助。同時(shí)，它還是一個(gè)聯(lián)絡(luò)中心專家，能夠根據(jù)實(shí)時(shí)對(duì)話檢測(cè)客戶問題，并能夠自動(dòng)回復(fù)、給出建議以及提供相關(guān)資料。

圖：Amazon Q

而除了上述提到的強(qiáng)大模型能力，生成式AI還需要擁有一個(gè)強(qiáng)大的數(shù)據(jù)底座。一個(gè)強(qiáng)大的數(shù)據(jù)基石，能夠讓企業(yè)的數(shù)據(jù)在不同的環(huán)境之中打通、在不同的產(chǎn)品之間流通。而亞馬遜云科技所提供的是一個(gè)完整的全面的端到端的數(shù)據(jù)服務(wù)，從Amazon S3、Amazon Aurora、Amazon DynamoDB到各式各樣的托管數(shù)據(jù)庫均有所支持。而在此次活動(dòng)上，亞馬遜云科技還宣布將新增對(duì)另外一種商用數(shù)據(jù)庫的支持——Amazon RDS for Db2。生成式AI時(shí)代，客戶需要將向量數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)存儲(chǔ)在一起，于是，亞馬遜云科技的服務(wù)中啟用了向量檢索。包括在Amazon OpenSearch Serverless、Amazon DocumentDB和Amazon DynamoDB、Amazon MemoryDB for Redis中均新增了向量搜索的功能，客戶現(xiàn)在可以借助這一功能實(shí)現(xiàn)更快速的向量搜素。此外，亞馬遜云科技還推出了四項(xiàng)新的Zero-ETL特性，助力跨數(shù)據(jù)訪問和分析更加高效便捷。

“無論您在業(yè)務(wù)中想要做什么，都需要端到端的業(yè)務(wù)能力，需要數(shù)據(jù)能夠在整個(gè)全流程過程之中去進(jìn)行最高效的流轉(zhuǎn)，同時(shí)也需要數(shù)據(jù)的治理能力?！标悤越ǚ窒淼?，“通過我們提供的Amazon Q、Amazon Bedrock，亞馬遜云科技整個(gè)底層的能力就可以幫助我們每一個(gè)客戶最合理的使用生成式AI，為業(yè)務(wù)賦能?！?

結(jié)語

re:Invent即再造、重塑，這是一個(gè)持續(xù)的、沒有終點(diǎn)的旅程。而在不斷重塑的過程中，每個(gè)不同的階段推動(dòng)重塑的動(dòng)能是不同的。當(dāng)下，生成式AI無疑是實(shí)現(xiàn)業(yè)務(wù)再造升級(jí)的關(guān)鍵技術(shù)動(dòng)能，而亞馬遜云科技希望能夠通過re:Invent，為客戶突破復(fù)雜技術(shù)，用重塑實(shí)現(xiàn)科技技術(shù)的普惠，助力各類客戶實(shí)現(xiàn)業(yè)務(wù)重塑。