當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 智能應(yīng)用
[導(dǎo)讀]無服務(wù)器計算是一個云計算模型,諸如AWS,Azure和GCP之類的云提供商管理服務(wù)器基礎(chǔ)架構(gòu),并根據(jù)需要動態(tài)分配資源。開發(fā)人員要么直接調(diào)用API,要么以函數(shù)的形式編寫代碼,并且云提供商對某些事件響應(yīng)這些功能。這意味著開發(fā)人員可以自動擴展應(yīng)用程序,而不必擔(dān)心服務(wù)器管理和部署,從而可以節(jié)省成本和提高敏捷性。

無服務(wù)器計算是一個云計算模型,諸如AWS,Azure和GCP之類的云提供商管理服務(wù)器基礎(chǔ)架構(gòu),并根據(jù)需要動態(tài)分配資源。開發(fā)人員要么直接調(diào)用API,要么以函數(shù)的形式編寫代碼,并且云提供商對某些事件響應(yīng)這些功能。這意味著開發(fā)人員可以自動擴展應(yīng)用程序,而不必擔(dān)心服務(wù)器管理和部署,從而可以節(jié)省成本和提高敏捷性。

無服務(wù)器計算的主要優(yōu)點是,它抽象了與發(fā)布管理相關(guān)的許多復(fù)雜性,而開發(fā)人員無需擔(dān)心容量計劃,硬件管理甚至操作系統(tǒng)。這種簡單性釋放了時間和資源,可以將更多的精力集中在部署模型之上的創(chuàng)新應(yīng)用程序和服務(wù)上。

AI模型部署

模型部署涉及將機器學(xué)習(xí)或AI模型從開發(fā)到生產(chǎn)的幾個關(guān)鍵步驟,以確保其可擴展,可靠且有效。關(guān)鍵元素包括模型培訓(xùn)和優(yōu)化,其中模型進行了微調(diào)以進行性能和模型版本,從而有助于管理不同的迭代。一旦訓(xùn)練,該模型將與其必要的依賴關(guān)系進行序列化和包裝,并準(zhǔn)備部署在適當(dāng)?shù)倪\行時環(huán)境中,例如云平臺或容器化服務(wù)。該模型通過API或Web服務(wù)暴露,使其可以為外部應(yīng)用程序提供實時預(yù)測。

除部署外,連續(xù)監(jiān)視和建立用于自動化再培訓(xùn)和模型更新的CI/CD管道至關(guān)重要。安全措施對于保護數(shù)據(jù)隱私并確保遵守法規(guī)也是必不可少的。模型必須是可解釋的,尤其是在需要解釋AI決策的行業(yè)中,并且應(yīng)合并反饋循環(huán),以根據(jù)用戶輸入或數(shù)據(jù)更改隨著時間的推移來完善模型。有效地管理資源以優(yōu)化運營成本也是一個關(guān)鍵要素,以確保部署的模型仍然具有成本效益和可持續(xù)性??偟膩碚f,這些要素確保機器學(xué)習(xí)模型可以在生產(chǎn)環(huán)境中有效,安全地運行高性能。

無服務(wù)器AI推斷

無服務(wù)器AI推斷是指使用無服務(wù)器計算平臺部署和執(zhí)行機器學(xué)習(xí)模型,以進行預(yù)測,而無需管理基礎(chǔ)架構(gòu)或擔(dān)心擴展資源。

在此設(shè)置中,該模型被托管為API端點,并且僅在計算時間實際使用的計算時間內(nèi)收取用戶,從而提供了成本效率和靈活性。AWS Lambda,Google Cloud功能和Azure功能之類的無服務(wù)器平臺使開發(fā)人員能夠上傳訓(xùn)練有素的模型并通過API曝光它們以進行實時預(yù)測。這使企業(yè)可以將AI驅(qū)動的決策集成到其應(yīng)用程序中,而無需管理復(fù)雜的服務(wù)器基礎(chǔ)架構(gòu)。

無服務(wù)器AI推斷的主要優(yōu)點之一是它具有不同請求量無縫擴展的能力,非常適合諸如欺詐檢測,推薦系統(tǒng)以及實時圖像或語音識別之類的用例。此外,它減少了運營開銷,使數(shù)據(jù)科學(xué)家和開發(fā)人員能夠?qū)W⒂谀P偷臏?zhǔn)確性和性能,而不是管理基礎(chǔ)架構(gòu)。無服務(wù)器AI推斷越來越流行,對于需要快速且具有成本效益的AI預(yù)測而無需專用基礎(chǔ)架構(gòu)的輕質(zhì),低延遲應(yīng)用程序。

無服務(wù)器AI的優(yōu)點

傳統(tǒng)的AI模型通常需要大量資源來部署和擴展,尤其是在生產(chǎn)環(huán)境中。借助無服務(wù)器的基礎(chǔ)架構(gòu),開發(fā)人員可以利用一種高度靈活的付費模型,可以優(yōu)化成本和效率。這是無服務(wù)器AI的幾個關(guān)鍵優(yōu)勢:

簡單

AI模型通常需要大量配置,尤其是在跨多個計算機進行分布式計算的縮放時。無服務(wù)器計算摘要大部分基礎(chǔ)架構(gòu)管理,并允許開發(fā)人員快速部署和迭代其AI模型。開發(fā)人員可以僅關(guān)注核心邏輯,因此,企業(yè)可以比以往任何時候都更快地開發(fā)AI驅(qū)動的解決方案。

可伸縮性

無服務(wù)器計算提供幾乎無限的可擴展性,從而使應(yīng)用程序可以處理增加的需求,而無需其他設(shè)置或配置。例如,如果特定的AI模型正在為Web應(yīng)用程序提供實時預(yù)測,并且突然面對用戶的峰值,則無服務(wù)器基礎(chǔ)架構(gòu)可以自動擴展以處理此激增,而無需手動干預(yù)。

成本效益

無服務(wù)器計算在基于消費的定價模型上運行,用戶僅支付所使用的實際資源。在與AI合作時,這尤其有利,因為許多AI工作負載在交通中爆發(fā),即在某些時候它們需要大量資源,但在其他時期很少或沒有。

事件驅(qū)動的架構(gòu)

無服務(wù)器平臺本質(zhì)上是事件驅(qū)動的,使其非常適合需要響應(yīng)實時數(shù)據(jù)的AI應(yīng)用程序。這對于諸如欺詐檢測,異常檢測等方案至關(guān)重要。

無服務(wù)器解決方案

通過利用無服務(wù)器的生態(tài)系統(tǒng),組織可以專注于創(chuàng)新,從自動擴展中受益,優(yōu)化成本并更快地交付應(yīng)用程序,同時保持安全有效的開發(fā)環(huán)境。

· 無服務(wù)器與AWS:AWS提供了一系列支持無服務(wù)器AI的服務(wù),例如AWS Lambda,該服務(wù)允許用戶在無需配置或管理服務(wù)器的情況下運行代碼。對于機器學(xué)習(xí)任務(wù),諸如Amazon Sage Maker之類的服務(wù)使開發(fā)人員能夠快速訓(xùn)練,部署和管理模型。

· 使用Microsoft Azure的無服務(wù)器:Azure的無服務(wù)器產(chǎn)品(例如Azure功能)允許開發(fā)人員根據(jù)需求自動擴展AI模型和代碼,以響應(yīng)特定事件或觸發(fā)器。 Azure還通過Azure機器學(xué)習(xí)提供了強大的機器學(xué)習(xí)服務(wù),該學(xué)習(xí)提供了用于培訓(xùn),部署和管理AI模型的工具。

· 使用GCP的無服務(wù)器: GCP提供無關(guān)服務(wù)的服務(wù),例如用于事件驅(qū)動計算的云功能。這些服務(wù)使與GCP的AI和機器學(xué)習(xí)產(chǎn)品(例如Vertex AI)無縫集成,從而使企業(yè)可以輕松部署AI模型并處理實時數(shù)據(jù)。

無服務(wù)器的挑戰(zhàn)

冷啟動潛伏期

無服務(wù)器功能在不活動后調(diào)用時會延遲延遲。對于需要高響應(yīng)能力的AI模型,冷啟動可能會引入延遲,這可能是實時應(yīng)用程序的問題。

國家管理

無服務(wù)器功能是通過設(shè)計無狀態(tài)的,這意味著在推斷過程中管理AI模型的狀態(tài)可能很棘手。開發(fā)人員必須設(shè)計其應(yīng)用程序,以處理會話持久性或使用數(shù)據(jù)庫或分布式緩存的外部狀態(tài)。

資源治理

許多無服務(wù)器平臺對內(nèi)存,執(zhí)行時間和CPU/GPU使用施加限制。對于特別是資源密集型的AI模型,這可能會帶來一個問題,盡管通??梢栽O(shè)計有效的模型或?qū)⒋笮腿蝿?wù)拆分為較小的功能。

安排公平

安排無服務(wù)器AI推理中的公平性確保在并發(fā)任務(wù)之間進行公平的資源分配,從而防止資源壟斷和延遲。這對于平衡對潛伏期敏感和資源密集型工作負載至關(guān)重要,同時保持一致的性能。實現(xiàn)公平性需要優(yōu)先隊列,負載平衡和預(yù)測調(diào)度之類的策略,盡管無服務(wù)器環(huán)境的動態(tài)性質(zhì)使這一挑戰(zhàn)性。有效的調(diào)度是優(yōu)化AI推理任務(wù)中吞吐量和響應(yīng)能力的關(guān)鍵。

結(jié)論

無服務(wù)器體系結(jié)構(gòu)通過提供無與倫比的可擴展性,成本效率和簡單性來徹底改變開發(fā)人員和企業(yè)對技術(shù)的方式。通過消除管理和維護基礎(chǔ)架構(gòu)的需求,這些體系結(jié)構(gòu)使開發(fā)人員能夠?qū)⑵渚σ龑?dǎo)到創(chuàng)新中,從而使他們能夠輕松設(shè)計和實施尖端的AI應(yīng)用程序。利用無服務(wù)器計算的企業(yè)可以迅速適應(yīng)不斷變化的需求,降低運營成本并加速開發(fā)周期的能力。這種敏捷性促進了更高效,更強大的AI驅(qū)動解決方案的創(chuàng)建。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉