數(shù)據(jù)中心機器學(xué)習(xí)怎樣才可以優(yōu)化
機器學(xué)習(xí)和人工智能是當今IT專業(yè)人員的熱門話題,而在企業(yè)的數(shù)據(jù)中心,它們擁有真正的前景。
機器學(xué)習(xí)軟件可比你或你的團隊更快預(yù)測情況,甚至可能更快地解決它們。這些系統(tǒng)是當今混合數(shù)據(jù)中心環(huán)境的合理擴展,是數(shù)據(jù)中心基礎(chǔ)設(shè)施中不斷增長的一部分。
IDC預(yù)測,到2022年,在數(shù)據(jù)中心,50%的IT資產(chǎn)將使用嵌入式AI功能自主運行。數(shù)據(jù)中心的機器學(xué)習(xí)可以優(yōu)化大部分整體運營,包括規(guī)劃和設(shè)計、工作負載、正常運行時間和成本管理。
數(shù)據(jù)中心機器學(xué)習(xí)用例
機器學(xué)習(xí)能夠從場景和數(shù)據(jù)集中學(xué)習(xí),并且可以構(gòu)建即時響應(yīng),而不需要人為干預(yù)或依賴于一組有限的預(yù)編程動作。該技術(shù)可以幫助你更好地了解你的數(shù)據(jù)中心系統(tǒng),更有效地管理它們并防止意外停機。
創(chuàng)建更高效的數(shù)據(jù)中心。企業(yè)可以使用機器學(xué)習(xí)來自動管理其數(shù)據(jù)中心的物理環(huán)境,并通過軟件對物理設(shè)施和數(shù)據(jù)中心架構(gòu)進行實時修改,而不是警報。
谷歌使用其AI系統(tǒng)自動管理其數(shù)據(jù)中心的冷卻,并持續(xù)分析21個變量,例如空氣溫度、功率負載和內(nèi)部氣壓。在2018年,該公司利用機器學(xué)習(xí)將冷卻所需的能源減少40%,并且實現(xiàn)1.06分的電力使用效率。
降低運營風險。對于數(shù)據(jù)中心運營,防止停機是關(guān)鍵任務(wù),而機器學(xué)習(xí)可以幫助你更輕松地預(yù)測和預(yù)防停機。數(shù)據(jù)中心機器學(xué)習(xí)軟件監(jiān)控關(guān)鍵設(shè)備(例如電源管理和冷卻系統(tǒng))的實時性能數(shù)據(jù),并預(yù)測硬件何時出現(xiàn)故障。這使你可以對這些系統(tǒng)執(zhí)行預(yù)防性維護,并防止代價高昂的停機。
基于機器學(xué)習(xí)的風險分析可提高數(shù)據(jù)中心的正常運行時間,這主要是通過構(gòu)建不同配置以增加彈性;識別預(yù)防性維護的機會;以及識別潛在的網(wǎng)絡(luò)安全風險,甚至在它們出現(xiàn)前。
通過智能數(shù)據(jù)減少客戶流失。企業(yè)可在數(shù)據(jù)中心利用機器學(xué)習(xí)來更好地了解客戶并潛在地預(yù)測消費者行為。作為客戶成功計劃的延伸,機器學(xué)習(xí)可以分析數(shù)據(jù)中心內(nèi)收集后未使用的大量信息。
當機器學(xué)習(xí)軟件與客戶關(guān)系管理(CRM)系統(tǒng)連接時,這個基于AI的數(shù)據(jù)中心可以搜索和檢索存儲的歷史數(shù)據(jù)庫(在傳統(tǒng)上不用于CRM)中的數(shù)據(jù),并允許CRM系統(tǒng)制定不同的戰(zhàn)略以挖掘潛在或?qū)崿F(xiàn)客戶成功。
從以下軟件選項開始由于機器學(xué)習(xí)可以比人類更快地運行,因此它可以在幾秒內(nèi)分析數(shù)TB的歷史數(shù)據(jù),并將參數(shù)應(yīng)用于其決策,當你在跟蹤數(shù)據(jù)中心中的所有活動時,這非常有用。如果你希望將機器學(xué)習(xí)部署到數(shù)據(jù)中心,可以從以下幾個用例和軟件產(chǎn)品開始。
電力和能源管理。能源管理是企業(yè)最容易利用數(shù)據(jù)中心機器學(xué)習(xí)實現(xiàn)的領(lǐng)域之一,并可立即獲得顯著收益。谷歌使用DeepMind實現(xiàn)約30%的能源節(jié)約,從而降低了相關(guān)成本。
Maya HTT的數(shù)據(jù)中心基礎(chǔ)架構(gòu)管理軟件Datacenter Clarity LC利用基于AI的工具分析各個服務(wù)器,以檢測異常情況以及識別優(yōu)化機會。
例如,它可以識別工作負載并將其從效率較低的服務(wù)器重新路由到能源和工作效率較高而利用率較低的服務(wù)器;而你會看到關(guān)于更換舊服務(wù)器的通知,你可以在它成為問題之前進行升級。
日志管理。大多數(shù)數(shù)據(jù)中心系統(tǒng)都會生成日志,但如果這些日志沒有被利用,那么就沒有價值。還有企業(yè)使用的任何邊緣或外圍設(shè)備,這里涉及大量日志。
機器學(xué)習(xí)可以集中和分析這些日志,并可創(chuàng)建對你的團隊有價值且易于使用的報告。開源技術(shù)(例如Elasticsearch)以及來自Splunk的付費選項可以幫助分析和提取機器學(xué)習(xí)例程收集的任何數(shù)據(jù)。
根本原因分析。當你遇到任何性能問題時,你必須能夠快速確定根本原因并加以解決。Hewlett Packard Enterprise的InfoSight產(chǎn)品中的AI預(yù)測引擎可幫助你近乎實時地發(fā)現(xiàn)并解決在內(nèi)部數(shù)據(jù)中心和云部署中的問題。
根據(jù)具體參數(shù),InfoSight會識別受影響的用戶并開發(fā)自己的一套解決方案。但真正的價值在于其預(yù)防措施;當該軟件開發(fā)出解決問題的規(guī)則,它就會遍歷整個系統(tǒng),重新路由流量到未受影響的系統(tǒng),以防止它們出現(xiàn)相同的問題。
來源:TechTarget中國