首個(gè)神經(jīng)網(wǎng)絡(luò)工控系統(tǒng)的應(yīng)用在谷歌上線了
掃描二維碼
隨時(shí)隨地手機(jī)看文章
即便深度學(xué)習(xí)和其它機(jī)器學(xué)習(xí)方法近幾年已經(jīng)取得了不小的發(fā)展,但是把它們直接應(yīng)用在真實(shí)工業(yè)場(chǎng)景中、讓它們直接控制工業(yè)系統(tǒng)還未曾見(jiàn)到。深度學(xué)習(xí)本身缺乏魯棒性、面對(duì)新?tīng)顩r難以預(yù)測(cè)行為等一些特性固然是重要的掣肘之處,如何讓算法逐步提高控制范圍、協(xié)調(diào)與人類的協(xié)作方式也是難題。DeepMind 和谷歌最近就做出了新一步嘗試,取得了不小的成功,然后在 DeepMind 博客上進(jìn)行了介紹。雷鋒網(wǎng) AI 科技評(píng)論編譯如下。
我們?nèi)祟惿鐣?huì)面對(duì)的許多緊迫問(wèn)題中,有許多問(wèn)題還在變得越來(lái)越復(fù)雜,所有人都急切地想要找到好的解決方法。對(duì)于 DeepMind 和谷歌來(lái)說(shuō),他們相信如果人類可以把 AI 作為探尋新知識(shí)的工具加以利用,找到解決方法就會(huì)容易得多。
最近,DeepMind 把這個(gè)系統(tǒng)升級(jí)到了一個(gè)全新的級(jí)別上:不再像原來(lái)的系統(tǒng)那樣向人類推薦一些動(dòng)作,然后由人類去完成,AI 系統(tǒng)現(xiàn)在會(huì)直接控制數(shù)據(jù)中心的冷卻系統(tǒng),當(dāng)然了它也仍然受到數(shù)據(jù)中心運(yùn)營(yíng)人員的專業(yè)監(jiān)控。這是首個(gè)基于云的控制系統(tǒng),已經(jīng)在多個(gè)谷歌的數(shù)據(jù)中心中安靜地運(yùn)行、持續(xù)地節(jié)省能源。
每隔 5 分鐘,這個(gè)基于云的 AI 會(huì)從數(shù)據(jù)中心的數(shù)千個(gè)傳感器中采集數(shù)據(jù),獲得數(shù)據(jù)中心冷卻系統(tǒng)的狀態(tài)快照,然后把它輸入深度神經(jīng)網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)會(huì)預(yù)測(cè)各種可能的操作的不同組合會(huì)如何影響數(shù)據(jù)中心的能量消耗。然后 AI 就會(huì)就會(huì)在滿足魯棒安全性限制的條件下判斷出一組能夠最小化能源消耗的動(dòng)作。這些動(dòng)作的判斷結(jié)果接下來(lái)會(huì)被發(fā)回給數(shù)據(jù)中心,由本地的控制系統(tǒng)驗(yàn)證并執(zhí)行。
這種系統(tǒng)運(yùn)行的想法其實(shí)來(lái)自于在數(shù)據(jù)中心使用原來(lái)那個(gè) AI 推薦系統(tǒng)的操作人員。他們告訴 DeepMind 的研究人員們,雖然系統(tǒng)給他們教了一些最新最好的操作技巧,比如讓冷卻介質(zhì)覆蓋更多的設(shè)備,而不是更少,但是實(shí)現(xiàn)這些推薦操作其實(shí)需要花費(fèi)非常多的操作精力和長(zhǎng)期規(guī)劃。所以他們自然地就很想知道,能不能不需要人來(lái)出力就達(dá)到類似的能源節(jié)省效果。
谷歌的數(shù)據(jù)中心里一般都有上千臺(tái)服務(wù)器,它們支撐著谷歌搜索、Gmail、YouTube 等用戶們每天都會(huì)使用的服務(wù)。確保這些服務(wù)可以可靠、高效地運(yùn)行是最關(guān)鍵的一件事。DeepMind 和谷歌一起設(shè)計(jì) AI 智能體以及背后的控制界面時(shí),都是帶著安全、可靠的思維從頭設(shè)計(jì)的,還使用了 8 種不同的機(jī)制確保系統(tǒng)能夠總是能夠按照預(yù)期行動(dòng)。
他們使用的方法里,其中一種較為簡(jiǎn)單的是估計(jì)不確定性。對(duì)于總計(jì)上億個(gè)可能的動(dòng)作中的每一種,AI 智能體都需要計(jì)算自己認(rèn)為這是一個(gè)好的動(dòng)作的信心。估計(jì)出來(lái)信心太低的動(dòng)作就不去考慮了。
另一個(gè)方法是兩層驗(yàn)證。AI 計(jì)算出的最優(yōu)行動(dòng)首先需要根據(jù)一個(gè)內(nèi)置的、由數(shù)據(jù)中心運(yùn)營(yíng)人員們制定的安全限制清單做檢查。計(jì)算的結(jié)果通過(guò)檢查、從云端發(fā)送到實(shí)際的數(shù)據(jù)中心之后,當(dāng)?shù)氐目刂葡到y(tǒng)還會(huì)再次把指令根據(jù)自己的一套安全限制清單再檢查一遍。這種冗余設(shè)計(jì)的檢查流程確保了系統(tǒng)的運(yùn)行總是在當(dāng)?shù)氐南拗浦畠?nèi)的,操作人員們也總是對(duì)操作的邊界有完全的控制。
最重要的是,谷歌的數(shù)據(jù)中心總是會(huì)受到人類的完全控制的,人類隨時(shí)可以選擇退出 AI 控制模式。這時(shí)候,控制系統(tǒng)會(huì)自動(dòng)從 AI 控制無(wú)縫地切換到基于現(xiàn)代自動(dòng)化工業(yè)使用的基于現(xiàn)場(chǎng)規(guī)則的以及啟發(fā)式設(shè)計(jì)的控制系統(tǒng)。連續(xù)監(jiān)控、自動(dòng)錯(cuò)誤重啟、平滑切換、兩層驗(yàn)證、不間斷通訊、不確定性估計(jì)、規(guī)則與啟發(fā)式設(shè)計(jì)的備用控制系統(tǒng)、人類指令優(yōu)先
相比于原來(lái)的動(dòng)作推薦系統(tǒng)需要操作人員自己檢查以及實(shí)施推薦的動(dòng)作,新的 AI 控制系統(tǒng)是自己直接實(shí)現(xiàn)這些動(dòng)作的。DeepMind 和谷歌的研究人員在開(kāi)發(fā)它時(shí)也有有意識(shí)地把系統(tǒng)的優(yōu)化邊界設(shè)定到了一個(gè)更窄更小的策略中,讓它把安全和可靠作為首要目標(biāo),也就是說(shuō)對(duì)于節(jié)約能源的目標(biāo)來(lái)說(shuō),它需要在過(guò)于節(jié)約導(dǎo)致的不穩(wěn)定風(fēng)險(xiǎn)和優(yōu)化不足的低反饋之間找到平衡。
雖然只上線了幾個(gè)月時(shí)間,這個(gè)系統(tǒng)已經(jīng)可以穩(wěn)定地節(jié)約平均 30% 左右的能源,而且他們還期待系統(tǒng)未來(lái)可以改善更多。這是因?yàn)殡S著數(shù)據(jù)更多,系統(tǒng)的優(yōu)化判斷能力也會(huì)變得更強(qiáng),如下圖。隨著技術(shù)越來(lái)越成熟,DeepMind 和谷歌的研究人員未來(lái)也會(huì)把系統(tǒng)的優(yōu)化邊界設(shè)置得寬松一些,來(lái)達(dá)到更好的能源節(jié)約效果。
這個(gè) AI 直接控制的系統(tǒng)時(shí)不時(shí)找到一些新的方法管理冷卻系統(tǒng),有一些方法甚至讓數(shù)據(jù)庫(kù)操作人員覺(jué)得驚訝。與這個(gè)系統(tǒng)緊密協(xié)作的一位谷歌數(shù)據(jù)中心運(yùn)營(yíng)人員就驚訝道:「這個(gè) AI 會(huì)利用冬天外面比較冷的特點(diǎn),產(chǎn)生比平時(shí)更冷的冷卻水,然后減少了給數(shù)據(jù)中心降溫所需的能源消耗。規(guī)則是不會(huì)自己變得越來(lái)越好的,但是 AI 可以啊。」
對(duì)于已經(jīng)安全運(yùn)行、獨(dú)立運(yùn)行、降低能耗的 AI 直接控制系統(tǒng),DeepMind 和谷歌都覺(jué)得非常激動(dòng)。不過(guò),在數(shù)據(jù)中心中使用這樣的系統(tǒng)才僅僅是個(gè)開(kāi)始。在長(zhǎng)遠(yuǎn)的未來(lái),他們認(rèn)為還有很多的潛力把這樣的技術(shù)運(yùn)用在其他工業(yè)場(chǎng)景中,也就可以在更大的規(guī)模上幫助對(duì)抗氣候變化。