本文將詳細聊一聊人工智能五大趨勢,以及MathWorks是如何順應時代要求,做一個“AI時代造物者”的?“我們認為2020年將成為‘AI驅(qū)動系統(tǒng)’年?!?
這句話出自MathWorks(邁斯沃克軟件)首席戰(zhàn)略師Jim Tung。乍一看,并無新奇。近幾年來,哪年不是AI年?整的比大年初一還要熱鬧。但這句話中關鍵詞是“系統(tǒng)”,隨著人工智能在多種工業(yè)應用當中的快速發(fā)展,作為“AI驅(qū)動系統(tǒng)”的關鍵2020年,MathWorks還預測了本年將有人工智能五大趨勢。分別是:
1. 勞動力技能和數(shù)據(jù)質(zhì)量壁壘開始消弭
2. AI 驅(qū)動系統(tǒng)的興起使設計復雜度進一步提高
3. 將 AI 部署到低功耗、低成本的嵌入式設備的過程日益簡便
4. 強化學習開始從游戲領域轉(zhuǎn)向現(xiàn)實世界的工業(yè)應用領域
5. 仿真可以降低成功采用 AI 所面臨的主要壁壘——數(shù)據(jù)質(zhì)量欠佳
本文將詳細聊一聊這五大趨勢,以及MathWorks是如何順應時代要求,做一個“AI時代造物者”的?
怎樣的AI時代?
隨機找一位路人,問他“這是怎樣的AI時代?”不管專業(yè)還是非專業(yè)人士,一定給你一個類似“BOOM”的答案。這些年,說一次AI天上就掉下一粒沙,于是有了撒哈拉。但一切又像處于行業(yè)爆發(fā)前夕,據(jù)Gartner調(diào)查研究顯示,如下圖,從事人工智能或機器學習工作的企業(yè)平均有4個AI/ML項目到位。59%的受訪者表示他們已經(jīng)部署了人工智能。
受訪者們還希望在未來12個月內(nèi)再增加6個項目,在未來3年內(nèi)再增加15個項目。這意味著在2022年,這些機構(gòu)預計平均有35個AI或ML項目就位。
此外,Gartner這份調(diào)研還表示,目前這些企業(yè)在應用人工智能和機器學習技術時面臨的如下圖顯示的三大挑戰(zhàn),其中首要解決的是員工技能、數(shù)據(jù)范圍和質(zhì)量以及AI優(yōu)勢的理解和應用。團隊技能和數(shù)據(jù)的可用性成了兩大壁壘。Jim Tung表示:“通過雇傭新的專家,能夠在一定程度上解決團隊技能方面的問題,但現(xiàn)有團隊成員的技能也需要提高。這兩大壁壘對于AI技術的成功應用十分重要,亟待解決?!?


“AI 的普及被什么東西拖累了?!盙artner 副總裁 Svetlana Sicular指出了AI大廈上方的烏云。而本文開頭所說的5大趨勢,似乎要撥開這團云霧。
技能與數(shù)據(jù)
5大趨勢中的第一個關于勞動力技能與數(shù)據(jù)質(zhì)量的壁壘已打破。Jim Tung認為,越來越多的工程師和科學家開始參與到AI項目中,他們可以很好獲取現(xiàn)有深度學習的預訓練模型,以及一些公開的研究成果,能夠協(xié)助更廣泛地應用AI技術。也就是說,AI領域已經(jīng)不再缺乏真正的領域高手。人們可以在AI模型中更多地利用傳感器數(shù)據(jù),包括時間序列數(shù)據(jù)、文本和雷達信號。這些工程師和科學家能夠充分利用自己對數(shù)據(jù)的了解,這將對AI項目的成功產(chǎn)生重大影響。
此外,自動標注工具能夠加快高質(zhì)量大型數(shù)據(jù)集的準備。MathWorks能夠提供一系列的應用程序來幫助工程師、科學家和數(shù)據(jù)科學家快速標注圖像數(shù)據(jù),以及用于其他數(shù)據(jù)的應用程序。
當然,天底下沒有那么多專家,非專家就不配做AI項目嗎?顯然不是,Jim Tung表示,MathWorks提供一系列的應用程序來幫助他們更高效地完成工作。在應用程序中,通過點擊的方式,引導工程師們完成工作流當中的設計和分析等各個步驟。MathWorks所提供的諸如Deep Network Designer和Classification Learner等工具能使工程師們更加得心應手。其中,Deep Network Designer 應用程序可用于創(chuàng)建、可視化并編輯深度學習網(wǎng)絡;Classification Learner 應用程序可用于嘗試不同的分類器,以查找數(shù)據(jù)集的最佳擬合。

Deep Network Designer
Jim Tung表示:“應用程序之所以重要,是因為它們能夠幫助非AI領域?qū)<矣行褂孟嚓P技術,例如在深度學習工作流中的應用,用戶獲取模型,導入網(wǎng)絡,訓練圖像分類網(wǎng)絡,并生成代碼用于訓練,這都是以一種按鍵點擊的方式來執(zhí)行的?!?
另一個工具——MathWorks的Experiment Manager應用程序,可以管理多組實驗、記錄參數(shù)并分析并比較結(jié)果。

Experiment Manage
在垂直領域中,從 Diagnostic Feature Designer 應用程序生成MATLAB 代碼,以實現(xiàn)信號處理,特征提取和特征排序任務的自動化,工程師們能夠快速提取關鍵特征,在系統(tǒng)因故障失效前,用于預測何時需要對系統(tǒng)進行維護。
對于非數(shù)據(jù)科學領域?qū)<?,Classification Learner可以幫助用戶通過一鍵點擊的方式訓練多種機器學習模型,通過并行計算的方式進行模型訓練,這樣他們能夠快速發(fā)現(xiàn)合適的模型。以及超參數(shù)調(diào)優(yōu)等高級功能。
同時MATLAB也為專家們提供了完整的軟件功能,為解決更多不同的問題進行技術開發(fā),包括當前領先的一些技術,例如AutoML。
Jim Tung舉了一個最新的例子,復旦大學利用MATLAB來開發(fā)相應的數(shù)學模型,用于預測新冠肺炎的傳染趨勢,為中國的政府提供相應的公共措施方面的指導。MATLAB在這個項目當中的主要應用有:數(shù)據(jù)的可視化和預處理,模型的擬合還有開發(fā),以及參數(shù)的調(diào)優(yōu),數(shù)值仿真和測試,還有應用程序的開發(fā),并最終以Web應用的形式部署。
AI設計復雜度提高
MathWorks預測,如今AI 驅(qū)動系統(tǒng)的興起使設計復雜度進一步提高。一方面來說,工程師正積極將 AI 推廣應用于各種系統(tǒng),包括自動駕駛汽車、飛機引擎、工業(yè)廠房和風力發(fā)電機。另一方面,AI模型的行為對于這些復雜多域系統(tǒng)的整體性能具有重大影響。此外,設計人員期望利用基于模型的設計工具,對這些 AI 驅(qū)動系統(tǒng)進行仿真、集成和持續(xù)測試。
“工程師們期望使用基于模型的設計的方法,通過仿真、AI模型的集成以及持續(xù)測試理解如何創(chuàng)建魯棒的AI驅(qū)動系統(tǒng)?!盝im Tung如此說道,還舉了一個MathWorks客戶使用 Simulink 進行快速開發(fā)迭代和測試的例子。

Voyage公司將自動駕駛算法嵌入車輛中,為老人護理機構(gòu)提供服務,僅僅在3個月內(nèi),就非??焖俚貙崿F(xiàn)了level3的無人駕駛汽車開發(fā)。他們通過基于模型的設計集成AI功能和汽車的其他子系統(tǒng),從而快速地理解系統(tǒng)行為。
低功耗、低成本
Jim Tung表示,如今將AI 部署到低功耗、低成本的嵌入式設備的過程日益簡便。主要有三點原因1,AI 通常采用32位浮點運算,這在 GPU、集群和數(shù)據(jù)中心等高性能計算系統(tǒng)中廣為應用2,軟件工具的最新發(fā)展現(xiàn)已支持采用不同級別定點運算的 AI 推理模型3,這使得在低功耗、低成本設備上部署 AI 成為可能,并為工程師將 AI 技術融入設計開辟了新天地。
如今,工程師可以使用軟件工具,特別是自動代碼生成功能,能夠在開發(fā)一次模型后,使用代碼生成功能將其部署到各種不同的平臺上,例如生成C++代碼,或生成CUDA代碼應用于GPU上,例如NVIDIA,以及HDL代碼,應用在FPGA上,一個來源,多個目標,全部自動實現(xiàn)。

MathWorks提供的Deep Network Quantizer工具,可以快速導入一個預訓練好的模型,根據(jù)真實數(shù)據(jù)對模型進行校準,校準統(tǒng)計量范圍,并對網(wǎng)絡各層進行量化,或創(chuàng)建定點運算表達,驗證。
Jim Tung表示:“我們還支持其他傳統(tǒng)的機器學習算法的定點代碼生成,例如決策樹,支持向量機模型,這些模型的自動代碼生成是可靠性和速度的關鍵?!?
工業(yè)領域的強化學習
AI第四個趨勢則是強化學習開始從游戲領域轉(zhuǎn)向現(xiàn)實世界的工業(yè)應用領域。Jim Tung認為,強化學習 (RL) 賦能現(xiàn)實世界的工業(yè)應用,尤其是自動駕駛、自主系統(tǒng)、控制設計和機器人。
如今強化學習的實現(xiàn)需要大量的數(shù)據(jù),數(shù)據(jù)來源則是模型的仿真,在模型中將模擬一些在現(xiàn)實世界當中難以復現(xiàn)的條件。
Jim Tung提到,MathWorks還開發(fā)了強化學習工具箱,支持內(nèi)置的和自定義的強化學習智能體的應用。在MATLAB和Simulink當中,用戶可以對環(huán)境進行建模。同時,深度學習工具箱也支持一些強化學習策略的設計。還提供了GPU以及云端的訓練加速功能。另外通過仿真,用戶可以驗證強化學習策略是否合理。同時MathWorks也提供了嵌入式系統(tǒng)的代碼生成,以及之前提到的參考示例供用戶快速起步來進行項目的開發(fā)。
在一個無人駕駛汽車案例中,Simulink模型中有車輛的模型以及軟件部分的控制器模型,此外還有感知算法部分的模型,根據(jù)車載攝像頭采集的圖像數(shù)據(jù),識別車道,感知周圍的路況。在強化學習部分,使用仿真數(shù)據(jù)訓練智能體做出決策,改善行為。

數(shù)據(jù)質(zhì)量欠佳
Jim Tung認為,目前采用 AI 所面臨的主要壁壘是數(shù)據(jù)質(zhì)量欠佳。所謂數(shù)據(jù)質(zhì)量,涉及兩個部分一個是數(shù)據(jù)的質(zhì)量,一個是數(shù)據(jù)的范圍。首先是故障問題數(shù)據(jù),這些對預測性維護非常有幫助,背后則需要故障模式的仿真。另外,各類數(shù)據(jù)不均衡。MathWorks可以提供數(shù)據(jù)可視化標準化的工具,數(shù)據(jù)質(zhì)量。
仿真可以解決這個難題。Jim Tung表示,一方面人們真正需要的是異常和嚴重故障狀態(tài)下的數(shù)據(jù)。另一方面,從物理設備中生成故障數(shù)據(jù)具有破壞性而且代價高昂,最佳做法是通過仿真呈現(xiàn)故障行為生成數(shù)據(jù),進而運用合成數(shù)據(jù)訓練準確的 AI 模型。
據(jù)了解,可以采用在基于模型設計的流程當中開發(fā)的模型,對模型進行些許調(diào)整,來模仿故障模式,而不是正常工作模式。這些故障模式的模型可以仿真生成大量的數(shù)據(jù)來描述故障狀態(tài),用于訓練AI模型以及故障檢測。
Jim Tung表示:“使用Simulink提高訓練數(shù)據(jù)質(zhì)量的場景很多,其中之一是,AI可以被用在多種產(chǎn)品中,而不僅僅是一種終端的解決方案,同樣它也是一系列的技術,可用于多個領域,例如說雷達信號的仿真,以及無人駕駛汽車,還有激光雷達傳感器的感知算法,因此可以被MathWorks各類用戶使用?!?
月,MathWorks在Gartner 的《2020 年數(shù)據(jù)科學和機器學習平臺魔力象限》報告中被評為領導者。Gartner 對 MathWorks 的前瞻性和執(zhí)行能力進行評估后,將該公司定位為 2020 年度領導者。

Jim Tung認為:“在整個魔力象限中,MathWorks獨特點在于,我們主要服務工業(yè)用戶,即那些建造并提供實際的物理設備、機器、汽車的企業(yè)等。Gartner在評估的時候,他們也考慮到了這一點,越來越多的數(shù)據(jù)來自于機器和硬件資產(chǎn),這也是將我們MathWorks認定為在產(chǎn)品的完整度和遠見性方面最強的一個供應商的部分原因。因為我們認識到AI的應用前景不僅在數(shù)據(jù)挖掘上,更重要的是怎樣管理和優(yōu)化資產(chǎn)。這是我們區(qū)別于其他供應商的一點。為什么說我們和象限中的其他廠商并不是競爭對手,因為我們在大多數(shù)情況下各自面向的是不同的市場?!?
MathWorks的想法很純粹,即盡量滿足AI工業(yè)應用的需求。AI工業(yè)需要什么,MathWorks就制造什么。