AI即Artificial Intelligence,人工智能。這里的智能,不是智能硬件的智能,而是對應著人類大腦的智能。打造人工智能,就相當于賦予機器以智商和情商。
1963年,人類第一次與機器進行國際象棋對決。1997年,其時排名世界第一的加里·卡斯帕羅夫,輸給了由IBM研發(fā)的深藍計算機——一個每秒可以運算2億步棋的“怪物”。此后,國際象棋的人機對抗,成為了一種衡量計算機智能化程度的參照。
幾年前,由Google研發(fā)的AlphaGo第一次擊敗了比國際象棋更具挑戰(zhàn)性的圍棋職業(yè)選手。讓外界第一次領教了“深度學習”(Deep Learning)技術的威力。與深藍靠算力擊敗象棋選手不同,AlphaGo憑借的是“深度學習”原理,讓機器具備“思考”能力。
而縱觀消費電子產(chǎn)品中的AI,與上述的AI有著本質上的差別。在廣告渲染下,諸如Siri等語音助手也被當做了AI技術。不可否認,類似Siri這樣的產(chǎn)品,確實具備很多技術含量,但主要集中在語音識別和自然語言處理方面。這也算是AI領域的一項分支,但還不是真正的AI。
當前應用在智能家居和消費電子產(chǎn)品中的AI,并不具備真正的思考能力,它們只是在語音識別、語義識別的基礎上,對前端傳感器傳輸?shù)臄?shù)據(jù)進行了特定邏輯的歸納和演繹,并結合互聯(lián)網(wǎng)信息進行了二次加工。
一個真正的AI系統(tǒng),要經(jīng)過大量的數(shù)據(jù)訓練,逐步掌握以人類視角去理解事物的邏輯。比如,Google的人工智能系統(tǒng),在對幾百萬張貓的圖片進行學習后,基本掌握了視覺層面的貓的樣子,當它看到一張新的貓圖片后,能夠根據(jù)此前學習,判斷出“這是一只貓”。這才是真正的AI。
一個完整的AI系統(tǒng),包括了機器學習(ML)、自然語言處理(NLP)、專家系統(tǒng)、機器視覺、語音識別、策略和機器人學等多個方面。
機器學習中最重要的部分就是深度學習,深度學習的主要課題是研究神經(jīng)網(wǎng)絡。這個神經(jīng)網(wǎng)絡不是人腦的神經(jīng)網(wǎng)絡,而是一種賦予機器自主思考能力的邏輯算法。目前,深度學習的主要代表算法是卷積神經(jīng)網(wǎng)絡(CNN)、深度神經(jīng)網(wǎng)絡(DNN)和RNN(循環(huán)神經(jīng)網(wǎng)絡)。
無論是哪種算法,都在某種程度上模擬了人腦的運算法則。目前,科學界對人腦到底是如何運作的,還處于初期的探索階段。但神經(jīng)網(wǎng)絡的復雜架構,可以肯定是人腦思考的必要設施。僅大腦皮層就有140億個神經(jīng)元。
人類大腦特有的神經(jīng)網(wǎng)絡結構,以及龐大的神經(jīng)元數(shù)量,是人類具備自主思考能力的前提條件。計算機領域創(chuàng)造機器的神經(jīng)網(wǎng)絡,就是一種“仿生學”算法。從數(shù)學角度講,人類之所以有意識,正是大腦神經(jīng)網(wǎng)絡的閉環(huán)結構所創(chuàng)造的一種超級計算機導致的結果。
當你在思考“明天中午吃什么”的問題時,大腦至少有幾十億個神經(jīng)元參與其中,神經(jīng)介質以每小時250公里(17級臺風的風速)的速度傳遞在神經(jīng)網(wǎng)絡中。放在AI中,基本原理是相同的,只不過這個過程中的“介質”傳遞速度是根據(jù)芯片的運算速度決定的,顯然比人腦要快很多倍。
CNN、DNN和RNN在思路上有些差異,但并不是完全排斥的,每種算法都有其他算法所不能及的一面優(yōu)勢。DNN是基于NN(神經(jīng)網(wǎng)絡算法)改良的一種算法,解決了梯度消失的問題;而CNN則是將圖像處理融入其中的一種,解決了DNN算法中的過度擬合和局部最優(yōu)解的問題;RNN則是以時間作為深度的神經(jīng)網(wǎng)絡。
除了機器學習外,自然語言處理也是AI中的重要分支,它讓計算機能夠聽懂人類的指令。專家系統(tǒng)是指向AI輸入某個領域的專業(yè)知識,以滿足其在特定場景中的功能。對于AI來說,目前的重點還在于機器學習與自然語言處理上,這是讓人工智能服務于某個場景或客體的前提。