機器學習已是現在進行式,當其發(fā)展成人工智能 AI,終究會對我們造成影響,但機器到底能學會什么?
機器能學會什么?
機器人(Robot)行動笨拙,除了制造業(yè)的專用機器手臂,機器人的動作遠不如人類靈敏,是因為機械操演不夠靈活。但機器學習(Machine Learning, ML)則是另一個領域,是人工智能 AI 的核心技術,不需要機械的操演,但能學習人類相當多的技術,甚至替代人類的工作。
一旦機器人的機械操演技術進一步進展,也就會學到一些人類日常生活的動作,當然這也要用機器學習產生的 AI 做為腦子。所以機器學習 ML,恐怕不是一個機器人坐在書堆上,一本本的讀。
上個月《科學》(Science)雜志有一篇報導,探討機器學習的特性與功能,有些領域機器可以學的非常好,這領域的工作遲早會被機器替代,但有的領域機器卻學不了,在這些領域人類仍然主導。
目前的機器學習主要是用計算機仿真的神經網絡,模仿我們思考的方式,然后用大量的數據(大數據)來訓練,增進智慧,訓練結束之后,就成為一個 AI 軟件。當然這句話的解釋過于簡單,實際上用計算機軟件模仿我們腦神經的運作,適用性仍有爭議,這只是目前的技術。
機器雖然不同于人類,但學習的情形有類似的地方,比如從病歷診斷哪一種疾病發(fā)生的機率,從貸款申請預測未來償還的機率,這些都是醫(yī)師與理財專家天天做的事,但機器可能比人做的更快更好,因為因果關系、也就是輸入與輸出的連結,定義清楚,適合機器的學習運算。
機器學習不單靠規(guī)則,還要靠經驗數據來訓練,越多的資料、學習的越精準,大數據的概念就用到這里。大數據可來自監(jiān)測網絡的交易與互動,人工加注分類整理,或針對特定問題制作的仿真,但數據來自非結構化的來源,像是網絡聊天,可能產生偏差,機器學習的結果也難免偏頗。另外,靠數據訓練,并非適合所有的領域。
最有意思的是,只要有明確的目標,甚至不必知道達到目標的最好方法,只要運用整理好的數據來訓練,機器的學習效果就特別好。這種方式通常用在系統層面的宏觀領域,像是讓公司獲取最大的利潤,讓市區(qū)的交通流暢無阻,而不是用在細微枝節(jié)上,因為枝節(jié)的數據范圍太窄,難免有錯。
另一個有意思的是,機器是不講理的,學習得到結果,卻說不出演繹的道理,醫(yī)師能從病歷耐心的解釋診斷的結果,但機器的解說顯然不如醫(yī)師。這正說明了計算機仿真與人的思維運作不同,神經網絡從輸入到輸出可能有很多層次,每一層次運算出多項結果傳遞給下一層,這些中間結果并不做他用,所以我們看到最終結果,卻看不到中間過程。
機器學習的算術法,都是用統計與或然率求得答案,學的再好,一旦用到 AI 解決問題,都沒有100%的肯定答案,也就是仍然有出錯的機會,如同最好的人類專家一樣,我們用 AI 解決問題,要把容忍出錯放在心上。
綜合機器學習的特性,需要大量數據,定義嚴謹的輸入與輸出連結,使用統計與或然率,不能發(fā)展出單一的最佳答案,不能做清晰解釋。機器「受困」于計算機仿真的神經網絡,缺乏人類的適應性,不能突然改變。
所以底線是,許多工作難以自動化,至少要比傳說的來得慢。但仍不能掉以輕心,機器學習發(fā)展成 AI,終究會對我們造成影響,在不同的領域,以不同的程度替代我們的工作。 值得注意的是,機器學習也不斷的在“學習”,學習能力一天天提升。