人工智能和機器學習的QA測試有何不同
智能手機、智能音箱、智能汽車、智能咖啡機,物品被賦予智能的例子不勝枚舉,似乎周圍的一切都獲得了生命和智慧。
由于人類長期以來對機器人統(tǒng)治世界充滿恐懼,這類的科幻小說也備受歡迎。但盡管如此,智能設(shè)備絕不是反烏托邦式的——它們的存在實際上是為了讓我們的生活更方便,讓我們有更多時間專注重要事務(wù),而不用操心單調(diào)忙碌的工作。
科技公司深知發(fā)展自動化是未來的必經(jīng)之路,一如當年福特率先推出汽車流水線。人工智能(AI)和機器學習(ML)這樣先進的技術(shù)正在為史上最振奮人心的創(chuàng)新賦能——想一想無人駕駛汽車、虛擬現(xiàn)實和增強現(xiàn)實、自動化投資、醫(yī)學成像等等創(chuàng)新吧。這些先進技術(shù)的優(yōu)勢日益凸顯,眾多公司爭先恐后地采用這些技術(shù),并將其應(yīng)用到自己的產(chǎn)品中。
隨著先進技術(shù)越來越廣泛應(yīng)用于汽車、醫(yī)療、金融等高敏感、高風險領(lǐng)域,開發(fā)運營團隊的QA測試(即QUALITY ASSURANCE TEST,質(zhì)量監(jiān)督測試)至關(guān)重要。如果公眾安全、客戶的生計或病人的數(shù)據(jù)有可能面臨風險,那么即使最智能的算法也必須經(jīng)過人類工程師反復(fù)檢查。
在深入探討智能設(shè)備的測試方法之前,我們需要先區(qū)分一下人工智能和機器學習。雖然這兩個術(shù)語經(jīng)常互換使用,但它們之間還是存在一些主要區(qū)別。簡單來說,人工智能系統(tǒng)以人類認為聰明或高效的方式執(zhí)行任務(wù),而機器學習系統(tǒng)則是利用已有數(shù)據(jù)進行自動的連續(xù)的自我訓練。
大量收集的數(shù)據(jù)會帶來存儲和分析方面的挑戰(zhàn)——清除這些數(shù)據(jù)可能耗費很多時間。數(shù)據(jù)收集可能發(fā)生在意外事件或情況下,這使收集數(shù)據(jù)并將其用于訓練變得困難重重。訓練和測試數(shù)據(jù)集中可能會出現(xiàn)個人偏見。在人工智能系統(tǒng)中,系統(tǒng)缺陷會迅速惡化并變得更加復(fù)雜。
人工智能系統(tǒng)取得成功的關(guān)鍵是精確無誤的數(shù)據(jù)。在將數(shù)據(jù)提供給人工智能系統(tǒng)之前,應(yīng)該對數(shù)據(jù)進行過濾、清理和驗證。QA團隊應(yīng)該警惕個人偏見以及多樣性問題出現(xiàn),這可能使系統(tǒng)對數(shù)據(jù)的解釋變得復(fù)雜——想一想汽車導(dǎo)航系統(tǒng)或智能手機助手試圖理解一種不常見的口音時的場景吧。
算法是人工智能的核心,算法可以處理數(shù)據(jù)并生成觀念。一些常見的算法涉及到易學性(即Netflix或Amazon學習用戶偏好并提供新推薦的能力)、語音識別(智能揚聲器)和現(xiàn)實世界的傳感器檢測(無人駕駛汽車)等技術(shù)。(這些技術(shù)應(yīng)通過模型驗證、易學性成功率、算法有效性和核心理解力等方面的全面測試。)算法如果在某一方面出現(xiàn)問題,都必將產(chǎn)生更為嚴重的后果。
與任何其他軟件平臺一樣,人工智能系統(tǒng)也需要性能和安全性的強化測試以及法規(guī)遵從性測試。未經(jīng)過恰當測試,利基安全漏洞(利用語音錄音欺騙語音識別軟件或控制聊天機器人)出現(xiàn)概率將會更高。建立人工智能系統(tǒng)目的在于接入其他系統(tǒng),在更大的場景中解決問題。為使所有集成環(huán)節(jié)運行正常,有必要對人工智能系統(tǒng)及其各個連接點進行完整評估。隨著越來越多系統(tǒng)吸收了人工智能系統(tǒng)的特性,對這些系統(tǒng)進行仔細測試至關(guān)重要。
機器學習系統(tǒng)的目標是在不進行顯式編程的情況下獨立獲取知識。實現(xiàn)該目標要求系統(tǒng)有持續(xù)的數(shù)據(jù)流輸入——此方法動態(tài)性更強,傳統(tǒng)測試正是基于此(固定輸入=固定輸出)。因此,QA專家需要從不同角度思考如何為機器學習系統(tǒng)實施測試策略。