安防AI的發(fā)展主要面臨以三個(gè)方面的挑戰(zhàn)
安防AI的發(fā)展主要面臨以三個(gè)方面的挑戰(zhàn):算法的場景適應(yīng)能力、大規(guī)模應(yīng)用的技術(shù)與經(jīng)濟(jì)可行性和面向業(yè)務(wù)應(yīng)用的解決方案。
算法的場景適應(yīng)能力
以人臉識別為例,目前絕大多數(shù)廠商的算法來源于對人臉靜態(tài)圖片的學(xué)習(xí)訓(xùn)練—比如標(biāo)準(zhǔn)證件照,對所采集的人臉照片的清晰度、光照、角度、妝容都有著嚴(yán)格的要求,但在實(shí)際監(jiān)控場景中,除了室內(nèi)個(gè)別環(huán)境外,絕大多數(shù)現(xiàn)場環(huán)境采集的人臉圖片無法滿足這樣的要求,造成人臉識別精度的大幅度衰減。如國內(nèi)某知名廠商的人臉識別算法在靜態(tài)人臉比對測試中總是名列前茅,但其復(fù)雜環(huán)境下動(dòng)態(tài)人臉識別的效果就比較差,特別是在偏轉(zhuǎn)角度較大(超過30°)、化妝、戴墨鏡、戴口罩等情況下識別率會大打折扣。
大規(guī)模應(yīng)用的技術(shù)與經(jīng)濟(jì)可行性
目前計(jì)算機(jī)視覺的大規(guī)模運(yùn)算還主要依賴GPU和CPU的算力,以人臉識別和視頻結(jié)構(gòu)化分析為例,一般利用GPU做視頻圖像處理與特征解析運(yùn)算,用CPU做人臉特征比對運(yùn)算。在復(fù)雜動(dòng)態(tài)人臉采集環(huán)境下,1臺8卡GPU(TESLA P4)+2個(gè)16核CPU服務(wù)器每秒可支持80路1080P高清視頻實(shí)時(shí)動(dòng)態(tài)解析和100萬庫的實(shí)時(shí)動(dòng)態(tài)比對運(yùn)算,硬件成本折合4000元/路,電力消耗(服務(wù)器自身耗電+散熱制冷耗電)折合每年800元/路。如果采用800萬像素的監(jiān)控圖像,硬成本會再增加3倍,這還沒有計(jì)算算法與應(yīng)用軟件系統(tǒng)的費(fèi)用,如此高昂的建設(shè)與運(yùn)行費(fèi)用很難得到大規(guī)模的應(yīng)用推廣。
面向業(yè)務(wù)應(yīng)用的解決方案
AI是一項(xiàng)技術(shù),從AI技術(shù)到客戶價(jià)值,需要一整套的產(chǎn)品與解決方案,向客戶最終交付的是應(yīng)用,尤其是面向業(yè)務(wù)的應(yīng)用軟件,不同行業(yè)、不同場景、不同用途的業(yè)務(wù)應(yīng)用都不盡相同,需要針對性的集成與應(yīng)用軟件開發(fā),否則無法規(guī)?;茝V。而目前情況來看,無論是AI算法廠商、安防產(chǎn)品商還是系統(tǒng)集成商,都不具備全行業(yè)應(yīng)用軟件的開發(fā)能力。