過去的幾十年里,安防行業(yè)一直聚焦在以視頻監(jiān)控為核心的視覺技術的應用方面,由此也帶來了視頻監(jiān)控相關產(chǎn)品的持續(xù)演進。而伴隨著城市精細化管理進程的加快,除了視覺感知系統(tǒng)的建設之外,基于聲學技術的聽覺系統(tǒng)的應用價值也逐漸被挖掘出來,并作為城市視覺感知系統(tǒng)的補充,在交通管理、社會治安等領域發(fā)揮著重要作用。
其中典型的應用要數(shù)目前在各大城市陸續(xù)“上崗”的鳴笛抓拍系統(tǒng)。根據(jù)《中華人民共和國道路交通安全法實施條例》第62條規(guī)定:駕駛機動車不得在禁止鳴喇叭的區(qū)域或者路段鳴喇叭。司機亂鳴行為,不僅影響了市民的正常出行,也為文明的城市制造了不和諧的噪聲,對亂鳴的抓拍治理非常有用。
那么,如何實現(xiàn)對車輛鳴笛聲的檢測抓拍呢?這里面需要應用到的便是聲學技術。這兩年來,隨著聲學技術的發(fā)展,專業(yè)的鳴笛抓拍系統(tǒng)已經(jīng)相對成熟,并已陸續(xù)安裝部署在城市重點監(jiān)管路段。
鳴笛抓拍系統(tǒng)工作原理及流程
鳴笛抓拍系統(tǒng)的工作原理主要是先通過麥克風陣列采集系統(tǒng)對聲音識別后進行采集,再聯(lián)動電子抓拍系統(tǒng)進行畫面的抓拍,實現(xiàn)聲壓可視化,最后實時呈現(xiàn)在電子屏提示系統(tǒng)上。
從業(yè)內(nèi)部分廠家如其高科技、三平科技、微納感知、科大訊飛等企業(yè)推出的鳴笛抓拍系統(tǒng)方案來看,成熟的鳴笛抓拍系統(tǒng)一般由四大部分組成:1)聲學探頭,也稱聲學雷達;2)智能音頻分析單元;3)網(wǎng)絡攝像機;4)鳴笛抓拍智能管理系統(tǒng)。
其中,聲學探頭是捕捉復雜環(huán)境中特殊聲音的關鍵,聲學探頭一般由至少32路麥克風陣列組成,均勻分布的麥克風陣列可有效判斷車輛鳴笛聲并進行定位。
在聲學探頭檢測到汽車鳴笛后,音頻信息自動傳輸?shù)街悄芤纛l分析單元,通過深度神經(jīng)網(wǎng)絡算法,可智能分析識別聲音類別并進行聲紋對比,聯(lián)動網(wǎng)絡攝像機跟蹤抓拍鳴笛車輛的車牌號碼,輸出違章證據(jù)。
最后通過與交警執(zhí)法系統(tǒng)聯(lián)動的鳴笛抓拍智能管理系統(tǒng),將違章鳴笛行為證據(jù)上傳到交警執(zhí)法系統(tǒng),在PC端和手機端可以實時顯示和管理。
為了更好的支持不同交通場景下的鳴笛抓拍檢測,目前從幾大廠商的相關產(chǎn)品和方案中可以看出,一般都有推出這幾大系列,包括固定式、移動便攜式以及車載式鳴笛抓拍系統(tǒng)。
技術難點:復雜環(huán)境下聲音定位、識別
據(jù)安防知識網(wǎng)此前采訪微納感知CTO王丹了解到,復雜場景下的聲音處理之所以此前一直沒有大規(guī)模應用主要是因為技術實現(xiàn)上存在較大挑戰(zhàn),首先要將聲音從復雜環(huán)境中清晰的采集下來,其次要分析聲音包含的信息,這其中包含了一系列的陣列信號處理技術及AI算法。
作為鳴笛抓拍系統(tǒng)的核心,聲學探頭麥克風陣列信號處理技術主要包括回聲消除、噪聲&混響抑制等,將聲音清晰采集下來后傳送到后端人工智能引擎,然后基于AI技術展開聲音類型識別分析的應用,比如識別槍聲、鳴笛聲、建筑工地施工噪音以及人聲聲紋檢測、連續(xù)語音識別等等。
目前業(yè)內(nèi)各品牌方所推出的鳴笛抓拍系統(tǒng),比拼的點也主要在于聲學探頭的陣列信號處理技術以及在機器聽覺算法方面的優(yōu)勢。當然,作為一款已投入應用的設備系統(tǒng),性能和成本同樣也是用戶考慮的方面。為此,從廠商角度而言,這類產(chǎn)品的設計還需要充分考慮如何利舊。
交管部門對鳴笛抓拍系統(tǒng)的采購需求
相關部門在采購鳴笛抓拍系統(tǒng)時,也有較為明確的要求。從公開的系統(tǒng)采購文件中可以看到,用戶單位對鳴笛抓拍系統(tǒng)的功能要求主要集中在這幾個方面:
首先是聲學探頭的拾音技術要求。需要聲學探頭可監(jiān)測的聲音聲壓級范圍不小于30~120dB,有效探測距離不小于50米,麥克風±1dB 頻響范圍不小于 100~10kHz。有的單位還要求探頭的有效探測探測寬度要覆蓋到3-5車道。
另外在聯(lián)動攝像頭抓拍相關車輛的具體應用上,一般要求能夠抓拍到違法鳴笛車輛的車輛號碼、違法時間、違法地點等信息。具體到系統(tǒng)應能錄制鳴笛前后至少各一秒的聲音和視頻信號,并為視頻每一幀圖片疊加聲音云圖。鳴笛發(fā)生時,抓拍系統(tǒng)生成聲音視頻,視頻的每一幀應疊加正確的聲音云圖,聲音云圖的顯示和聲音同步,可清晰判斷出鳴笛聲來自鳴笛車輛。生成違法證據(jù)圖片和視頻,證據(jù)圖片和視頻應包含“聲音云圖”和“聲音視頻”。
在智能音頻分析環(huán)節(jié),要避免將車輛引擎聲、鳥叫聲、雨點聲等其他城市噪聲誤判為鳴笛聲進行抓拍,鳴笛抓拍準確率一般硬性要求在90%及以上。
另外,因為這一類設備一般安裝在戶外監(jiān)控桿上,因此不便于頻繁維護。為此用戶單位也希望可以通過系統(tǒng)軟件禁用有故障的拾音傳感器。禁用拾音傳感器不多于 8 個的情況下,無需對設備進行更換或維修,系統(tǒng)應仍能夠執(zhí)行鳴笛抓拍任務,準確率不應下降。
小結(jié)
交管部門的這些硬性要求如今已成為市面上鳴笛抓拍系統(tǒng)的“上崗”準則,而也只有滿足了這些參數(shù)標準,才能在實際場景中發(fā)揮真正的作用,有效輔助鳴笛處罰的取證和執(zhí)法工作,提升城市文明管理水平。
與此同時,除了鳴笛抓拍的應用之外,城市管理對異聲檢測、城市噪音治理等方面的應用也有明顯的需求。比如交管部門對改裝車噪音管控;城管部門對于城市噪音管理;住建部對建筑施工噪音的管理以及公安部門對于特殊人群聚集等這些都有很強的訴求。這些訴求也都將直接驅(qū)動著聲學技術應用范圍的拓展。當前階段,聲學技術及相關應用正以點位分布的形式在城市不同場景下展開,未來,隨著相關技術的日趨成熟以及應用面的打開,智能安防、智慧城市有望邁進機器聽覺時代。