隨著技術(shù)的日漸成熟智能安防聽覺時(shí)代或許即將到來

時(shí)間：2020-05-12 16:03:01

關(guān)鍵字：智能安防聲學(xué) 噪音麥克風(fēng)陣列

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 過去的幾十年里，安防行業(yè)一直聚焦在以視頻監(jiān)控為核心的視覺技術(shù)的應(yīng)用方面，由此也帶來了視頻監(jiān)控相關(guān)產(chǎn)品的持續(xù)演進(jìn)。而伴隨著城市精細(xì)化管理進(jìn)程的加快，除了視覺感知系統(tǒng)的建設(shè)之外，基于聲學(xué)技術(shù)的聽覺系

過去的幾十年里，安防行業(yè)一直聚焦在以視頻監(jiān)控為核心的視覺技術(shù)的應(yīng)用方面，由此也帶來了視頻監(jiān)控相關(guān)產(chǎn)品的持續(xù)演進(jìn)。而伴隨著城市精細(xì)化管理進(jìn)程的加快，除了視覺感知系統(tǒng)的建設(shè)之外，基于聲學(xué)技術(shù)的聽覺系統(tǒng)的應(yīng)用價(jià)值也逐漸被挖掘出來，并作為城市視覺感知系統(tǒng)的補(bǔ)充，在交通管理、社會治安等領(lǐng)域發(fā)揮著重要作用。

其中典型的應(yīng)用要數(shù)目前在各大城市陸續(xù)“上崗”的鳴笛抓拍系統(tǒng)。根據(jù)《中華人民共和國道路交通安全法實(shí)施條例》第62條規(guī)定：駕駛機(jī)動車不得在禁止鳴喇叭的區(qū)域或者路段鳴喇叭。司機(jī)亂鳴行為，不僅影響了市民的正常出行，也為文明的城市制造了不和諧的噪聲，對亂鳴的抓拍治理非常有用。

那么，如何實(shí)現(xiàn)對車輛鳴笛聲的檢測抓拍呢？這里面需要應(yīng)用到的便是聲學(xué)技術(shù)。這兩年來，隨著聲學(xué)技術(shù)的發(fā)展，專業(yè)的鳴笛抓拍系統(tǒng)已經(jīng)相對成熟，并已陸續(xù)安裝部署在城市重點(diǎn)監(jiān)管路段。

鳴笛抓拍系統(tǒng)工作原理及流程

鳴笛抓拍系統(tǒng)的工作原理主要是先通過麥克風(fēng)陣列采集系統(tǒng)對聲音識別后進(jìn)行采集，再聯(lián)動電子抓拍系統(tǒng)進(jìn)行畫面的抓拍，實(shí)現(xiàn)聲壓可視化，最后實(shí)時(shí)呈現(xiàn)在電子屏提示系統(tǒng)上。

從業(yè)內(nèi)部分廠家如其高科技、三平科技、微納感知、科大訊飛等企業(yè)推出的鳴笛抓拍系統(tǒng)方案來看，成熟的鳴笛抓拍系統(tǒng)一般由四大部分組成：1）聲學(xué)探頭，也稱聲學(xué)雷達(dá)；2）智能音頻分析單元；3）網(wǎng)絡(luò)攝像機(jī)；4）鳴笛抓拍智能管理系統(tǒng)。

其中，聲學(xué)探頭是捕捉復(fù)雜環(huán)境中特殊聲音的關(guān)鍵，聲學(xué)探頭一般由至少32路麥克風(fēng)陣列組成，均勻分布的麥克風(fēng)陣列可有效判斷車輛鳴笛聲并進(jìn)行定位。

在聲學(xué)探頭檢測到汽車鳴笛后，音頻信息自動傳輸?shù)街悄芤纛l分析單元，通過深度神經(jīng)網(wǎng)絡(luò)算法，可智能分析識別聲音類別并進(jìn)行聲紋對比，聯(lián)動網(wǎng)絡(luò)攝像機(jī)跟蹤抓拍鳴笛車輛的車牌號碼，輸出違章證據(jù)。

最后通過與交警執(zhí)法系統(tǒng)聯(lián)動的鳴笛抓拍智能管理系統(tǒng)，將違章鳴笛行為證據(jù)上傳到交警執(zhí)法系統(tǒng)，在PC端和手機(jī)端可以實(shí)時(shí)顯示和管理。

為了更好的支持不同交通場景下的鳴笛抓拍檢測，目前從幾大廠商的相關(guān)產(chǎn)品和方案中可以看出，一般都有推出這幾大系列，包括固定式、移動便攜式以及車載式鳴笛抓拍系統(tǒng)。

技術(shù)難點(diǎn)：復(fù)雜環(huán)境下聲音定位、識別

據(jù)安防知識網(wǎng)此前采訪微納感知CTO王丹了解到，復(fù)雜場景下的聲音處理之所以此前一直沒有大規(guī)模應(yīng)用主要是因?yàn)榧夹g(shù)實(shí)現(xiàn)上存在較大挑戰(zhàn)，首先要將聲音從復(fù)雜環(huán)境中清晰的采集下來，其次要分析聲音包含的信息，這其中包含了一系列的陣列信號處理技術(shù)及AI算法。

作為鳴笛抓拍系統(tǒng)的核心，聲學(xué)探頭麥克風(fēng)陣列信號處理技術(shù)主要包括回聲消除、噪聲&混響抑制等，將聲音清晰采集下來后傳送到后端人工智能引擎，然后基于AI技術(shù)展開聲音類型識別分析的應(yīng)用，比如識別槍聲、鳴笛聲、建筑工地施工噪音以及人聲聲紋檢測、連續(xù)語音識別等等。

目前業(yè)內(nèi)各品牌方所推出的鳴笛抓拍系統(tǒng)，比拼的點(diǎn)也主要在于聲學(xué)探頭的陣列信號處理技術(shù)以及在機(jī)器聽覺算法方面的優(yōu)勢。當(dāng)然，作為一款已投入應(yīng)用的設(shè)備系統(tǒng)，性能和成本同樣也是用戶考慮的方面。為此，從廠商角度而言，這類產(chǎn)品的設(shè)計(jì)還需要充分考慮如何利舊。

交管部門對鳴笛抓拍系統(tǒng)的采購需求

相關(guān)部門在采購鳴笛抓拍系統(tǒng)時(shí)，也有較為明確的要求。從公開的系統(tǒng)采購文件中可以看到，用戶單位對鳴笛抓拍系統(tǒng)的功能要求主要集中在這幾個(gè)方面：

首先是聲學(xué)探頭的拾音技術(shù)要求。需要聲學(xué)探頭可監(jiān)測的聲音聲壓級范圍不小于30~120dB，有效探測距離不小于50米，麥克風(fēng)±1dB 頻響范圍不小于 100～10kHz。有的單位還要求探頭的有效探測探測寬度要覆蓋到3-5車道。

另外在聯(lián)動攝像頭抓拍相關(guān)車輛的具體應(yīng)用上，一般要求能夠抓拍到違法鳴笛車輛的車輛號碼、違法時(shí)間、違法地點(diǎn)等信息。具體到系統(tǒng)應(yīng)能錄制鳴笛前后至少各一秒的聲音和視頻信號，并為視頻每一幀圖片疊加聲音云圖。鳴笛發(fā)生時(shí)，抓拍系統(tǒng)生成聲音視頻，視頻的每一幀應(yīng)疊加正確的聲音云圖，聲音云圖的顯示和聲音同步，可清晰判斷出鳴笛聲來自鳴笛車輛。生成違法證據(jù)圖片和視頻，證據(jù)圖片和視頻應(yīng)包含“聲音云圖”和“聲音視頻”。

在智能音頻分析環(huán)節(jié)，要避免將車輛引擎聲、鳥叫聲、雨點(diǎn)聲等其他城市噪聲誤判為鳴笛聲進(jìn)行抓拍，鳴笛抓拍準(zhǔn)確率一般硬性要求在90%及以上。

另外，因?yàn)檫@一類設(shè)備一般安裝在戶外監(jiān)控桿上，因此不便于頻繁維護(hù)。為此用戶單位也希望可以通過系統(tǒng)軟件禁用有故障的拾音傳感器。禁用拾音傳感器不多于 8 個(gè)的情況下，無需對設(shè)備進(jìn)行更換或維修，系統(tǒng)應(yīng)仍能夠執(zhí)行鳴笛抓拍任務(wù)，準(zhǔn)確率不應(yīng)下降。

小結(jié)

交管部門的這些硬性要求如今已成為市面上鳴笛抓拍系統(tǒng)的“上崗”準(zhǔn)則，而也只有滿足了這些參數(shù)標(biāo)準(zhǔn)，才能在實(shí)際場景中發(fā)揮真正的作用，有效輔助鳴笛處罰的取證和執(zhí)法工作，提升城市文明管理水平。

與此同時(shí)，除了鳴笛抓拍的應(yīng)用之外，城市管理對異聲檢測、城市噪音治理等方面的應(yīng)用也有明顯的需求。比如交管部門對改裝車噪音管控；城管部門對于城市噪音管理；住建部對建筑施工噪音的管理以及公安部門對于特殊人群聚集等這些都有很強(qiáng)的訴求。這些訴求也都將直接驅(qū)動著聲學(xué)技術(shù)應(yīng)用范圍的拓展。當(dāng)前階段，聲學(xué)技術(shù)及相關(guān)應(yīng)用正以點(diǎn)位分布的形式在城市不同場景下展開，未來，隨著相關(guān)技術(shù)的日趨成熟以及應(yīng)用面的打開，智能安防、智慧城市有望邁進(jìn)機(jī)器聽覺時(shí)代。