DIRHA 旨在于解決遠距離語音人機互動在多噪音、多講話者的環(huán)境中所面對的挑戰(zhàn)。該專案的目標是設立一個可隨時隨地接收聲音訊息的環(huán)境,即便用戶沒有對準麥克風講話,也能被系統(tǒng)辨識并使用,從聲學角度來看,語音識別系統(tǒng)必須延伸到講者身邊,而且語音識別性能不受講者所在家中的位置的影響。
意法半導體 MEMS 麥克風的外觀尺寸和聲學參數(shù)均完全滿足遠距離語音互動系統(tǒng)的嚴格要求。 MEMS 麥克風所具有的精巧尺寸能讓研究人員能夠輕松將整個麥克風陣列完全嵌在自動化家庭的墻壁、書桌或聲控家電內,而麥克風所擁有的優(yōu)異聲學特性,結合先進的訊號處理技術,讓語音系統(tǒng)能夠在一間正播放音樂、充滿著人的房間內識別并擷取一個人從幾公尺以外的地方發(fā)出的聲音命令。
遠距離語音人機互動技術不僅能大幅改變人機互動方式,還能真正改變那些行動不便的人(如老人或有運動障礙的病患)的生活方式。除了在家庭使用外,遠距離語音人機互動系統(tǒng)還適用于機器人、遠端臨場(telepresence)、監(jiān)視系統(tǒng)和產(chǎn)業(yè)自動化。
DIRHA 專案分成許多小組,專案期限共36個月,總投資480萬歐元。主要研究領域包括多通道聲學處理、遠距離語音識別、身份識別/驗證以及口語對話管理(德語、希臘語、義大利語和葡萄牙語)。最終的設計原型將被示范家庭(pilot household)所試用,由真人用戶對設計性能進行評估。
DIRHA 專案成員包括義大利 Fondazione Bruno Kessler (專案協(xié)調人)、希臘 Athena Research and Innovation Center in Information Communication & Knowledge Technologies 、義大利 DomoticArea 、葡萄牙 INESC ID - Instituto de Engenharia de Sistemas e Computatores, Investigacae e Desenvolvimento em Lisboa、義大利NewAmuser 、意法半導體義大利分公司以及奧地利 Technische Universitaet Graz。