當(dāng)前位置:首頁 > 汽車電子 > 汽車電子技術(shù)文庫
[導(dǎo)讀] 寶馬在設(shè)計(jì)iDrive (智能駕駛控制系統(tǒng))時(shí),始終堅(jiān)持的一個(gè)原則是“不分心”。2011年,當(dāng)時(shí)的寶馬人機(jī)界面負(fù)責(zé)人Bernarhd Neidermaier在一次交流中提到,設(shè)計(jì)師們心里其實(shí)有一

寶馬在設(shè)計(jì)iDrive (智能駕駛控制系統(tǒng))時(shí),始終堅(jiān)持的一個(gè)原則是“不分心”。2011年,當(dāng)時(shí)的寶馬人機(jī)界面負(fù)責(zé)人Bernarhd Neidermaier在一次交流中提到,設(shè)計(jì)師們心里其實(shí)有一條水平參考線——顯示相關(guān)的都在線上,控制相關(guān)的在線下。他們努力將兩者剝離,目的是盡可能地減少低頭看屏分散注意力的時(shí)間,并且保證駕駛員用按鈕控制時(shí),不用傾斜身體或者抬起手臂。

這種把顯示與控制剝離的設(shè)計(jì),一直被沿用了下來。

另一種讓駕駛員避免分心的辦法,就是在車內(nèi)引入語音交互。畢竟語言最接近人類的交流習(xí)慣,如果和你說話的系統(tǒng)足夠聰明,一句指令就能清楚地指向一個(gè)功能,反復(fù)查看屏幕和手動(dòng)操作的時(shí)間,都可以節(jié)省下來。

2016年CES(消費(fèi)電子展)時(shí),寶馬帶來了為中國用戶開發(fā)的自然語音識別系統(tǒng)(NLU,Natural Language Understanding)。這項(xiàng)技術(shù)最先在3系和7系上應(yīng)用,之后又延伸到了品牌旗下的更多車型。過去幾天,車云菌體驗(yàn)了一輛寶馬320i的自然語音識別,對這項(xiàng)功能的表現(xiàn)也有了更加直觀的體會,在這套語音系統(tǒng)常規(guī)表現(xiàn)之外,還給它布置了幾道小有挑戰(zhàn)的“附加題”,大家也可以看看這套系統(tǒng)的表現(xiàn)。

先來認(rèn)識一下寶馬的這套自然語音系統(tǒng)

自然語音技術(shù)不是一蹴而就,寶馬引入車載語音技術(shù)已經(jīng)有很多年了。因?yàn)檎Z音識別本身就是iDrive系統(tǒng)的一部分,所以語音控制體驗(yàn)和整個(gè)車載娛樂信息系統(tǒng)以及一些車輛輔助(比如空調(diào)等)緊緊聯(lián)系在了一起。

據(jù)資料顯示,第一代iDrive就可以用語音來控制導(dǎo)航和音樂,隨后寶馬又分別在2007年加入了語音撥號,2011年增加了文字轉(zhuǎn)語音讀電郵、短信等功能。

這個(gè)階段,寶馬使用的還是“條目式語音”,控制模式很像用鼠標(biāo)去逐個(gè)點(diǎn)開系統(tǒng)頁面,而且每次該說什么都要嚴(yán)格遵守規(guī)定。假如你要聽手機(jī)上ColdPlay演唱的Viva la Vida,那就請依次說出“USB-按藝術(shù)家-ColdPlay-按歌名-Viva la Vida”吧。

2012年,語音功能迎來了一次大更新。寶馬宣布開始使用Nuance的Dragon Drive(聲龍駕駛)。這是一套“本地+云端”的混合系統(tǒng)。因?yàn)楂@得了云端強(qiáng)大的運(yùn)算能力,語音交互不再受限于本地的存儲和算力,語音識別率和速度都有了顯著提升。

當(dāng)時(shí)視頻展示的語音交互已經(jīng)開始簡化,雖然依舊需要先說出“導(dǎo)航”這個(gè)命令大類,但用戶已經(jīng)可以在地址頁面按要求,一次性輸入完整的目的地地址。

2018款寶馬320i的iDrive系統(tǒng),用戶可勾選是否通過服務(wù)器進(jìn)行語音識別,來提升語音交互的體驗(yàn)

更重要的是,云服務(wù)讓語義理解變得更加容易。在2016年寶馬揭曉最新一代自然語音系統(tǒng)時(shí),交互已經(jīng)在努力接近人與人之間的對話。導(dǎo)航時(shí),系統(tǒng)已經(jīng)可以根據(jù)“附近的加油站”這類模糊指令,給出一個(gè)非常接近答案的地址列表。

而且交互邏輯中,完成某個(gè)任務(wù)期間的多輪語音溝通不用多次喚醒。只要界面左上角的語音標(biāo)識一直處于點(diǎn)亮狀態(tài),你就可以一直順著引導(dǎo),把任務(wù)完整布置給系統(tǒng)。因此在用戶端體驗(yàn)上,寶馬早期語音交互的那種機(jī)械感已經(jīng)被大大稀釋。

2016年發(fā)布的寶馬自然語音識別通過方向盤上的語音按鈕喚醒,可以用于導(dǎo)航,搜索POI,打開音樂廣播,撥打電話,發(fā)送信息,查詢車輛和生活信息等。在每個(gè)大類中,語音還可以控制更加細(xì)分的小功能。

上面這個(gè)視頻可以讓你直觀感受一下整個(gè)語音交互過程,系統(tǒng)對答和提醒的女聲語音聽起來較為舒心,理解任務(wù)的成功率也比較高。在連接服務(wù)器的情況下,語音識別和語義理解的延遲可接受,系統(tǒng)思考的時(shí)間幾乎不易覺察。

4道語音考試“附加題”

除了常規(guī)體驗(yàn)之外,我們?yōu)檫@套語音系統(tǒng)準(zhǔn)備了幾道附加題,更像是有趣的極限挑戰(zhàn),可以讓大家對系統(tǒng)有更深入的發(fā)現(xiàn)。

1. 打斷和修改

在熟悉和機(jī)器交談后,系統(tǒng)的語音回復(fù)顯得過于冗長。你會在機(jī)器說完所有內(nèi)容之前,就下意識地打斷它。寶馬的自然語音識別在一些環(huán)節(jié)支持打斷,可以兼顧需要解說和簡化溝通的需要。

同時(shí)在語音識別、語義理解難免出錯(cuò)的時(shí)候,手動(dòng)修改錯(cuò)誤結(jié)果也是一個(gè)比較苦惱的問題。刪除和重輸入過程十分繁瑣,使用寶馬自然語音識別系統(tǒng)的語音修改,可以提高溝通效率。

在撥打電話這個(gè)任務(wù)中,我們隨機(jī)測試了連續(xù)打斷和修改方面的表現(xiàn),測試時(shí)是車窗關(guān)閉的駐車狀態(tài),同時(shí)云端識別開啟。

2. 強(qiáng)噪音

對于車載環(huán)境,降噪是一項(xiàng)很重要的命題。因?yàn)樾熊嚂r(shí)特有的發(fā)動(dòng)機(jī)聲,開窗時(shí)的風(fēng)噪,車內(nèi)其他人的說話聲,都會干擾最終的語音交互效果。

常規(guī)測試車載語音系統(tǒng)的降噪能力,是在高速行駛時(shí)開窗測試。我們選擇了更苛刻的條件——在駐車狀態(tài)空調(diào)風(fēng)力全開的時(shí)候,隨意使用車載語音功能。因?yàn)榭照{(diào)最大風(fēng)量時(shí)發(fā)出來的噪聲非常大,而車機(jī)和空調(diào)出風(fēng)口臨近,會受到很大的干擾。

下面是一個(gè)一鏡到底的視頻,云端識別處于開啟狀態(tài)。其中,打開關(guān)閉空調(diào)、按距離篩選POI結(jié)果是車載語音原本不支持的功能,返回結(jié)果失敗的原因不是噪音導(dǎo)致。總體看來,在非常惡劣的環(huán)境下,寶馬這套車載語音的表現(xiàn)不錯(cuò)。

3. 不連網(wǎng)

這款車載語音產(chǎn)品是一個(gè)混合導(dǎo)航。目前這套系統(tǒng)的導(dǎo)航POI(興趣點(diǎn))數(shù)據(jù)優(yōu)先從云端獲取。為了避免車處在隧道、停車場等信號不佳區(qū)域?qū)е碌捏w驗(yàn)欠缺,車輛本地也會存放一部分導(dǎo)航數(shù)據(jù),但一般而言輸出結(jié)果需要更長的時(shí)間。

我們關(guān)閉網(wǎng)絡(luò),測試了非聯(lián)網(wǎng)狀態(tài)POI搜索的表現(xiàn)。結(jié)果發(fā)現(xiàn),本地處理時(shí)間有了明顯增加,系統(tǒng)思考的每個(gè)步驟都在屏幕上展示了出來。首先非聯(lián)網(wǎng)帶來的時(shí)延,車云菌覺得對駐車狀態(tài)的搜索不會造成太大困擾,但如果在行車過程操作,很有可能會導(dǎo)致錯(cuò)過路口,路線重新規(guī)劃。對于把每一步都展示給用戶的做法,車云菌認(rèn)為反倒對用戶理解系統(tǒng)是一種幫助,畢竟在本地狀態(tài)下,語音識別過程的拉長,很容易造成“功能不可用”的誤解。

4. 多意圖指令

單一意圖的語言指令,寶馬的這套系統(tǒng)已經(jīng)有不錯(cuò)的識別表現(xiàn)。但這并沒有滿足我們的好奇心。根據(jù)習(xí)慣,我們常常會使用多意圖的語音指令,比如“提醒我明天下午給車云菌打電話”,對系統(tǒng)來說,挑戰(zhàn)就是分辨該“打電話給車云菌”還是“給備忘錄中增加一個(gè)提醒”。

在下面這個(gè)視頻,我們試了這樣一組指令。通過不同地名的排列組合,讓系統(tǒng)試著去分辨我們的真實(shí)意圖。對于這道題,系統(tǒng)沒能成功給出邏輯上正確的結(jié)果。語義理解是目前語音技術(shù)在重點(diǎn)突破的方向,要讓語音系統(tǒng)真正識別駕駛員的意圖,還需要更多的數(shù)據(jù)和更強(qiáng)大的神經(jīng)網(wǎng)絡(luò)架構(gòu)。

- 導(dǎo)航到天安門

- 導(dǎo)航到西單

- 我要去天安門,不要去西單

- 我要去西單,不要去天安門

- 我不要去天安門,我要去西單

- 我不要去西單,我要去天安門

- 我不要去天安門,也不要去西單

- 我要去天安門和西單

小結(jié)

寶馬最早開始在量產(chǎn)車上使用語音交互的車企之一,并且這項(xiàng)功能已經(jīng)普及到了品牌旗下的眾多車型。語音技術(shù)的持續(xù)發(fā)展,為駕駛員創(chuàng)造了更智能化,情景化,以及更加主動(dòng)的體驗(yàn)。隨著智能汽車角色的轉(zhuǎn)變,語音會發(fā)揮的作用一定會越來越大。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉