當(dāng)前位置:首頁 > 電源 > 數(shù)字電源
[導(dǎo)讀]OMAP平臺為開發(fā)個人手持設(shè)備的語音應(yīng)用提供完美的解決方案。這種低功耗的OMAP架構(gòu)把用于語音的DSP信號處理功能與RISC處理器的通用系統(tǒng)性能融合在了一起。設(shè)計了開放式軟件架構(gòu),以鼓勵開發(fā)語音引擎、語音應(yīng)用和多媒體

OMAP平臺為開發(fā)個人手持設(shè)備的語音應(yīng)用提供完美的解決方案。這種低功耗的OMAP架構(gòu)把用于語音的DSP信號處理功能與RISC處理器的通用系統(tǒng)性能融合在了一起。設(shè)計了開放式軟件架構(gòu),以鼓勵開發(fā)語音引擎、語音應(yīng)用和多媒體等補充應(yīng)用。包括語音識別器和原型應(yīng)用等開發(fā)支持,可幫助開發(fā)商快速建立其自己的產(chǎn)品并縮短產(chǎn)品上市時間。OMAP平臺可確保開發(fā)商能夠通過輕松、靈活添加語音應(yīng)用牢牢把握個人手持設(shè)備的增長機遇。

語音技術(shù)的應(yīng)用正在不斷增加,從而為應(yīng)用開發(fā)商在手持設(shè)備、移動設(shè)備和無線個人設(shè)備中增加高價值的功能帶來了難得的機會。今天的個人手持設(shè)備語音大多時候僅僅局限于語音撥號,但是已經(jīng)出現(xiàn)了適用于更廣泛開發(fā)語音識別和文本到語音應(yīng)用的技術(shù)。打算增加語音功能的開發(fā)商需要熟知語音技術(shù)的方方面面。這些問題不但包括處理和內(nèi)存要求,而且還包括特定的平臺架構(gòu)和支持如何促進開發(fā)過程并縮短上市時間。  

利用語音應(yīng)用增值可帶來豐厚的潛在利益。根據(jù)各種市場研究公司的估計,未來兩年個人手持設(shè)備的綜合年增長率預(yù)計能達到 20%,到2004年全球的總設(shè)備交貨量將達到7億件。為了利用增值語音應(yīng)用敲開這個巨大的市場,開發(fā)商必須求助于能夠給他們帶來高性能、低功耗的底層技術(shù)以及能夠幫助他們迅速推出新產(chǎn)品的支持。  

語音功能為用戶提供自然的輸入和輸出方式,它比其他形式的I/O更安全,尤其是當(dāng)用戶在開車期間。在大多應(yīng)用中,語音都是鍵盤和顯示器的理想補充,而并不是它們的替代品。例如,在非常嘈雜的環(huán)境中,聽和說可能都不現(xiàn)實,因此用戶可能就必須依賴鍵盤輸入和顯示閱讀。類似,用戶通常喜歡用鍵盤輸入某些東西,如:PIN號碼和密碼,而不愿意大聲說出來讓別人也聽到。  

語音撥號是當(dāng)今個人無線設(shè)備中最常用的語音技術(shù)。語音撥號通常無需手和耳朵即可打電話,這是在開車時尤為重要的功能。語音撥號包括名字撥號,即按通訊簿上的名字打電話,另外還包括號碼撥號,即說出電話號碼。如圖1所示,其他潛在的語音應(yīng)用包括:  

1.語音電子郵件?D?D 包括瀏覽郵箱、利用語音輸入寫電子郵件以及收聽電子郵件的讀出。  
2.信息檢索?D?D股票價格、標題新聞、航班信息、天氣預(yù)報等都可通過語音從互聯(lián)網(wǎng)收聽。例如,用戶不用先進入某個網(wǎng)址并輸入股票名字或者瀏覽預(yù)定義的列表,便可以命令:"我的股票報價,
德州儀器。"  
3.個人信息管理?D?D允許用戶通過語音指定預(yù)約、查看日歷、添加聯(lián)絡(luò)信息等等。  
4.語音瀏覽?D?D利用語音程序菜單,用戶可以在網(wǎng)上沖浪、添加語音收藏夾并收聽網(wǎng)頁內(nèi)容的讀出。  
5.語音導(dǎo)航?D?D在自動和眼不夠用的條件下獲取導(dǎo)航的完全語音輸入/輸出駕駛系統(tǒng)。  



  
語音技術(shù)問題  

語音系統(tǒng)必須滿足某些基本使用要求。很顯然,語音輸出必須清晰,使用戶能夠聽懂。在給定應(yīng)用用途中,ASR還必須支持自然語音。何為自然可謂變化無常,包括從逐字發(fā)出的簡單名字和指令、到說出大量詞匯的連續(xù)語句。另外,各人的自然語音以及發(fā)音方式也不同,因此系統(tǒng)應(yīng)該能夠靈活接受不同說話人說話。識別引擎必須準確,否則用戶不會使用這種技術(shù)。  

語音的系統(tǒng)要求是需要進行大量處理,有可能包含巨大的內(nèi)存,這取決于所支持的詞庫。就基于服務(wù)器的應(yīng)用而言,無線帶寬的使用會有所增加。這些因素也會影響其他系統(tǒng)考慮。應(yīng)用的MIPS和傳輸要求越高,給定系統(tǒng)的功耗就越高,因此會縮短電池壽命或?qū)е赂l繁的充電。當(dāng)應(yīng)用需要采用處理器外置存儲器時,響應(yīng)時間也有可能增加。  

某些應(yīng)用權(quán)衡考慮有助于通過放棄手持設(shè)備不必要的功能來降低系統(tǒng)要求。只識別少量詞語、分散語音的基于說話人的系統(tǒng)會比識別大型詞庫、連續(xù)語音的基于說話人的系統(tǒng)要求少很多的資源。對其他語言的支持會增加處理要求并且使應(yīng)用所需要的內(nèi)存加倍??乖胍艉涂垢蓴_性是重要的特性,但是會增加復(fù)雜性和內(nèi)存要求。  

很顯然,開發(fā)商在增加說話人依賴性、連續(xù)語音、詞庫規(guī)模和語言支持等功能時希望盡可能少地降低基本應(yīng)用的性能。有某些選項有助于減少語音技術(shù)中的性能降低,如:分布式語音識別(DSR)。DSR把識別任務(wù)分割開,這樣手持設(shè)備可以把原始語音轉(zhuǎn)換成頻譜特性向量,同時服務(wù)器執(zhí)行識別過程。這種方法以及類似的分布式TTS方法依賴于處理方法和傳輸協(xié)議的標準化。盡管這些技術(shù)頗有前途,但是,開發(fā)商仍然面臨個人手持設(shè)備中語音應(yīng)用的有限資源。  

因此,為語音等高性能應(yīng)用選擇適當(dāng)?shù)钠脚_與精心設(shè)計應(yīng)用的功能同樣重要。這種平臺必須具有強大的處理能力,同時可以實現(xiàn)高水平的功效,不僅僅是在內(nèi)核操作中,而且在處理內(nèi)存中也應(yīng)如此。應(yīng)該有足夠的MIPS來支持多媒體、安全和其他補充應(yīng)用。提供集成新算法能力的可編程性也很重要。最后,這種平臺必須包含為支持模塊化應(yīng)用開發(fā)所設(shè)計的軟件架構(gòu),以幫助開發(fā)商快速把產(chǎn)品推向市場。  

OMAP技術(shù):卓越的語音平臺  

TI的OMAP平臺為在個人手持設(shè)備中開發(fā)語音應(yīng)用提供卓越的解決方案。 OMAP1510和
OMAP5910處理器的雙內(nèi)核架構(gòu)集成了高功效的TMS320C55x?數(shù)字信號處理器(DSP)和高性能ARM9RISC微處理器。因此,這些OMAP處理器可提供語音所需要的算術(shù)集中的信號處理能力,同時還可提供系統(tǒng)層操作所需要的通用性能。OMAP710處理器是高度集成的單芯片解決方案,帶有用于無線通訊處理的、基于DSP的GSM/GPRS基帶、以及可低功耗執(zhí)行多媒體應(yīng)用的專用TI增強ARM925處理器。 OMAP1510、OMAP5910和OMAP710處理器可支持基于低端ARM的語音應(yīng)用。它們還具有編碼兼容性,從而使開發(fā)商能夠把軟件應(yīng)用集成到針對不同市場的個人產(chǎn)品。OMAP1510和OMAP5910具有DSP處理能力,可處理更集中的語音應(yīng)用。  

雙核硬件架構(gòu)  

OMAP1510 和OMAP5910的雙核硬件平臺設(shè)計用于最大化系統(tǒng)性能和最小化功耗。在用于個人手持設(shè)備時,DSP和RISC內(nèi)核的結(jié)合給這些處理器提供了無與倫比的性能和功耗優(yōu)勢。RISC極其適合處理控制代碼,如:用戶界面、OS和高級應(yīng)用。另一方面,DSP更適合語音應(yīng)用所需要的實時信號處理功能。  

如圖2所示,OMAP1510架構(gòu)包含用于兩個處理器的片上高速緩沖存儲器,可降低到外部存儲器的平均發(fā)送次數(shù),同時消除不必要的外部存取的功耗。兩個內(nèi)核的內(nèi)存管理單元(MMU)提供虛擬物理內(nèi)存轉(zhuǎn)換。低功耗操作模式可保存不使用或者很少使用處理器期間的能力。  

OMAP1510 架構(gòu)還包含兩個外部存儲器接口和單個內(nèi)存端口。這三個存儲器接口彼此完全獨立,可同時從任何一個內(nèi)核或者從DMA單元進行存取。每個處理器都具有自己的外設(shè)接口,其不但支持到外圍設(shè)備的直接連接同時還支持從處理器DMA單元的DMA連接。定時器、通用I/O、UART及監(jiān)視定時器等在內(nèi)的片上外設(shè)以及彩色 LCD控制器均支持OS一般的要求。  

OMAP5910架構(gòu)不但提供了片上系統(tǒng)功能同時還帶有諸如192KbytesRAM、USB1.1主機和客戶機、MMC/SD卡接口、多通道緩沖串口、實時時鐘、GPIO及UART、LCD接口、SPI、uWire及i2s等在內(nèi)的外圍設(shè)備。與 OMAP1510類似,OMAP5910也包含內(nèi)置的處理器間通訊機制,其提供與DSP連接的透明接口,以實現(xiàn)更輕松的代碼開發(fā)。  


  
為OMAP平臺設(shè)計語音應(yīng)用  

在OMAP 開發(fā)商網(wǎng)絡(luò)中,TI正與多家正在開發(fā)ASR、TTS、DSR和語者驗證等在內(nèi)的語音技術(shù)的主要第三方開發(fā)商展開合作。這些公司在市場中都有自己獨到的優(yōu)勢,而且他們還可以把這些優(yōu)勢帶給OMAP用戶。同時,TI內(nèi)部開發(fā)了充分利用了OMAP平臺的雙內(nèi)核架構(gòu)優(yōu)勢的、專門用于小詞庫以及小型語音識別等的語音識別軟件。TI嵌入式語音識別器(TIESR)可提供如下功能:與說話人無關(guān)的指令以及控制功能與說話人無關(guān)的連續(xù)數(shù)字識別與說話人無關(guān)的連續(xù)語音識別與說話人有關(guān)的名稱撥號、指令以及控制動態(tài)語法和詞匯功能,可提高語音瀏覽等應(yīng)用噪音環(huán)境中的抗擾性用于增強性能的可選說話人適配功能  [!--empirenews.page--]
語音應(yīng)用示例  

InfoPhone 是基于這種嵌入式架構(gòu)的語音應(yīng)用的一個典型示例,它由TI開發(fā),專門用于無線領(lǐng)域。InfoPhone是一個可實現(xiàn)語音功能的Java應(yīng)用程序,同時它還可實現(xiàn)有用信息的語音檢索。TI為InfoPhone開發(fā)了三種原型的基于語音的信息服務(wù),諸如為用戶提供股票報價、航班信息和天氣預(yù)報。每種服務(wù)都包含 50個詞語的詞庫,因為具有動態(tài)詞庫功能,系統(tǒng)可以在詞庫間完美切換。應(yīng)用設(shè)計使鍵盤輸入在說話期間一直保持有效狀態(tài),從而在環(huán)境中斷或者用戶需要進行私密輸入時提供靈活性。圖3說明InfoPhone示例中的語音識別架構(gòu)。  

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉