當前位置:首頁 > 消費電子 > 消費電子
[導讀]語音合成芯片就是將完整的語音合成系統(tǒng)固化集成到芯片內部,通過簡單的接口接收待合成的文本信息,將文本合成為清晰流暢的語音輸出,完成機器代替人說話傳達信息的過程,語音芯片應用簡單,開發(fā)和使用成本低,在車載

語音合成芯片就是將完整的語音合成系統(tǒng)固化集成到芯片內部,通過簡單的接口接收待合成的文本信息,將文本合成為清晰流暢的語音輸出,完成機器代替人說話傳達信息的過程,語音芯片應用簡單,開發(fā)和使用成本低,在車載調度、氣象預警、公交報站等領域被廣泛應用。

語音合成芯片最大的功能應用點在于用戶需要播報一些大量、動態(tài)文本信息時,可以即時、方便的將文本信息內容合成為語音輸出,從而解決傳統(tǒng)錄音芯片無法解決的大容量、動態(tài)文本信息播報問題。

目前,市場上語音合成芯片價位從幾十元到幾百元的都有,另外芯片外形、產品封裝形式、調用接口等紛繁復雜,讓用戶在選擇語音合成芯片時經常陷入迷惑狀態(tài)。那么如何正確分辨、選用一款高性能語音合成芯片?語音合成芯片重點需要考核哪些性能指標?以下參數將成為用戶重點評估方向:

1. 語音合成效果。

語音合成芯片的應用目的是以語言的方式傳達文本信息,機器說話是否標準,人能否聽懂聽舒服自然成為最最重要的衡量指標。語音芯片的朗讀效果主要由兩個重要技術指標決定:可懂度和自然度??啥染褪侨藗兡軌蚵牰畽C器合成出來的內容,是語音合成芯片能否應用的基本要求;自然度則是機

器發(fā)音效果是否易于理解,聽著舒服,與正常人說話的差距。國家863專家組對語音合成效果的自然度綜合評測有詳細說明,規(guī)定采用5分制打分,達到可接受階段為3.0分,普通人說話水平為4.0分,播音員的水平為5.0分。可懂度是衡量語音合成產品是否可用的標準,自然度則是評價產品是否可以大規(guī)模應用,以及應用于高端領域的重要指標。

2. 能否識別常見的特殊格式文本。

為了滿足不同文本的合成需求,語音合成芯片除了能夠自動識別常見文本內容外,在一些特殊格式文本方面,如時間、日期、網站名稱等格式的文本,也要能夠智能判讀?!?2:10:35”讀成“十二點十分三十五秒”,“2008-1-1”讀成“二零零八年一月十三號”,“http://www.abc.com”讀成“h-t-t-p w-w-w點a-b-c點c–o- m”。

3. 能否識別常見的特殊符號、單位符號。

對于一些特殊符號及單位符號等,語音合成芯片也需要能夠正確識別并合成出來,如:“-2℃”讀成“零下2攝氏度”,其他的30%,a&b,¥80,20㎝,75㎏,90㎡等都能夠人們按照閱讀習慣進行讀出。

4. 能否判讀常見多音字。

多音字作為漢字中常見的發(fā)音重點和難點,是各家語音公司關注的焦點,特別是中文語音合成芯片,在這方面更需要優(yōu)異的表現。如:音樂,銀行,特長,即將,股市行情,調整,校正,災難,沒收,長三角,西藏,濟南,重慶,成都等等,多音字能否正確判讀直接影響合成信息的可懂度,信息受眾者的理解,所以必須準確朗讀。

5. 能否支持多種漢字編碼支持。

多種漢字編碼支持目前也已成為考核語音合成芯片性能的重點,這點在方便終端用戶使用方面以及支持漢字識別范圍方面均非常重要。目前常用的漢字編碼格式有GB2312, Unicode,GBK,BIG5等。

6. 能否支持數字的讀法。

生活離不開數字,數字串的正確識別合成輸出,在眾多應用領域成為普遍性關注點,合成文本中會經常出現類似如:“請撥打12345”、“電話:12345”“熱線:12345” “我的號碼:12345”等內容,一款高性能語音合成芯片能夠智能判斷把數字串讀成數值、還是號碼。如“12345”會自動按照號碼的讀成“一二三四五”?!?39-11661189”自動按照號碼讀成“幺三九幺幺六六幺幺八九”。而“12345公斤”會自動讀成“一萬二千三百四十五公斤”, “345678個”會讀成“三十四萬五千六百七十八個”等等。

7. 能否支持合成參數設置。

參數合成設置主要是為了方便使用語音芯片進行二次開發(fā)的用戶來進行設置、調試、修正文本合成效果。語音合成芯片應該能夠支持多種標記功能,可以按照需要進行標記。使用多種標記進行設置更為直觀方便、易維護。例如:設置音量,只要使用合成命令幀發(fā)送[v9],就可把音量設置9級音量。

8. 用戶使用接口簡單、易用。

以上是從語音合成芯片效果及語音合成芯片內核等方面來評估語音合成芯片的性能,其實,在實際選用一款好的語音合成芯片的時候,用戶還需要注意芯片硬件方面的參數,如:是否單芯片,體積大小,能夠大批量貼片焊接生產?以及功耗,工作溫度等等方面。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉