當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 消費(fèi)電子
[導(dǎo)讀]語(yǔ)音合成芯片就是將完整的語(yǔ)音合成系統(tǒng)固化集成到芯片內(nèi)部,通過簡(jiǎn)單的接口接收待合成的文本信息,將文本合成為清晰流暢的語(yǔ)音輸出,完成機(jī)器代替人說話傳達(dá)信息的過程,語(yǔ)音芯片應(yīng)用簡(jiǎn)單,開發(fā)和使用成本低,在車載

語(yǔ)音合成芯片就是將完整的語(yǔ)音合成系統(tǒng)固化集成到芯片內(nèi)部,通過簡(jiǎn)單的接口接收待合成的文本信息,將文本合成為清晰流暢的語(yǔ)音輸出,完成機(jī)器代替人說話傳達(dá)信息的過程,語(yǔ)音芯片應(yīng)用簡(jiǎn)單,開發(fā)和使用成本低,在車載調(diào)度、氣象預(yù)警、公交報(bào)站等領(lǐng)域被廣泛應(yīng)用。

語(yǔ)音合成芯片最大的功能應(yīng)用點(diǎn)在于用戶需要播報(bào)一些大量、動(dòng)態(tài)文本信息時(shí),可以即時(shí)、方便的將文本信息內(nèi)容合成為語(yǔ)音輸出,從而解決傳統(tǒng)錄音芯片無法解決的大容量、動(dòng)態(tài)文本信息播報(bào)問題。

目前,市場(chǎng)上語(yǔ)音合成芯片價(jià)位從幾十元到幾百元的都有,另外芯片外形、產(chǎn)品封裝形式、調(diào)用接口等紛繁復(fù)雜,讓用戶在選擇語(yǔ)音合成芯片時(shí)經(jīng)常陷入迷惑狀態(tài)。那么如何正確分辨、選用一款高性能語(yǔ)音合成芯片?語(yǔ)音合成芯片重點(diǎn)需要考核哪些性能指標(biāo)?以下參數(shù)將成為用戶重點(diǎn)評(píng)估方向:

1. 語(yǔ)音合成效果。

語(yǔ)音合成芯片的應(yīng)用目的是以語(yǔ)言的方式傳達(dá)文本信息,機(jī)器說話是否標(biāo)準(zhǔn),人能否聽懂聽舒服自然成為最最重要的衡量指標(biāo)。語(yǔ)音芯片的朗讀效果主要由兩個(gè)重要技術(shù)指標(biāo)決定:可懂度和自然度。可懂度就是人們能夠聽懂機(jī)器合成出來的內(nèi)容,是語(yǔ)音合成芯片能否應(yīng)用的基本要求;自然度則是機(jī)

器發(fā)音效果是否易于理解,聽著舒服,與正常人說話的差距。國(guó)家863專家組對(duì)語(yǔ)音合成效果的自然度綜合評(píng)測(cè)有詳細(xì)說明,規(guī)定采用5分制打分,達(dá)到可接受階段為3.0分,普通人說話水平為4.0分,播音員的水平為5.0分??啥仁呛饬空Z(yǔ)音合成產(chǎn)品是否可用的標(biāo)準(zhǔn),自然度則是評(píng)價(jià)產(chǎn)品是否可以大規(guī)模應(yīng)用,以及應(yīng)用于高端領(lǐng)域的重要指標(biāo)。

2. 能否識(shí)別常見的特殊格式文本。

為了滿足不同文本的合成需求,語(yǔ)音合成芯片除了能夠自動(dòng)識(shí)別常見文本內(nèi)容外,在一些特殊格式文本方面,如時(shí)間、日期、網(wǎng)站名稱等格式的文本,也要能夠智能判讀。“12:10:35”讀成“十二點(diǎn)十分三十五秒”,“2008-1-1”讀成“二零零八年一月十三號(hào)”,“http://www.abc.com”讀成“h-t-t-p w-w-w點(diǎn)a-b-c點(diǎn)c–o- m”。

3. 能否識(shí)別常見的特殊符號(hào)、單位符號(hào)。

對(duì)于一些特殊符號(hào)及單位符號(hào)等,語(yǔ)音合成芯片也需要能夠正確識(shí)別并合成出來,如:“-2℃”讀成“零下2攝氏度”,其他的30%,a&b,¥80,20㎝,75㎏,90㎡等都能夠人們按照閱讀習(xí)慣進(jìn)行讀出。

4. 能否判讀常見多音字。

多音字作為漢字中常見的發(fā)音重點(diǎn)和難點(diǎn),是各家語(yǔ)音公司關(guān)注的焦點(diǎn),特別是中文語(yǔ)音合成芯片,在這方面更需要優(yōu)異的表現(xiàn)。如:音樂,銀行,特長(zhǎng),即將,股市行情,調(diào)整,校正,災(zāi)難,沒收,長(zhǎng)三角,西藏,濟(jì)南,重慶,成都等等,多音字能否正確判讀直接影響合成信息的可懂度,信息受眾者的理解,所以必須準(zhǔn)確朗讀。

5. 能否支持多種漢字編碼支持。

多種漢字編碼支持目前也已成為考核語(yǔ)音合成芯片性能的重點(diǎn),這點(diǎn)在方便終端用戶使用方面以及支持漢字識(shí)別范圍方面均非常重要。目前常用的漢字編碼格式有GB2312, Unicode,GBK,BIG5等。

6. 能否支持?jǐn)?shù)字的讀法。

生活離不開數(shù)字,數(shù)字串的正確識(shí)別合成輸出,在眾多應(yīng)用領(lǐng)域成為普遍性關(guān)注點(diǎn),合成文本中會(huì)經(jīng)常出現(xiàn)類似如:“請(qǐng)撥打12345”、“電話:12345”“熱線:12345” “我的號(hào)碼:12345”等內(nèi)容,一款高性能語(yǔ)音合成芯片能夠智能判斷把數(shù)字串讀成數(shù)值、還是號(hào)碼。如“12345”會(huì)自動(dòng)按照號(hào)碼的讀成“一二三四五”。“139-11661189”自動(dòng)按照號(hào)碼讀成“幺三九幺幺六六幺幺八九”。而“12345公斤”會(huì)自動(dòng)讀成“一萬二千三百四十五公斤”, “345678個(gè)”會(huì)讀成“三十四萬五千六百七十八個(gè)”等等。

7. 能否支持合成參數(shù)設(shè)置。

參數(shù)合成設(shè)置主要是為了方便使用語(yǔ)音芯片進(jìn)行二次開發(fā)的用戶來進(jìn)行設(shè)置、調(diào)試、修正文本合成效果。語(yǔ)音合成芯片應(yīng)該能夠支持多種標(biāo)記功能,可以按照需要進(jìn)行標(biāo)記。使用多種標(biāo)記進(jìn)行設(shè)置更為直觀方便、易維護(hù)。例如:設(shè)置音量,只要使用合成命令幀發(fā)送[v9],就可把音量設(shè)置9級(jí)音量。

8. 用戶使用接口簡(jiǎn)單、易用。

以上是從語(yǔ)音合成芯片效果及語(yǔ)音合成芯片內(nèi)核等方面來評(píng)估語(yǔ)音合成芯片的性能,其實(shí),在實(shí)際選用一款好的語(yǔ)音合成芯片的時(shí)候,用戶還需要注意芯片硬件方面的參數(shù),如:是否單芯片,體積大小,能夠大批量貼片焊接生產(chǎn)?以及功耗,工作溫度等等方面。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉