科大訊飛關(guān)注語(yǔ)音技術(shù)前瞻性應(yīng)用
掃描二維碼
隨時(shí)隨地手機(jī)看文章
作為全國(guó)唯一以語(yǔ)音為主要產(chǎn)業(yè)化方向
的“國(guó)家863計(jì)劃成果產(chǎn)業(yè)化基地”,科大訊飛公司近日在“國(guó)家8 63計(jì)劃十五周年成就
展”上向觀眾展出了代表著國(guó)內(nèi)最高水平的中文語(yǔ)音合成系統(tǒng)、全系列行業(yè)和桌面應(yīng)用產(chǎn)品,以及
虛擬主持人、機(jī)器人足球賽虛擬評(píng)論員等代表未來(lái)語(yǔ)音技術(shù)發(fā)展方向的前瞻性應(yīng)用形式。
有聽和講能力的口語(yǔ)系統(tǒng),使電腦具有類似于一樣的說(shuō)話和聽懂人說(shuō)話所必須的關(guān)鍵技術(shù),也是2
1世紀(jì)國(guó)際信息產(chǎn)業(yè)競(jìng)爭(zhēng)的重要陣地。中國(guó)科技大學(xué)在國(guó)家863計(jì)劃的支持下,開發(fā)成功了可實(shí)
用化的KD漢語(yǔ)文語(yǔ)轉(zhuǎn)換系統(tǒng)??拼笥嶏w在中國(guó)科大長(zhǎng)期積累的語(yǔ)音技術(shù)和人才的基礎(chǔ)上進(jìn)行產(chǎn)業(yè)
化運(yùn)作,目前,已經(jīng)成功開發(fā)出KD2000、KB2000和KM2000等中文語(yǔ)音合成系列
產(chǎn)品。同時(shí),根據(jù)不同應(yīng)用平臺(tái)和行業(yè)應(yīng)用需求,開發(fā)了電話語(yǔ)音平臺(tái)、有聲電子郵件系統(tǒng)等多種
行業(yè)語(yǔ)音信息服務(wù)解決方案,以及包括暢言2000、聽網(wǎng)、開口上網(wǎng)在內(nèi)的桌面語(yǔ)音交互環(huán)境等
多系列應(yīng)用產(chǎn)品,大大推動(dòng)了語(yǔ)音技術(shù)在國(guó)民經(jīng)濟(jì)各行各業(yè)和社會(huì)生活中的應(yīng)用,創(chuàng)造了良好的經(jīng)
濟(jì)和社會(huì)效益。
本次展會(huì)上,“虛擬主持人”和“機(jī)器人足球賽虛擬
評(píng)論員系統(tǒng)”引起了很多參觀者的強(qiáng)烈興趣,成為本次展會(huì)的兩個(gè)“明星”??拼笥嶏w展出的虛擬
主持人是首個(gè)面向內(nèi)容的中文虛擬主持人。因?yàn)檫@一系統(tǒng)中應(yīng)用了科大訊飛的最新開發(fā)出的大語(yǔ)料
庫(kù)語(yǔ)音合成技術(shù),使得虛擬主持人可以將來(lái)自于不同信息源的內(nèi)容以虛擬人物實(shí)時(shí)發(fā)音的形式,更
加自然地表現(xiàn)給觀眾。此外,通過(guò)對(duì)多模態(tài)用戶界面和頭部建模技術(shù)、唇形同步技術(shù)以及表情撓動(dòng)
技術(shù)方面的深入研究,科大訊飛使得這一虛擬人物對(duì)人的表情、動(dòng)作模仿得更加逼真。據(jù)悉,這一
系統(tǒng)將國(guó)內(nèi)多模態(tài)輸出技術(shù)的研究首次提升到實(shí)用化的層面,使得人們獲取信息更加富有人性化。
作為對(duì)人工智能領(lǐng)域的積極探索,“機(jī)器人足球賽虛擬評(píng)論員系統(tǒng)”是
圍繞Action-to-Speech的概念、深入形勢(shì)分析與決策、自然語(yǔ)言生成、超表現(xiàn)力
特定領(lǐng)域語(yǔ)音合成等方向的研究而最終實(shí)現(xiàn)的。這一系統(tǒng)對(duì)于未來(lái)跨模態(tài)信息提取和轉(zhuǎn)化方面的研
究具有重要的示范作用。
據(jù)業(yè)內(nèi)人士介紹,目前國(guó)內(nèi)語(yǔ)音技術(shù)已經(jīng)發(fā)展
到比較成熟的階段,其廣闊的產(chǎn)業(yè)前景已經(jīng)被業(yè)界認(rèn)同。智能、高效、自然、和諧的人性化溝通環(huán)
境在不久的將來(lái)將成為現(xiàn)實(shí)。(新華網(wǎng))