科大訊飛關(guān)注語音技術(shù)前瞻性應(yīng)用
作為全國唯一以語音為主要產(chǎn)業(yè)化方向
的“國家863計劃成果產(chǎn)業(yè)化基地”,科大訊飛公司近日在“國家8 63計劃十五周年成就
展”上向觀眾展出了代表著國內(nèi)最高水平的中文語音合成系統(tǒng)、全系列行業(yè)和桌面應(yīng)用產(chǎn)品,以及
虛擬主持人、機器人足球賽虛擬評論員等代表未來語音技術(shù)發(fā)展方向的前瞻性應(yīng)用形式。
有聽和講能力的口語系統(tǒng),使電腦具有類似于一樣的說話和聽懂人說話所必須的關(guān)鍵技術(shù),也是2
1世紀(jì)國際信息產(chǎn)業(yè)競爭的重要陣地。中國科技大學(xué)在國家863計劃的支持下,開發(fā)成功了可實
用化的KD漢語文語轉(zhuǎn)換系統(tǒng)??拼笥嶏w在中國科大長期積累的語音技術(shù)和人才的基礎(chǔ)上進行產(chǎn)業(yè)
化運作,目前,已經(jīng)成功開發(fā)出KD2000、KB2000和KM2000等中文語音合成系列
產(chǎn)品。同時,根據(jù)不同應(yīng)用平臺和行業(yè)應(yīng)用需求,開發(fā)了電話語音平臺、有聲電子郵件系統(tǒng)等多種
行業(yè)語音信息服務(wù)解決方案,以及包括暢言2000、聽網(wǎng)、開口上網(wǎng)在內(nèi)的桌面語音交互環(huán)境等
多系列應(yīng)用產(chǎn)品,大大推動了語音技術(shù)在國民經(jīng)濟各行各業(yè)和社會生活中的應(yīng)用,創(chuàng)造了良好的經(jīng)
濟和社會效益。
本次展會上,“虛擬主持人”和“機器人足球賽虛擬
評論員系統(tǒng)”引起了很多參觀者的強烈興趣,成為本次展會的兩個“明星”??拼笥嶏w展出的虛擬
主持人是首個面向內(nèi)容的中文虛擬主持人。因為這一系統(tǒng)中應(yīng)用了科大訊飛的最新開發(fā)出的大語料
庫語音合成技術(shù),使得虛擬主持人可以將來自于不同信息源的內(nèi)容以虛擬人物實時發(fā)音的形式,更
加自然地表現(xiàn)給觀眾。此外,通過對多模態(tài)用戶界面和頭部建模技術(shù)、唇形同步技術(shù)以及表情撓動
技術(shù)方面的深入研究,科大訊飛使得這一虛擬人物對人的表情、動作模仿得更加逼真。據(jù)悉,這一
系統(tǒng)將國內(nèi)多模態(tài)輸出技術(shù)的研究首次提升到實用化的層面,使得人們獲取信息更加富有人性化。
作為對人工智能領(lǐng)域的積極探索,“機器人足球賽虛擬評論員系統(tǒng)”是
圍繞Action-to-Speech的概念、深入形勢分析與決策、自然語言生成、超表現(xiàn)力
特定領(lǐng)域語音合成等方向的研究而最終實現(xiàn)的。這一系統(tǒng)對于未來跨模態(tài)信息提取和轉(zhuǎn)化方面的研
究具有重要的示范作用。
據(jù)業(yè)內(nèi)人士介紹,目前國內(nèi)語音技術(shù)已經(jīng)發(fā)展
到比較成熟的階段,其廣闊的產(chǎn)業(yè)前景已經(jīng)被業(yè)界認同。智能、高效、自然、和諧的人性化溝通環(huán)
境在不久的將來將成為現(xiàn)實。(新華網(wǎng))