當前位置:首頁 > 消費電子 > 音頻技術(shù)
[導(dǎo)讀]   4月8日,捷通華聲受邀出席慈星股份和阿優(yōu)文化聯(lián)合舉辦的“智童道合”服務(wù)機器人發(fā)布會,公司總經(jīng)理武衛(wèi)東代表公司與慈星股份和阿優(yōu)文化合資創(chuàng)建的開心果機器人簽訂了戰(zhàn)略合作協(xié)

  4月8日,捷通華聲受邀出席慈星股份和阿優(yōu)文化聯(lián)合舉辦的“智童道合”服務(wù)機器人發(fā)布會,公司總經(jīng)理武衛(wèi)東代表公司與慈星股份和阿優(yōu)文化合資創(chuàng)建的開心果機器人簽訂了戰(zhàn)略合作協(xié)議。

  此次發(fā)布的阿U兔智兒童機器人(以下簡稱兔智機器人),是一款能陪孩子學(xué)習和玩耍的家庭服務(wù)機器人。捷通華聲為該款兔智機器人提供了靈云環(huán)形麥克風陣列和靈云智能語音技術(shù),讓兔智機器人不僅能準確識別主人話語,還能說出可愛的童聲,讓孩子與兔智機器人的語音交互更加流暢、自然。

  語音交互作為該產(chǎn)品的一大亮點技術(shù),是孩子與兔智機器人溝通的主要方式。由于兔智機器人所在的家庭環(huán)境,經(jīng)常會有家用電器、室內(nèi)娛樂等環(huán)境噪音,孩子也可能離兔智機器人忽遠忽近,所以對語音識別技術(shù)的抗噪能力和遠場識別能力有較高要求。對此,捷通華聲為兔智機器人提供了靈云環(huán)形麥克風陣列,能定向獲取孩子的聲音,并通過降噪、語音增強、回聲消除等系列技術(shù),準確識別遠處孩子的話語。同時,靈云語音合成技術(shù)的采用,讓兔智機器人不但能說出可愛的童聲,還能用童聲唱出清明透亮、悅耳動聽的歌聲,讓兔智機器人“能說會唱”,極大地提升了孩子與兔智機器人的互動體驗。

  

  靈云環(huán)形麥克風陣列 讓機器人準確識別主人話語

  為了讓兔智機器人準確獲取來自家庭范圍內(nèi)各個方向的語音,捷通華聲專門推出了靈云環(huán)形麥克風陣列。與車載麥克風陣列不同,因為車載設(shè)備只需拾取設(shè)備對面180°范圍內(nèi)的乘車人話語,采用線性麥克風陣列即可滿足需求,而家庭范圍較為開放,說話人會移動,聲源可能在各個方位,需要用環(huán)形麥克風陣列來定位和獲取360°范圍內(nèi)的語音信息。

  

  靈云環(huán)形麥克風陣列能根據(jù)聲音到達的時間差,準確計算出聲源與陣列模塊之間的角度和距離,實現(xiàn)對目標聲源的定位,并利用麥克風陣列的空域濾波特性,在目標說話人方向形成拾音波束,僅拾取波束的信號,抑制波束之外的噪聲和混響(反射聲)。

  由于聲音能量會隨著傳播距離的變遠而衰減,陣列模塊通過將多個麥克風拾取的聲音信號進行有機疊加,增強整體拾取的語音波束能量。同時,利用回聲消除技術(shù),過濾掉機器自身音頻設(shè)備發(fā)出的聲音,為語音識別引擎輸入更為清晰、純凈的聲音。

  由于在麥克風陣列模塊的拾音過程中,會不可避免的拾取部分環(huán)境噪音,對此,捷通華聲針對環(huán)境噪音進行建模,并用大量真實噪音數(shù)據(jù)進行訓(xùn)練,優(yōu)化語音識別算法,推出了具備極強抗噪能力的靈云語音識別技術(shù),能輕松應(yīng)對常見環(huán)境噪音。同時,該技術(shù)采用的深度神經(jīng)網(wǎng)絡(luò)(DNN)算法,可在用戶使用過程中,用積累的語音數(shù)據(jù)訓(xùn)練、優(yōu)化算法,不斷提升的抗噪能力,讓機器人準確識別主人話語。

  靈云語音合成 讓機器人“能說會唱”

  除了采用靈云環(huán)形麥克風陣列和語音識別技術(shù),兔智機器人還采用了捷通華聲的靈云語音合成技術(shù),可以說出可愛稚嫩、流暢自然的話語,讓人感覺是在和一個六七歲的小孩說話。捷通華聲作為國內(nèi)最早從事語音合成技術(shù)研究與應(yīng)用的企業(yè),早在2001年就推出了代表行業(yè)頂尖水平的靈云語音合成技術(shù),經(jīng)過十多年的技術(shù)積累,以及在成千上萬家企業(yè)的應(yīng)用實踐和磨合,捷通華聲不斷優(yōu)化文本分析模型、完善韻律規(guī)劃,讓靈云語音合成技術(shù)的合成效果真實飽滿、抑揚頓挫,MOS值已高達4.6,可懂度、自然度、流暢度達到行業(yè)頂尖水平。

  靈云語音合成技術(shù)已全面支持中文普通話、英語、粵語、維吾爾語、日、韓、俄、德、法等21種語言,覆蓋了全球90%以上的國家和地區(qū),中英混讀、粵英混讀自然流暢,全面適應(yīng)目前的多語種語音合成要求,讓機器人“說”出流暢、自然的話語。

  近期,捷通華聲依靠在語音合成領(lǐng)域數(shù)十年的深厚積累,推出了靈云歌唱合成技術(shù)。該技術(shù)可根據(jù)歌譜信息,讓機器人唱出甜美可愛、清明透亮、悅耳動聽,如真人般歌唱的歌聲,成功實現(xiàn)機器從“開口說話”到“放聲歌唱”的跨越式進步,讓機器人“能說會唱”。讓機器人學(xué)會唱歌,不僅提升了機器人服務(wù)的趣味性,更意味著機器人在擬人度和服務(wù)體驗方面跨出了一大步。

  靈云平臺面向機器人產(chǎn)業(yè)全面開放

  捷通華聲作為中國人工智能產(chǎn)業(yè)的領(lǐng)軍企業(yè),在2011年推出了國內(nèi)外第一個全方位人工智能開放平臺—靈云(hcicloud.com)。靈云平臺面向產(chǎn)業(yè)全面開放,并以“云 + 端”方式,為產(chǎn)業(yè)界提供語音合成、語音識別、OCR、手寫識別、人臉識別、聲紋識別、指紋識別、語義理解、機器翻譯等全方位人工智能能力。

  捷通華聲自2015年初就宣布靈云平臺對中國機器人產(chǎn)業(yè)全面開放,并相繼為開心果、中智物聯(lián)、新松、兆緯、科沃斯、阿凡達、奇諾軟通、NAO等數(shù)百家國內(nèi)外機器人廠商提供了全方位靈云人工智能能力服務(wù),傾全力支持中國機器人產(chǎn)業(yè)打造真正的“能聽會說、能寫會看、能思考、會判斷”的機器人。大量使用了靈云能力的機器人,有的已實現(xiàn)批量上市,更多的在金融、電信、能源政府、商業(yè)機構(gòu)營業(yè)廳、商場等場所展開大規(guī)模測試,得到了產(chǎn)業(yè)界與廣大用戶的廣泛關(guān)注與贊譽。

  

  近年來,伴隨人工智能產(chǎn)業(yè)的爆發(fā)性增長,捷通華聲憑借人工智能技術(shù)深厚功底與對機器人產(chǎn)業(yè)發(fā)展的準確預(yù)見,憑借合作共贏的理念,不與機器人廠商爭利,更不會與機器人廠商爭市場的合作意識,贏得了國內(nèi)機器人廠商的廣泛支持,目前已與絕大多數(shù)國內(nèi)主要機器人廠商建立了穩(wěn)固的合作伙伴關(guān)系,靈云人工智能已在中國機器人產(chǎn)業(yè)已獨樹一幟,幾乎無處不在!

  未來發(fā)展,捷通華聲將繼續(xù)以清華大學(xué)人工智能研究力量為依托,全面響應(yīng)并支持國家創(chuàng)新發(fā)展戰(zhàn)略,全面促進靈云平臺與中國機器人產(chǎn)業(yè)界的全面對接,與中國所有機器人廠商一起精誠合作,共同打造屬于中國機器人產(chǎn)業(yè)的輝煌。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉