靈云科技訊:近日,捷通華聲最新靈云嵌入式語音合成技術(shù),iHear 7.0正式登陸靈云平臺。全面向產(chǎn)業(yè)開放。iHear 7.0版在語音合成效果、資源占用、產(chǎn)品功能等多方面全面超越目前市場的同類產(chǎn)品,達到國內(nèi)嵌入式語音合成技術(shù)的最高水平。捷通華聲面向智能車載、智能家電、智能家居、穿戴式設(shè)備等領(lǐng)域?qū)iT開發(fā)的全方位解決方案——靈云種子也因此全面升級,并開始為國內(nèi)智能終端領(lǐng)域提供最清新的語音合成技術(shù)。
回顧2014年以來,眾多設(shè)備商、制造商、互聯(lián)網(wǎng)+公司在內(nèi)的各領(lǐng)域廠商都在機器人、智能車載、穿戴式設(shè)備智能硬件領(lǐng)域積極投入。業(yè)內(nèi)分析人士認為,除了市場前景廣闊外,智能硬件市場極有可能成為繼移動互聯(lián)網(wǎng)后下一個入口的新興行業(yè)。
進入2015年,智能硬件廠商更是如雨后春筍般冒芽而出,從智能手環(huán)到智能手表、從智能車機到智能后視鏡、從智能插座到智能燈泡、從智能電視到智能空調(diào)。然而在硬件大軍的浪潮中,相對應(yīng)的軟件卻少之又少,雖然各種“云”也有所冒頭,但是,卻鮮有能夠一套方案能解決智能硬件所需所有功能的云服務(wù)。在現(xiàn)在推出的語音云中,大多數(shù)僅固步在“聲”的方向,如語音合成、語音識別等語音交互能力,對于用戶的圖像需求,如人臉識別、指紋識別、手寫識別、光學(xué)字符識別等能力則無法實現(xiàn)。
在此種形式下,捷通華聲推出了新一代“靈云種子”一體式解決方案。“靈云種子”融合了靈云(hcicloud.com)平臺語音識別(ASR)、語音合成(TTS)、聲紋識別(VPR)、語義理解(NLU)、手寫識別(HWR)和圖像識別(OCR、指紋識別、人臉識別等)等多項靈云核心技術(shù)能力,可實現(xiàn)智能語音交互、智能語音導(dǎo)航、智能語音控制、聲紋安全鎖、智能手寫/手勢輸入、智能圖像識別、身份認證等功能。涵蓋了智能車載、智能家電、智能家居及可穿戴式設(shè)備等行業(yè)??蓮V泛應(yīng)用在以下幾種場景中:
語音檢索:支持包括路況導(dǎo)航類、家居菜單智能導(dǎo)航類、周邊服務(wù)類、生活服務(wù)類、娛樂類等多種語音檢索服務(wù);
消息提醒:人性化定制推送類別:來電提醒、短信提醒、應(yīng)用提醒,并可將設(shè)置在云端;
通訊娛樂:支持短信發(fā)送,電話通訊,多媒體播放,手機操控;
健康服務(wù):支持傳感器,提供傳感器數(shù)據(jù)分析,為用戶提供健康圖表,并結(jié)合云端服務(wù)提供定制健康指導(dǎo)等現(xiàn)有及正在研發(fā)的能力;
云平臺:基于靈云平臺,提供多設(shè)備數(shù)據(jù)同步,私人信息云存儲,智能推薦;
智能支付:結(jié)合智能終端特點,提供更便捷、更多樣的智能支付方式。
虛擬現(xiàn)實擴展:將AR技術(shù)與LBS技術(shù)整合,為用戶提供包括周邊景點商圈實景展示,路線提示,為O2O服務(wù)提供優(yōu)秀體驗;
靈云(hcicloud.com)平臺將這些特定領(lǐng)域和場景的智能交互方案經(jīng)過設(shè)計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。合作伙伴開發(fā)應(yīng)用時可直接應(yīng)用“靈云種子”配置的技術(shù)服務(wù)和內(nèi)容服務(wù),即可完全滿足各行業(yè)智能終端的服務(wù)需求。
靈云種子自推出以來,為滿足用戶需求,不斷升級以滿足智能車載、智能家電等智能終端設(shè)備的快速發(fā)展,靈云種子此次升級,采用了最新的靈云嵌入式語音合成——iHear7.0 Embedded 7.0.0技術(shù),此項技術(shù)創(chuàng)造性采用最新一代高音質(zhì)合成器,音質(zhì)效果更加真實、干凈、細膩;利用模型優(yōu)化了算法,大大提高音色的逼真度和音質(zhì)的細膩度,克服機器味底噪;增加了數(shù)據(jù)訓(xùn)練流程,比傳統(tǒng)訓(xùn)練方法穩(wěn)定性更高;優(yōu)化了音高算法,使朗讀更加抑揚頓挫;優(yōu)化了計算效率,默認情況下比舊版快2.5倍,資源消耗大幅降低;更全面的地名詞庫,精心裁剪,可辨認全國常見地名、機構(gòu)名;支持用戶定制化需求:針對用戶特定詞匯、語句保證讀音正確、韻律自然;豐富的語種與發(fā)音人:語種可支持中文普通話、粵語、英語、北方語系方言、臺灣腔調(diào)國語等;已發(fā)布十余種發(fā)音人音色,性別涵蓋男聲、女聲、童聲,涵蓋正式、閑適、可愛、激昂、穩(wěn)重、柔美等各類風(fēng)格,尤其值得一提的是,最新語音合成技術(shù)為汽車導(dǎo)航等特殊領(lǐng)域?qū)iT定制,可清晰流暢朗讀全國常見地名、機構(gòu)名。
2011年,捷通華聲率先推出全球第一個全方位人工智能開放平臺-靈云平臺(hcicloud.com)。靈云平臺是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設(shè)備的網(wǎng)絡(luò)云服務(wù),目標是讓人機交互像人與人溝通一樣的簡單自然。靈云平臺自全面向產(chǎn)業(yè)開放以來,靈云語音識別、語音合成、語義理解等人工智能技術(shù)能力通過百度導(dǎo)航、搜狗導(dǎo)航、導(dǎo)航犬、嘀嘀打車、快的打車、天行聽書、靈云輸入法等“家喻戶曉”的經(jīng)典應(yīng)用服務(wù)中國13億社會大眾,使大眾群體充分感受并體驗到智能語音等人工智能技術(shù)為現(xiàn)代生活所帶來的輕松與便捷。2015年,捷通華聲與清華大學(xué)共同創(chuàng)建清華靈云人工智能研究中心,共同致力于“靈云科技 源自清華 服務(wù)全球”的戰(zhàn)略發(fā)展目標,更為靈云平臺發(fā)展奠定更加堅實的基礎(chǔ),
靈云平臺作為國內(nèi)外最大的全方位人工智能開放平臺,為促進機器人、智能車載、智能家電、智能家居、穿戴式設(shè)備等產(chǎn)業(yè)發(fā)展,將靈云智能語音交互(TTS、ASR、VPR)、智能圖像識別(OCR證照識別、文檔識別、名片識別、手寫識別)、生物特征識別(指紋識別、人臉識別)、自然語言理解(NLU)、語義分析、機器翻譯(MT)等人工智能技術(shù)能力全面向產(chǎn)業(yè)開放,此舉不但得到了數(shù)千家企業(yè)的支持,更直接推動了人工智能技術(shù)在車載、家電、家居、穿戴式設(shè)備的發(fā)展與進步。
靈云平臺面向產(chǎn)業(yè)全面開放,并積極布局全國,在中國華南地區(qū),尤其廣州、深圳地區(qū)經(jīng)濟發(fā)達、創(chuàng)新力強,在機器人、智能車載、智能家電、智能家居、穿戴式設(shè)備擁有獨特優(yōu)勢。為了向華南地區(qū)廣大客戶提供更加直接的支持與幫助,捷通華聲在2015年初成立了深圳捷通華聲分公司,旨在依托靈云平臺,利用靈云平臺智能語音、智能圖像、語義理解等全方位人工智能技術(shù)能力和豐富完善的智能終端交互解決方案,與華南地區(qū)硬件廠商加強合作關(guān)系,發(fā)揮華南地區(qū)智能終端設(shè)備研發(fā)和生產(chǎn)的優(yōu)勢,以推動智能終端產(chǎn)業(yè)長足的進步,攜手智能硬件廠商互惠共贏,共同推動中國人工智能產(chǎn)業(yè)的發(fā)展。