捷通華聲:靈云開發(fā)者社區(qū)即將開放 智能人機交互產(chǎn)業(yè)需開放合作
7月16日消息(李明)隨著移動互聯(lián)網(wǎng)、智能終端、云計算的飛速發(fā)展,智能人機交互(HCI)技術(shù)也迎來了大爆發(fā)的時代。那么,新的產(chǎn)業(yè)變革給智能人機交互技術(shù)帶來了哪些新的挑戰(zhàn)和機遇?智能人機交互技術(shù)如何才能更好地實現(xiàn)產(chǎn)業(yè)化發(fā)展?中國企業(yè)為迎接智能人機交互時代的到來又做了哪些準備呢?
對于上述問題,北京捷通華聲語音技術(shù)有限公司(下稱“捷通華聲”)董事長張連毅在接受C114專訪時為我們進行了詳細解讀。
HCI技術(shù)大爆發(fā):捷通華聲推靈云平臺
當前,語音合成、語音識別和手寫識別已經(jīng)成為智能人機交互的三項核心技術(shù),正在悄悄地影響和改變著人們的生活。其中,語音合成技術(shù)可以讓各種設備“開口講話”,把各種文本信息以語音的方式播報;語音識別技術(shù)可以讓各種設備“聽懂”我們的話;手寫識別技術(shù)可以幫助人們從各種設備中繁瑣的按鍵操作中解脫出來,輕松輸入文字。
而在張連毅看來,隨著移動互聯(lián)網(wǎng)、智能終端、云計算的飛速發(fā)展,智能人機交互技術(shù)也迎來了大爆發(fā)的時代。他認為,“智能人機交互技術(shù)是各大技術(shù)產(chǎn)業(yè)變革的畫龍點睛之作,也是我國由‘中國制造’向‘中國創(chuàng)造’轉(zhuǎn)型的巨大機遇,中國在智能人機交互技術(shù)領域的起步絕不輸于外國企業(yè)。”
據(jù)張連毅介紹,捷通華聲憑借十多年來在智能人機交互技術(shù)、移動互聯(lián)網(wǎng)領域的雄厚積累,于2011年推出了全球第一個全方位智能人機交互感知云——靈云平臺,為從“中國制造”向“中國創(chuàng)造”的全面升級提供了一個強大的“發(fā)動機”引擎;隨后,又經(jīng)過各方面的應用探索,于2012年再次推出了靈云平臺2.0版本。
目前,靈云平臺主要有語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)、自然語言理解(NLU)這五項核心技術(shù),為不同領域、行業(yè)、企業(yè),乃至個人用戶,提供了多種智能人機交互解決方案,包括無紙化辦公方案、電子簽批方案、電子表單處理方案、語音技術(shù)方案、智能客服系統(tǒng)方案等,為企業(yè)高效辦公、人們便捷生活提供強有力的技術(shù)保障。
靈云平臺的客戶不僅涵蓋了政府、教育、金融、電信、能源、交通、醫(yī)療等傳統(tǒng)行業(yè)領域的客戶,更有智能家電、智能家居、互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng)、智慧城市等新興領域的用戶。例如,目前捷通華聲已將靈云平臺與中國電信正在開發(fā)的EMP平臺實現(xiàn)無縫銜接,成為其開放平臺的重要組成部分,而捷通華聲則負責提供其中的人機交互技術(shù)支持;此外,捷通華聲靈云平臺技術(shù)還應用到了百度語音助手等軟件平臺。
推動技術(shù)成熟完善:靈云開發(fā)者社區(qū)即將開放
相關數(shù)據(jù)顯示,捷通華聲已在國內(nèi)語音識別、手寫識別、模式識別技術(shù)市場占有了較大的市場份額,2010年世博會廣播系統(tǒng)的語音技術(shù)80%是由捷通華聲提供支持,全國的高鐵所有站臺的信息播報系統(tǒng),都是采用捷通華聲的語音合成技術(shù)。
雖然,捷通華聲在智能人機交互技術(shù)領域已經(jīng)成為領先廠商,但捷通華聲在該領域的耕耘遠不止于此。張連毅指出,“雖然智能人機交互技術(shù)已經(jīng)取得了非常廣泛的應用,但其技術(shù)本身還存在一些不完善的地方,例如語音識別率還不能做到百分之百,語音合成雖然已經(jīng)可以流利地學習人講話,但講話的語氣及感情色彩相比真人還有一定差距。”
因此,業(yè)界還需要去不斷學習、了解、應用、完善好這些智能人機交互技術(shù),這需要整個產(chǎn)業(yè)來推動其發(fā)展。張連毅透露,“為此,捷通華聲的靈云開發(fā)者社區(qū)決定在今年7月18日向整個社會全方位開放各項能力,所有的企業(yè)和個人開發(fā)者都可以免費加入到靈云開發(fā)者社區(qū)。”
“在靈云開發(fā)者社區(qū),企業(yè)和個人開發(fā)者均可直接下載語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)等多項HCI核心技術(shù)。與此同時,捷通華聲還將加強技術(shù)指導,幫助開發(fā)者把不同的智能人機交互技術(shù)應用到產(chǎn)品上,與企業(yè)和個人開發(fā)者共同了解、學習、切磋、完善各種智能人機交互技術(shù)。”張連毅說。
據(jù)了解,靈云開發(fā)者社區(qū)作為捷通華聲靈云平臺的門戶,是整個靈云平臺非常重要的一部分。開發(fā)者社區(qū)將靈云平臺的所有能力全部開放給用戶,讓用戶可以自主的選擇需要的能力去創(chuàng)造想要的產(chǎn)品,大到平臺級智能人機交互多種能力的需求,小到個人開發(fā)者擁有的開發(fā)夢想,靈云平臺都可以滿足。
“在這里,開發(fā)者可以享受多能力支持服務、相互交流開發(fā)心得、創(chuàng)造多能力集合產(chǎn)品并上線產(chǎn)品。更為重要的是,通過開發(fā)者社區(qū)利用靈云平臺的多種能力,開發(fā)者可結(jié)合自己的創(chuàng)造力,創(chuàng)造出各種新型的智能人機交互產(chǎn)品,這不僅有利于服務大眾創(chuàng)造價值,還能夠共同推動智能人機交互技術(shù)產(chǎn)業(yè)的發(fā)展。”張連毅強調(diào),開發(fā)者社區(qū)是一個充滿創(chuàng)造的世界,在這里通過我們共同的努力能夠完成由“中國制造”到“中國創(chuàng)造”的完美轉(zhuǎn)變,靈云開發(fā)者社區(qū)歡迎每一位企業(yè)和個人開發(fā)者的加入。
面對競爭:開放與合作可獲雙贏
除了通過靈云開發(fā)者社區(qū)來不斷完善智能人機交互技術(shù)以外,捷通華聲對于整個產(chǎn)業(yè)的發(fā)展也有著自己的獨到見解。當前,智能人機交互技術(shù)早已不是什么新鮮事,微軟、百度、谷歌、騰訊等公司都已進入這個領域并有很強的研發(fā)實力,而作為專業(yè)的HCI技術(shù)提供商,科大訊飛、漢王等公司在各單項技術(shù)領域也獲得了不錯的成績,智能人機交互產(chǎn)業(yè)迎來了群雄并起的時代。
在張連毅看來,智能人機交互技術(shù)正在迎來產(chǎn)業(yè)新的發(fā)展機遇。面對競爭對手的沖擊,捷通華聲會坦然面對這種競爭,并且繼續(xù)開放智能人機交互技術(shù)的各種能力,憑借近20年在這個領域的積累繼續(xù)完善技術(shù),同時與業(yè)界保持密切的合作,以保持自身技術(shù)的領先性。
“毫無疑問,采取排斥和封閉的態(tài)度并不有利于智能人機交互技術(shù)產(chǎn)業(yè)的良性發(fā)展。”張連毅表示,“正如靈云平臺定位于智能人機交互技術(shù)的能力開放服務平臺一樣,我們希望通過靈云平臺向所有能夠使用智能人機交互技術(shù)的廠商和開發(fā)者,提供全方位的核心技術(shù)能力;此外,捷通華聲還會加強與業(yè)界合作伙伴乃至競爭對手的溝通與合作,共同把產(chǎn)業(yè)做大做強。”[!--empirenews.page--]
例如,一直以來捷通華聲與百度公司都保持著良好的合作伙伴關系。前不久,為促進雙方在智能人機交互核心技術(shù)與產(chǎn)品等方面的合作,百度公司投資入股捷通華聲。張連毅認為,此次戰(zhàn)略合作,不僅對百度廣泛應用語音合成、手寫識別等技術(shù)形成支撐,也將對捷通華聲智能人機交互技術(shù)的廣泛應用與市場拓展產(chǎn)生非常大的促進作用。
北京捷通華聲語音技術(shù)有限公司董事長 張連毅