科大訊飛頭頂“AI龍頭”的光環(huán),作為A股第一家以人工智能為主業(yè)上市的公司,一舉一動備受矚目。從概念到技術(shù),從技術(shù)到生意,“會不會做生意”成為訊飛的重頭戲。
以日新月異的智能語音技術(shù)而蜚聲世界的科大訊飛,近日入選我國首批國家新一代人工智能開放創(chuàng)新平臺依托企業(yè)。科大訊飛的語音識別技術(shù)研究,既注重全球視野,又不忘民族特色,尤其在中國方言識別領(lǐng)域一馬當(dāng)先,成就卓著。
近日,在科技部召開的新一代人工智能發(fā)展規(guī)劃暨重大科技項目啟動會上,我國首批國家新一代人工智能開放創(chuàng)新平臺名單正式公布。該名單包括四大平臺,對應(yīng)四個依托企業(yè),除了“BAT”三巨頭之外,科大訊飛也榮膺在列。
科大訊飛以日新月異的智能語音技術(shù)蜚聲世界,此次成為智能語音國家新一代人工智能開放創(chuàng)新平臺的依托企業(yè)可謂實至名歸。除了在英文、普通話、醫(yī)療影像等的機器識別領(lǐng)域走在前面,科大訊飛的技術(shù)還別有過人之處,這就是方言語音識別。
長期以來,推廣普通話與保護方言之間存在一些難以避免的矛盾??傮w而言,近年來普通話的普及程度越來越高,而不少方言由于使用機會越來越少而逐漸式微。尤其是在普通話基礎(chǔ)教育環(huán)境下成長起來的新一代年輕人,很多都對當(dāng)?shù)胤窖月牭枚畢s說不出,或者既聽不懂也不會說。
近幾年,市場上出現(xiàn)了不少面向漢語的語音識別、語音輸入智能軟件,它們絕大多數(shù)都只適用于普通話,其中一部分還可識別粵語、上海話等方言,不過種類非常有限。這對大批不擅長甚至不會說普通話的國人來說,無異于先天性地喪失了使用權(quán)。同時,普通話在智能語音領(lǐng)域的“壟斷”也讓人們又一次失去使用方言的機會。而方言衰落乃至滅絕給民族傳統(tǒng)、文化傳承造成的損失難以估量,無論是文藝界還是科技界,這都不是人們愿意看到的。
出于滿足用戶個性化需求和保護方言的雙重使命,科大訊飛開始了用人工智能表達鄉(xiāng)音的嘗試。2014年年初,在云計算、大數(shù)據(jù)、深度神經(jīng)網(wǎng)絡(luò)、方言口音適配等技術(shù)的綜合作用下,四川話成為率先應(yīng)用于科大訊飛輸入法的方言(不過在此之前,訊飛輸入法已支持粵語輸入)。此后,科大訊飛在中國方言語音識別技術(shù)方面突飛猛進,至2017年11月,科大訊飛能夠識別的方言種類已達22種,識別準確率超過90%者有十余種,對中文的識別準確率已超過英語。
在今年10月24日舉辦的開發(fā)者節(jié)上,科大訊飛宣布重磅消息,啟動了以“留下你的鄉(xiāng)音”為口號的“方言保護計劃”。到2018年年初,科大訊飛計劃收集1024萬條來自各地的方言,力邀全民參與共建“中華方言庫”。技術(shù)攻堅與公益事業(yè)合二為一,相輔相成,創(chuàng)造了科技進步促進文化傳承的典范。
據(jù)了解,我國目前日常使用的方言有80多種,要實現(xiàn)對這些方言的機器識別乃至推出產(chǎn)品應(yīng)用,無疑還有很長的路要走,但科大訊飛已然一馬當(dāng)先。在眾多語言學(xué)家與技術(shù)精英的通力合作下,方言保護事業(yè)將越做越順。
科大訊飛的語音識別技術(shù)研究,既注重全球視野,又不忘民族特色,一方面是中譯英、中譯韓、中譯日、英譯日的接連突破,另一方面則是粵語、四川話、閩南語、客家語、貴州話的不斷拓展。國際化與民族化兼顧,這正是一個國家級人工智能開放創(chuàng)新平臺依托企業(yè)應(yīng)有的氣魄。