IBM宣布語(yǔ)音識(shí)別技術(shù)的錯(cuò)誤率已接近人類
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:中關(guān)村在線)
據(jù)外媒報(bào)道,此前谷歌曾表示他們已經(jīng)在語(yǔ)音識(shí)別領(lǐng)域獲得了突破,將錯(cuò)誤率降低到了30%。不過(guò),最近IBM在他們的官網(wǎng)上宣布,他們已經(jīng)創(chuàng)造了自家語(yǔ)音識(shí)別的新紀(jì)錄,錯(cuò)誤率僅為5.5%,與去年的6.9%相比又一次的實(shí)現(xiàn)了提升。
這些主要是在非常困難的語(yǔ)音識(shí)別任務(wù)中測(cè)試得來(lái)的,紀(jì)錄人與人之間日常對(duì)話如“買汽車”,計(jì)算出來(lái)的結(jié)果。這種紀(jì)錄的語(yǔ)料庫(kù)被稱為“SWITCHBOARD”,20多年來(lái)一直用于檢驗(yàn)語(yǔ)音識(shí)別系統(tǒng)。通過(guò)這種數(shù)據(jù)庫(kù)還能夠得到5.5%的錯(cuò)誤率,已經(jīng)是非常難得的了。
此前,谷歌高級(jí)研究員杰夫·迪恩(Jeff Dean)日前在人工智能前沿峰會(huì)(AI Frontiers)上表示,自2012年以來(lái),谷歌已經(jīng)把語(yǔ)音識(shí)別的詞錯(cuò)率(WER)降低了30%以上。詞錯(cuò)率指的是谷歌將一個(gè)詞語(yǔ)從語(yǔ)音轉(zhuǎn)錄成為文字時(shí)的錯(cuò)誤率。
迪恩稱,詞錯(cuò)率的下降得益于神經(jīng)網(wǎng)絡(luò)的使用,后者是谷歌和其他公司在深度學(xué)習(xí)中使用的一種系統(tǒng)。研究人員使用大量數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,例如語(yǔ)音片段,然后讓他們對(duì)新數(shù)據(jù)作出推斷。谷歌在2012年首次將神經(jīng)網(wǎng)絡(luò)用于語(yǔ)音識(shí)別中,當(dāng)時(shí)正值“果凍豆”Android系統(tǒng)發(fā)布。谷歌并不是經(jīng)常討論公司在語(yǔ)音識(shí)別技術(shù)上取得的進(jìn)展,該技術(shù)影響著越來(lái)越多的谷歌產(chǎn)品,從Google Home智能音箱到Gboard輸入法。