查理·馬什(Charlie Marsh)和希波羅·薩哈(Shubhro Saha)是來自普利斯頓大學(xué)(Princeton University)的兩名本科生,一個巨大的機遇可能已經(jīng)來到他們的面前。我敢打賭,一些人才獵頭在第一輪篩選中就想把他們招致麾下。
雖然蘋果(Apple)可能正在為Siri制定大計劃,微軟(Microsoft)最近為Windows Phone 8.1發(fā)布的Cortana個人助理看起來十分誘人,但那些希望在自己應(yīng)用中為各種設(shè)備開發(fā)類似功能的開發(fā)者只能自己重新發(fā)明一些非常復(fù)雜的功能——至少是在此之前。
年輕的查理和希波羅開發(fā)了一款他們稱為“Jasper”的開源語音識別和控制應(yīng)用,并附帶其“極其簡單的”API(應(yīng)用程序接口)以及基于B型樹莓派(Raspberry Pi)的開發(fā)套件。Jasper的語音識別技術(shù)基于PocketSphinx軟件,這是由卡內(nèi)基梅隆大學(xué)開發(fā)的另一套開源工具包。這些軟件都能在樹莓派的ARM處理器上完美運行,因此開發(fā)者應(yīng)該能輕松將其移植到安卓乃至iOS平臺。
語音控制助理Jasper0' width="500" height="333" />
Jasper還使用了Phonetisaurus,這是用語和詞匯的開源庫,它可以學(xué)習(xí)用戶的語言模式來進行文本—語音合成。
如果你想學(xué)習(xí)如何利用樹莓派、麥克風(fēng)以及一組揚聲器來打造自己的Jasper,你可以在這里查看Jasper的所有開發(fā)文檔。
有個聲音告訴我,一旦查理和希波羅的新API得到一些普及,有人可能就要打電話給他們了。這是一種令人印象深刻的技術(shù),它已經(jīng)足夠完善,并且為上手開發(fā)做好了準(zhǔn)備。而且,由于它是開源的,很有可能許多人會立刻投身其中。