問之科技智能音箱產(chǎn)品“麥寶”,打造智能語音與硬件互聯(lián)
問之科技由翟魯峰創(chuàng)立于2015年9月,主要為機(jī)器人與智能家居領(lǐng)域廠商開發(fā)語音交互技術(shù)、平臺以及硬件產(chǎn)品。今年6月7日,其智能音箱產(chǎn)品“麥寶”正式發(fā)布。
問之科技創(chuàng)始人翟魯峰
到目前,問之科技共有十余個重點(diǎn)合作商家,如機(jī)智云、棠棣機(jī)器人、南江機(jī)器人等。團(tuán)隊(duì)近期在優(yōu)化“麥寶”,接下來將推出“高顏值”的一款;另外還會推出智能語音物聯(lián)網(wǎng)方案。
注:翟魯峰向剛承諾文中數(shù)據(jù)無誤,為其真實(shí)性負(fù)責(zé),鉛筆道已備份錄音速記,為內(nèi)容客觀性背書。
“語音交互的春天”
2014年年初,“需求來了,創(chuàng)業(yè)的春天也就來了。”這是翟魯峰在做天貓魔盒時,發(fā)現(xiàn)其對非接觸式交互(尤其是語音交互)需求強(qiáng)烈后的感嘆。
天貓魔盒,高清4K網(wǎng)絡(luò)電視機(jī)頂盒,用戶長按遙控器的語音鍵即可語音搜索,直接查詢影視歌曲。其中的云OS系統(tǒng)中的語音交互隨后也被應(yīng)用在康佳等數(shù)個品牌的智能電視上。
翟魯峰回憶起在PC時代,用戶多用鍵盤與鼠標(biāo)來與電腦交互。盡管微軟的office軟件也支持語音輸入,但使用者甚少。從業(yè)界整體來看,也很少有相應(yīng)的硬件產(chǎn)品。
隨后的手機(jī)時代,用戶對語音交互的需求增加,比如Siri的誕生以及廣泛應(yīng)用。
不過此時,語音交互更多是作為其他功能的輔助手段而存在。因?yàn)榧幢銢]有語音交互,用戶也可以很方便地使用手機(jī)。但對于去屏化智能硬件來說,觸屏輸入基本沒可能,語音交互成為主要的交互手段。
繼天貓魔盒后,翟魯峰在阿里智能生活事業(yè)部分別接觸了智能家居與機(jī)器人,這樣的感受漸深。
“語音交互將成為去屏化硬件的主要交互手段,并且有可能成為家庭智能交互的入口”;與此同時,盡管亞馬遜推出智能音箱echo,但國內(nèi)此類產(chǎn)品尚且不多,而且國內(nèi)對于音箱的接受度普遍不高,創(chuàng)業(yè)機(jī)會蘊(yùn)藏其中。
然而,受限于在大公司難以推進(jìn)創(chuàng)新業(yè)務(wù)的通病,2015年5月,他決定離開阿里創(chuàng)業(yè)。9月,問之科技成立。
重點(diǎn)是“云”
考慮到國內(nèi)用戶對音箱的低接受度,翟魯峰想到,一來要盡可能增加智能家居控制等家庭服務(wù)功能;二來,要將產(chǎn)品的體積做的盡可能小;再來,要降低定價。
2016年4月,亞馬遜推出Echo Dot,其搭載了與前一代產(chǎn)品相同的遠(yuǎn)場語音識別技術(shù)以及語音控制功能。不過由于體積甚小(只有3厘米高),它無法單獨(dú)發(fā)揮前一代產(chǎn)品支持的揚(yáng)聲器功能。另外,Echo Dot價格大幅降低,約50美元。
它所走的路線與翟魯峰對問之科技產(chǎn)品的設(shè)定不謀而合。不過據(jù)他解釋,他的產(chǎn)品定位是在2015年年底就定下的。另外,與國外不同,國內(nèi)智能家居市場長時間不溫不火,老家電則是占據(jù)市場的主要力量。
基于此,翟魯峰一開始就將紅外模式設(shè)定在產(chǎn)品設(shè)計之中。市場化方面,他決定將產(chǎn)品分為模組與硬件成品,前者面向要做音箱類產(chǎn)品的客戶,后者可直接出售。
不過,硬件產(chǎn)品的推出更多是為了云端服務(wù)器,“云服務(wù)器未來會是包括語音數(shù)據(jù)、口音、講話方式、行為習(xí)慣、情緒變化等用戶數(shù)據(jù)的沉淀之處”。模組的出售也是為了積累云端資源。
起初,翟魯峰預(yù)估半年內(nèi)就能將產(chǎn)品做出來,然而事實(shí)證明他過于樂觀。
因?yàn)樵诋a(chǎn)品開發(fā)中,語音識別中遠(yuǎn)講、喚醒等模塊的打磨都花了遠(yuǎn)超過翟魯峰預(yù)期的時間與精力。為了實(shí)現(xiàn)語音遠(yuǎn)講識別,就要盡量避開周圍環(huán)境的干擾,為此,團(tuán)隊(duì)反復(fù)調(diào)試算法與結(jié)構(gòu),并開發(fā)出特定的遠(yuǎn)講降噪模組;而為了讓人機(jī)語音交互更流暢,團(tuán)隊(duì)加入Oneshot喚醒+識別。
另外,算法的語音識別等主要部分被放在云端,產(chǎn)品端的則有喚醒識別與機(jī)器檢測。其中,喚醒識別與響應(yīng)主要是通過加強(qiáng)版靜音檢測模塊的使用來實(shí)現(xiàn)的。此外,針對特定的家庭智能硬件,團(tuán)隊(duì)還做了基于語音神經(jīng)網(wǎng)絡(luò)(DNN)芯片加速的離線語音識別,用于實(shí)現(xiàn)本地端喚醒、云端識別。
◆語音交互模組
年中,語音交互模組發(fā)布,陸續(xù)有商家前來試用。銀行也是客戶之一。之前,交通銀行智能客服機(jī)器人“嬌嬌”的推出吸引了一大波眼球。
翟魯峰提到,銀行的智能服務(wù)機(jī)器人一方面確實(shí)可以代替銀行人員的部分服務(wù),另一方面也是吸引關(guān)注的舉措之一。而且比起家庭對玩具機(jī)器人的低付費(fèi)意愿,銀行的買單率相對要高。所以當(dāng)時他們對這部分業(yè)務(wù)也投入了比較大的精力。不過服務(wù)機(jī)器人語音語義解決方案的正式發(fā)布與落地銀行則是在今年3月。
年終,語音神經(jīng)網(wǎng)絡(luò)芯片與問之云平臺1.0——語音云和語義云發(fā)布,已可為商家提供服務(wù)。
小而輕的“麥寶”
云服務(wù)器固然重要,但找到能讓用戶接受的呈現(xiàn)形態(tài)也很重要。為此,問之科技推出小而輕、WiFi即接即用的智能音箱“麥寶”。
◆小巧的“麥寶”
“麥寶”是一個90mm*90mm*30mm的長方體,重量約163克。其可兼容近10萬個型號的老家電產(chǎn)品,實(shí)現(xiàn)遠(yuǎn)講識別、虛擬助理與音箱等功能,并支持在語音交互平臺的喚醒詞與語義定制。
針對不同的使用場景,為實(shí)現(xiàn)更高的適配與識別精準(zhǔn)度,團(tuán)隊(duì)開發(fā)語音語義定制的方法也有所不同。
“麥寶”搭載有問之科技自行開發(fā)的語音交互平臺,可與用戶展開多輪對話(理論上沒有輪次上限)。在多輪對話中,系統(tǒng)會主動引導(dǎo)用戶給出關(guān)鍵信息,確保任務(wù)被準(zhǔn)確執(zhí)行。
在做“麥寶”時,因?yàn)橄胍龀尚∏赏庥^,產(chǎn)品內(nèi)部的播放口與麥克風(fēng)必然會離得很近,而這樣很難實(shí)現(xiàn)在音樂播放時的喚醒打斷,團(tuán)隊(duì)不得不反復(fù)調(diào)整結(jié)構(gòu)與算法,最終,團(tuán)隊(duì)用多模塊協(xié)作解決了這個問題。
而由于國內(nèi)工廠在智能音箱方面并沒有成熟的方案體系,所以電路與驅(qū)動等關(guān)鍵部件由團(tuán)隊(duì)自行設(shè)計,其他工業(yè)設(shè)計則交由代工廠完成。
“麥寶”是一款C端產(chǎn)品。之所以選擇面向C端,是源于翟魯峰在做天貓魔盒過程中對客戶資源的積累,以及對相應(yīng)市場生態(tài)的了解。此外,團(tuán)隊(duì)成員對C端產(chǎn)品更有偏好,也更樂于做直接面向消費(fèi)者的產(chǎn)品。
“B端產(chǎn)品的市場是有限的,做完一批客戶后,基本就是維護(hù),很少能快速爆發(fā);C端產(chǎn)品則不同,當(dāng)一代人接受了一款新品之后,需求量是非常大的”,基于自己此前開發(fā)C端產(chǎn)品的經(jīng)驗(yàn),翟魯峰如是說。
今年3月,問之云平臺1.1——語音物聯(lián)云發(fā)布。6月7日,在CES Asia 2017現(xiàn)場,“麥寶”正式發(fā)布。
上半年,團(tuán)隊(duì)的主要精力都放在音箱產(chǎn)品的設(shè)計與生產(chǎn)上,接下來的業(yè)務(wù)重點(diǎn)將放在智能家居上。到目前,問之科技共有十余個重點(diǎn)合作商家,如機(jī)智云。
團(tuán)隊(duì)近期在優(yōu)化“麥寶”,接下來將推出”高顏值”的一款;另外還會推出智能語音物聯(lián)網(wǎng)方案。