阿里希望通過引入視覺能力加速智能音箱進(jìn)化為家庭機(jī)器人
阿里巴巴人工智能實(shí)驗(yàn)室于3月22日發(fā)布人機(jī)交互系統(tǒng)AliGenie2.0版本。新版本最大特點(diǎn)是在原有“聽”和“說”的交互體驗(yàn)基礎(chǔ)上,引入視覺能力。
據(jù)悉,AliGenie 2.0的視覺能力包括圖像識(shí)別、人臉識(shí)別、物體檢測(cè)。搭載新版本的“天貓精靈”成為首款能“看見”的智能音箱。然而,天貓精靈并沒有推出一款“帶屏幕的音箱”,而是推出了“精靈火眼”功能:通過XHolder外設(shè)及“精靈火眼”應(yīng)用程序,用戶能連接自己的手機(jī),為天貓精靈加一塊屏幕。
“精靈火眼”初期上線了讀書、識(shí)別藥盒等功能。比如,面向兒童使用場(chǎng)景,“精靈火眼”與出版社合作,精選了適合3歲到8歲兒童的117套圖書。面向老年人使用場(chǎng)景,“精靈火眼”推出識(shí)別藥盒的功能,能識(shí)別4萬種藥盒,只要掃一掃就能用語音播報(bào)藥名、功效、過期日等信息。
在阿里巴巴人工智能實(shí)驗(yàn)室看來,智能音箱終極形態(tài)是家庭機(jī)器人,從“聽”“說”,到“視覺交互”,再到“行動(dòng)力”,阿里巴巴希望通過引入視覺能力加速這種進(jìn)化。
據(jù)了解,天貓精靈上市200多天,即實(shí)現(xiàn)200萬臺(tái)銷量。在全球市場(chǎng),最暢銷的智能音箱亞馬遜ECHO達(dá)到這一數(shù)字,用了一年多的時(shí)間??梢姡袊?guó)智能音箱市場(chǎng)的發(fā)展非常迅速。
而在國(guó)內(nèi),人工智能帶動(dòng)“百箱大戰(zhàn)”,目前智能音箱的品類繁多、功能卻走向趨同。在阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人淺雪看來,這種情況不會(huì)持續(xù)很久,大多數(shù)沒有技術(shù)投入、生態(tài)建設(shè)的產(chǎn)品會(huì)消亡,最終可能只剩兩到三個(gè)主要玩家。
盡管當(dāng)前市場(chǎng)都把目光瞄準(zhǔn)硬件,但淺雪認(rèn)為,未來發(fā)展的核心趨勢(shì)在于云和端的能力?!拔覀儠?huì)不斷把更多的能力,引入到家庭場(chǎng)景當(dāng)中,不斷定義我們對(duì)人機(jī)交互的理解、對(duì)家的理解?!?/p>