如何通過SLAM技術(shù)應(yīng)用改變?cè)鰪?qiáng)現(xiàn)實(shí)
增強(qiáng)現(xiàn)實(shí)已經(jīng)成為比VR技術(shù)還要熱門的技術(shù),屬于它的繁榮還在后頭。近日我們來介紹一下,如何利用SLAM技術(shù)的應(yīng)用進(jìn)而改變?cè)鰪?qiáng)現(xiàn)實(shí)技術(shù)的。
當(dāng)這兩種不同的交互方式開始無縫融合的時(shí)候,我相信我們會(huì)看到最強(qiáng)大和最廣泛采用的增強(qiáng)現(xiàn)實(shí)實(shí)現(xiàn)。
盡管普及率有限,但增強(qiáng)現(xiàn)實(shí)顯然是當(dāng)前最熱門的技術(shù)領(lǐng)域之一。這在很大程度上是因?yàn)橥ㄟ^標(biāo)記追蹤來實(shí)現(xiàn)AR傳統(tǒng)方式,以及隨之而來的高門檻障礙。
1. 圖像識(shí)別與標(biāo)記追蹤
除了3D模型和動(dòng)畫之外,增強(qiáng)現(xiàn)實(shí)的支點(diǎn)是建立在兩個(gè)緊密相關(guān)的技術(shù)上:圖像識(shí)別與標(biāo)記追蹤。當(dāng)兩者配對(duì)在一起時(shí),它們可以支持?jǐn)z像頭識(shí)別圖像的數(shù)據(jù),從而觸發(fā)相關(guān)的體驗(yàn)并在三維空間中追蹤相對(duì)于攝像頭的眼睛位置。通過將圖像上傳至處理服務(wù)器,開發(fā)者可以將一個(gè)或多個(gè)圖像關(guān)聯(lián)到單個(gè)增強(qiáng)現(xiàn)實(shí)體驗(yàn)。這樣,設(shè)備上的攝像頭就能夠理解并追蹤疊加的數(shù)字內(nèi)容。
對(duì)于其工作原理,我們首先要理解兩個(gè)核心概念。首先是Marker DetecTIon(標(biāo)記檢測(cè)),即通過相機(jī)鏡頭識(shí)別圖像(通常稱為標(biāo)記),并且與服務(wù)器上的對(duì)應(yīng)部分建立關(guān)聯(lián)以觸發(fā)體驗(yàn);其次是Marker Tracking(標(biāo)記追蹤),或者說能夠維持物理對(duì)象或標(biāo)記的實(shí)時(shí)方向,并且不斷更新數(shù)字內(nèi)容以模擬它的能力。
一個(gè)基于標(biāo)記的AR體驗(yàn)的例子
檢測(cè)和追蹤的質(zhì)量由一系列的參數(shù)決定,主要是對(duì)比點(diǎn)的復(fù)雜度和標(biāo)記所缺乏的重復(fù)模式。對(duì)于優(yōu)秀標(biāo)記和糟糕點(diǎn)擊的各種復(fù)雜難點(diǎn),我可以另起一篇文章進(jìn)行闡釋。雖然這仍然為用戶提供了強(qiáng)大的體驗(yàn),但它具有明顯的局限性,而自其誕生依賴便一直在困擾著整個(gè)行業(yè)。從用戶體驗(yàn)的角度來看,我不僅需要下載特定的應(yīng)用程序,同時(shí)還需要對(duì)應(yīng)的物理對(duì)象才能激活體驗(yàn)。但借助SLAM,用戶只需一臺(tái)移動(dòng)設(shè)備即可訪問內(nèi)容。
2. 即時(shí)定位與地圖構(gòu)建(SLAM)即時(shí)定位與地圖構(gòu)建的英文簡(jiǎn)稱是SLAM。這種技術(shù)直到最近才成為了一個(gè)可行的選擇,因?yàn)樵絹碓蕉嗟脑O(shè)備開始搭載輔助性的深度攝像頭(在撰寫這篇文章的時(shí)候,谷歌和蘋果已經(jīng)找到了繞開專用輔助攝像頭的方法) ,而這是支持SLAM的必要條件。
這項(xiàng)技術(shù)基本上可以主動(dòng)識(shí)別空間中的墻壁,地板和其他物理障礙。目前,大多數(shù)利用SLAM的應(yīng)用程序只是采用樓層識(shí)別和位置追蹤來把AR對(duì)象放置在用戶周圍的表面上。少數(shù)幾個(gè)平臺(tái)能夠處理額外的空間信息(如墻壁,天花板和家具等等),從而可以更深入地理解周圍的環(huán)境。目前大量利用這些功能的兩大平臺(tái)是蘋果ARKit和谷歌ARCore。
3. 密集式點(diǎn)云重建:3D世界的點(diǎn)描技法這為開發(fā)者創(chuàng)建原來不可能實(shí)現(xiàn)的AR體驗(yàn)提供了多樣性和靈活性。SLAM能夠主動(dòng)對(duì)它認(rèn)為存在的表面進(jìn)行每秒數(shù)百次的粗略估計(jì),并用描點(diǎn)或頂點(diǎn)固定這些微觀位置。通過建立一個(gè)密集式點(diǎn)云重建,設(shè)備攝像頭不僅可以識(shí)別物理空間,而且還可以記住物體轉(zhuǎn)向時(shí)的相對(duì)位置。下面是該技術(shù)實(shí)時(shí)處理信息時(shí)的演示:
基于追蹤的體驗(yàn)?zāi)軌蛱峁┮粋€(gè)巨大的優(yōu)勢(shì):情景。當(dāng)用戶拾起一個(gè)物體時(shí),激活的數(shù)字內(nèi)容感覺就像是物體的一部分。假如我從全麥蜂蜜堅(jiān)果麥圈中激活了一個(gè)AR體驗(yàn),然后其中的卡通吉祥物從包裝盒中飛走,這將成為一種有意義的執(zhí)行。這種行為使得應(yīng)用程序能夠真正成為物理世界的“瀏覽器”。用SLAM來實(shí)現(xiàn)這一點(diǎn)要困難得多,因?yàn)楸M管電腦可以更好地理解世界的形式,但無法根據(jù)它所看到的內(nèi)容來提供實(shí)質(zhì)性的反饋。
通過SLAM,用戶可以逼真地在辦公室里控制卡通水管工人(如馬里奧)收集金幣或者躲開危險(xiǎn)的食肉植物;用實(shí)際上并不存在的家具和海報(bào)來重新裝修臥室;或者在街道上放置一系列箭頭,然后用GPS定位到最接近的咖啡店。當(dāng)這兩種不同的交互方式開始無縫融合的時(shí)候,我相信我們會(huì)看到最強(qiáng)大和最廣泛采用的增強(qiáng)現(xiàn)實(shí)實(shí)現(xiàn)。這種融合技術(shù)的潛能無窮無盡。
SLAM技術(shù)的應(yīng)用不僅只局限于增強(qiáng)現(xiàn)實(shí)。整體而言,SLAM可以幫助為計(jì)算機(jī)提供更符合字面意義的“眼睛”,使得它們能夠通過視覺輸入來理解周圍的一切。這種理解已經(jīng)擴(kuò)展到機(jī)器人,自動(dòng)駕駛汽車,機(jī)器學(xué)習(xí)和人工智能等領(lǐng)域。