如何通過SLAM技術應用改變增強現(xiàn)實

時間：2020-07-31 21:15:01

關鍵字： ar slam

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 增強現(xiàn)實已經(jīng)成為比VR技術還要熱門的技術，屬于它的繁榮還在后頭。近日我們來介紹一下，如何利用SLAM技術的應用進而改變增強現(xiàn)實技術的。當這兩種不同的交互方式開始無縫融合的時候，我相信我

增強現(xiàn)實已經(jīng)成為比VR技術還要熱門的技術，屬于它的繁榮還在后頭。近日我們來介紹一下，如何利用SLAM技術的應用進而改變增強現(xiàn)實技術的。

當這兩種不同的交互方式開始無縫融合的時候，我相信我們會看到最強大和最廣泛采用的增強現(xiàn)實實現(xiàn)。

盡管普及率有限，但增強現(xiàn)實顯然是當前最熱門的技術領域之一。這在很大程度上是因為通過標記追蹤來實現(xiàn)AR傳統(tǒng)方式，以及隨之而來的高門檻障礙。

1. 圖像識別與標記追蹤

除了3D模型和動畫之外，增強現(xiàn)實的支點是建立在兩個緊密相關的技術上：圖像識別與標記追蹤。當兩者配對在一起時，它們可以支持攝像頭識別圖像的數(shù)據(jù)，從而觸發(fā)相關的體驗并在三維空間中追蹤相對于攝像頭的眼睛位置。通過將圖像上傳至處理服務器，開發(fā)者可以將一個或多個圖像關聯(lián)到單個增強現(xiàn)實體驗。這樣，設備上的攝像頭就能夠理解并追蹤疊加的數(shù)字內(nèi)容。

對于其工作原理，我們首先要理解兩個核心概念。首先是Marker DetecTIon（標記檢測），即通過相機鏡頭識別圖像（通常稱為標記），并且與服務器上的對應部分建立關聯(lián)以觸發(fā)體驗；其次是Marker Tracking（標記追蹤），或者說能夠維持物理對象或標記的實時方向，并且不斷更新數(shù)字內(nèi)容以模擬它的能力。

一個基于標記的AR體驗的例子

檢測和追蹤的質量由一系列的參數(shù)決定，主要是對比點的復雜度和標記所缺乏的重復模式。對于優(yōu)秀標記和糟糕點擊的各種復雜難點，我可以另起一篇文章進行闡釋。雖然這仍然為用戶提供了強大的體驗，但它具有明顯的局限性，而自其誕生依賴便一直在困擾著整個行業(yè)。從用戶體驗的角度來看，我不僅需要下載特定的應用程序，同時還需要對應的物理對象才能激活體驗。但借助SLAM，用戶只需一臺移動設備即可訪問內(nèi)容。

2. 即時定位與地圖構建（SLAM）

即時定位與地圖構建的英文簡稱是SLAM。這種技術直到最近才成為了一個可行的選擇，因為越來越多的設備開始搭載輔助性的深度攝像頭（在撰寫這篇文章的時候，谷歌和蘋果已經(jīng)找到了繞開專用輔助攝像頭的方法），而這是支持SLAM的必要條件。

這項技術基本上可以主動識別空間中的墻壁，地板和其他物理障礙。目前，大多數(shù)利用SLAM的應用程序只是采用樓層識別和位置追蹤來把AR對象放置在用戶周圍的表面上。少數(shù)幾個平臺能夠處理額外的空間信息（如墻壁，天花板和家具等等），從而可以更深入地理解周圍的環(huán)境。目前大量利用這些功能的兩大平臺是蘋果ARKit和谷歌ARCore。

3. 密集式點云重建：3D世界的點描技法

這為開發(fā)者創(chuàng)建原來不可能實現(xiàn)的AR體驗提供了多樣性和靈活性。SLAM能夠主動對它認為存在的表面進行每秒數(shù)百次的粗略估計，并用描點或頂點固定這些微觀位置。通過建立一個密集式點云重建，設備攝像頭不僅可以識別物理空間，而且還可以記住物體轉向時的相對位置。下面是該技術實時處理信息時的演示：

基于追蹤的體驗能夠提供一個巨大的優(yōu)勢：情景。當用戶拾起一個物體時，激活的數(shù)字內(nèi)容感覺就像是物體的一部分。假如我從全麥蜂蜜堅果麥圈中激活了一個AR體驗，然后其中的卡通吉祥物從包裝盒中飛走，這將成為一種有意義的執(zhí)行。這種行為使得應用程序能夠真正成為物理世界的“瀏覽器”。用SLAM來實現(xiàn)這一點要困難得多，因為盡管電腦可以更好地理解世界的形式，但無法根據(jù)它所看到的內(nèi)容來提供實質性的反饋。

通過SLAM，用戶可以逼真地在辦公室里控制卡通水管工人（如馬里奧）收集金幣或者躲開危險的食肉植物；用實際上并不存在的家具和海報來重新裝修臥室；或者在街道上放置一系列箭頭，然后用GPS定位到最接近的咖啡店。當這兩種不同的交互方式開始無縫融合的時候，我相信我們會看到最強大和最廣泛采用的增強現(xiàn)實實現(xiàn)。這種融合技術的潛能無窮無盡。

SLAM技術的應用不僅只局限于增強現(xiàn)實。整體而言，SLAM可以幫助為計算機提供更符合字面意義的“眼睛”，使得它們能夠通過視覺輸入來理解周圍的一切。這種理解已經(jīng)擴展到機器人，自動駕駛汽車，機器學習和人工智能等領域。