春運奇葩的驗證碼讓許多人頭疼不已,小編將小截圖在百度中識圖幾乎全部識別不了,然而谷歌大部分都能識別,技術差距啊
在第六屆ImageNet圖像識別大賽中,微軟研究院在多個類別的評比中都取得了優(yōu)勝。微軟的技術勝過了谷歌、英特爾、高通和騰訊,以及多家創(chuàng)業(yè)公司和學術機構的系統(tǒng)。微軟此前通過幾款有趣的產品演示了這一技術,例如根據照片猜年齡的應用。此外,通過微軟研究院的Project Oxford項目,微軟正在推動圖像識別技術的商用。
ImageNet圖像識別大賽中的iPod圖片
微軟多名研究員,包括何開明(Kaiming He,音)、張翔宇(Xiangyu Zhang,音)、任少慶(Shaoqing Ren,音),以及孫健(Jian Sun,音),開發(fā)了這一獲勝的系統(tǒng)。這一系統(tǒng)名為“面向圖像識別的深度駐留學習技術”。微軟在官方博客中表示,即將在一篇學術論文中公布系統(tǒng)的細節(jié)。
微軟這一系統(tǒng)具有很高的復雜度。該團隊表示:“我們的神經網絡深達150層。我們提出了‘深度駐留學習’架構,使深度網絡的優(yōu)化和匯聚變得更簡單。我們的‘深度駐留網絡’比以往系統(tǒng)有著更多的層數,從而提高了準確率。許多普通網絡在增加層數時也能看到類似的準確率提高。”
科技公司目前紛紛加強這一領域的研究。這些公司正在優(yōu)化內部系統(tǒng),以及面向用戶的產品。作為高性能網絡的核心,深度學習技術會利用大量數據,例如圖片,去訓練人工神經網絡,使神經網絡在面對新數據時能做出正確的反應。
微軟此前通過幾款有趣的產品演示了這一技術,例如根據照片猜年齡的應用。此外,通過微軟研究院的Project Oxford項目,微軟正在推動圖像識別技術的商用。
在ImageNet挑戰(zhàn)中,參賽系統(tǒng)需要準確定位來自Flickr和搜索引擎10萬張照片中的對象,并將其分類為1000個類型。微軟系統(tǒng)在分類中的錯誤率為3.5%,而定位的錯誤率為9%。
在前幾年的挑戰(zhàn)中,在分類錯誤率方面,谷歌、創(chuàng)業(yè)公司Clarifai和NEC處于領先。
在今年的挑戰(zhàn)中,微軟的系統(tǒng)在對象探測方面也取得了領先。孫健表示:“我們自己也不相信,這一理念會如此重要。”
百度沒有出現(xiàn)在今年的排名中。百度的提交次數超過了允許的上限,該公司隨后對此表示道歉,并解雇了要求初級工程師這樣做的團隊負責人。
在這項挑戰(zhàn)中,IBM通過SoftLayer公有云服務提供了來自英偉達的GPU(圖形處理單元),供參賽團隊使用。