改進注意力機制

我要報錯
  • 基于深度學習的移動端水果識別

    超市水果識別主要依賴人工,計算機視覺成為一種解決方案。然而目前仍面臨部分水果識別精度低、終端設備部署困難、誤識別圖片難處理等挑戰(zhàn)。因此,文章基于深度學習對移動端水果識別進行研究,旨在替代人工識別。首先文章構建了包含49種水果的超市水果圖像數(shù)據(jù)集DailyFruit-49。并針對細分類特征相似度高、包裝遮擋、形狀小量少的水果識別困難,以及低算力設備模型部署問題,篩選了滿足部署要求的骨干模型。設計了新的注意力模塊RMA,改進了ViT Block以增強模型的細節(jié)識別能力和深層語義特征整合能力,最終得到DenseRMA_ViT模型,并基于Focal Loss改進損失函數(shù)。并在公開數(shù)據(jù)集Fruits-262上進行消融實驗驗證模型改進的有效性。最后結合實際設備,實現(xiàn)水果識別系統(tǒng),滿足實際使用?;谂c用戶的交互行為對誤識別水果圖像進行收集,并基于誤識別圖像實現(xiàn)模型權重自動微調,隨使用時間延長,系統(tǒng)收集更多圖片,提升模型識別精度與泛化能力,以處理實際應用中誤識別水果。