當(dāng)前位置:首頁 > 公眾號精選 > 雷達(dá)通信電子戰(zhàn)
[導(dǎo)讀]公開的數(shù)據(jù)集具有重要意義,尤其是對于那些經(jīng)歷過傳統(tǒng)方法的科研人員而言(傳統(tǒng)方法沒有統(tǒng)一的數(shù)據(jù)和評價標(biāo)準(zhǔn),算法之間可比性較差)。公開的數(shù)據(jù)集可促進(jìn)這一領(lǐng)域的健康快速發(fā)展,健康是指研究人員采用統(tǒng)一的訓(xùn)練集和測試集,采用同一個評價指標(biāo),增加可比性和可信性;快速是指專注于算法,不需要重復(fù)...

公開的數(shù)據(jù)集具有重要意義,尤其是對于那些經(jīng)歷過傳統(tǒng)方法的科研人員而言(傳統(tǒng)方法沒有統(tǒng)一的數(shù)據(jù)和評價標(biāo)準(zhǔn),算法之間可比性較差)。公開的數(shù)據(jù)集可促進(jìn)這一領(lǐng)域的健康快速發(fā)展,健康是指研究人員采用統(tǒng)一的訓(xùn)練集和測試集,采用同一個評價指標(biāo),增加可比性和可信性;快速是指專注于算法,不需要重復(fù)性做數(shù)據(jù)收集工作。SSDD近幾年的發(fā)展驗證了上述觀點。
SSDD使用情況



2017年12月1日,在中國北京召開的BIGSARDATA會議上公開了一個用于SAR圖像船舶目標(biāo)檢測的數(shù)據(jù)集SSDD,SSDD是該領(lǐng)域中第一個公開的數(shù)據(jù)集。這篇論文僅發(fā)布了SSDD的初始粗略版本,但這個第一個公開的數(shù)據(jù)集得到了相當(dāng)多學(xué)者的前所未有的關(guān)注,這也超出了作者的想象。

截止到2021年8月25日,在161個基于深度學(xué)習(xí)的SAR船舶檢測的論文中,使用SSDD作為訓(xùn)練測試數(shù)據(jù)的有75篇,占46.6%,這顯示了SSDD在SAR遙感社區(qū)的普及和巨大影響。其它論文采用的數(shù)據(jù)集是近些年提出的另外五個公開數(shù)據(jù)集,即Wang等人在2019年發(fā)布的SAR-Ship數(shù)據(jù)集,Sun等人在2019年發(fā)布的AIR-SARShip-1.0,Wei等人在2020年發(fā)布的HRSID,Zhang等人在2020年發(fā)布的LS-SSDD-v1.0,和AIR-SARShip-2.0。
這75篇論文中,只有一份來自國外(印度),其它所有論文作者均為中國學(xué)者,這說明中國已成為研究中最活躍的國家或地區(qū)。SSDD數(shù)據(jù)集常出現(xiàn)在各種主流遙感期刊中,例如MDPI的Remote Sensing,IEEE的 JSTARS、TGRS和GRSL等,這表明SSSD被遙感界的學(xué)術(shù)界廣泛接受。
這75篇論文中,有62篇論文使用垂直邊框,有9個使用旋轉(zhuǎn)邊框,有4篇論文使用像素級多邊形分割。SSDD的初始版本僅提供垂直邊框的標(biāo)注,這使得使用垂直邊框的數(shù)量占大多數(shù)(82.7%)。
SSDD得到廣泛使用的原因



SSDD取得以上成功的原因主要有以下七點:
1.SSDD的公開時間最早,它比第二個公開的數(shù)據(jù)集要早1.5年,當(dāng)沒有其他數(shù)據(jù)集可用時,SSDD成為唯一的選擇。
2.用于SAR船舶檢測的幾種常用衛(wèi)星都是商業(yè)衛(wèi)星,數(shù)據(jù)獲取渠道有限,SSDD的出現(xiàn)可以解決此困境。
3.SSDD的作者活躍在SAR遙感社區(qū),在公共媒體平臺發(fā)布的文章促進(jìn)了這個數(shù)據(jù)集的傳播。
4.SSDD中的SAR圖像樣本具有不同分辨率,不同傳感器,不同的極化,不同的海況,不同的船舶場景,包括近海和近海,以及不同的船舶尺寸。數(shù)據(jù)多樣性是建立可靠的檢測模型的基礎(chǔ)。
5.當(dāng)出現(xiàn)一些使用SSDD的論文時,后續(xù)學(xué)者一般會選擇對這個SSDD數(shù)據(jù)集進(jìn)行實驗,以便于將所提方法與以前的方法進(jìn)行比較,因此,使用此SSDD數(shù)據(jù)集的公共論文逐漸增加。這也是為什么其它數(shù)據(jù)集雖然比SSDD更大更好,但卻沒有SSDD應(yīng)用廣泛的原因。
6.早期SAR遙感界大多數(shù)學(xué)者計算機(jī)的GPU計算能力有限,與計算機(jī)視覺領(lǐng)域中的大規(guī)模數(shù)據(jù)集相比,SSDD的樣本數(shù)量相對適中(有1160個樣本,而PASCAL VOC有 9000個,COCO有20w個樣本),這使得配備普通GPU的研究人員能夠進(jìn)行研究和開發(fā),這使使用SSDD數(shù)據(jù)集進(jìn)行研究變得相當(dāng)活躍。此外,相對適中的樣本數(shù)量也有助于調(diào)試模型,提高工作效率,而不是長時間的訓(xùn)練等待。當(dāng)然,在使用SSDD數(shù)據(jù)集時,應(yīng)考慮一些策略,例如數(shù)據(jù)增強(qiáng)和遷移學(xué)習(xí),以避免過擬合。
7.SSDD中有典型的難檢測樣本,這些樣本在SAR船舶檢測的實際應(yīng)用中都需要特別考慮,例如:特征不明顯的小型船舶、港口內(nèi)密集平行停泊的船舶、大型船舶、嚴(yán)重斑點噪聲下的船舶測和復(fù)雜背景的船舶測。無論是傳統(tǒng)的方法還是基于深度學(xué)習(xí)的方法,這些困難樣本的檢測都是一個研究熱點,而SSDD可提供數(shù)據(jù)來源以研究這些問題。
SSDD數(shù)據(jù)集存在的問題以及解決辦法



盡管SSDD取得了較大的成功,但SSDD初始版本的粗略標(biāo)注和模糊標(biāo)準(zhǔn)阻礙了算法的公平比較和學(xué)術(shù)交流。
首先,初始版本中存在一些粗略的標(biāo)注,例如,有些船標(biāo)注錯誤,有些船未進(jìn)行標(biāo)注,有些船的邊框標(biāo)注的不緊湊。因此,SSDD的初始版本是“臟的”。臟數(shù)據(jù)在計算機(jī)視覺領(lǐng)域廣泛存在,對于龐大的數(shù)據(jù)集,深度網(wǎng)絡(luò)可以通過批量訓(xùn)練減少臟數(shù)據(jù)的負(fù)面影響,從而提高模型的泛化能力。然而,對于少量的SAR圖像出現(xiàn)的臟數(shù)據(jù),深度網(wǎng)絡(luò)中可能會出現(xiàn)訓(xùn)練振蕩,這將降低檢測性能,因此,有必要糾正它們。其次,在SSDD原始論文中存在使用標(biāo)準(zhǔn)模棱兩可甚至不合理的問題。
例如,訓(xùn)練測試劃分是隨機(jī)的,但由于樣本太少,不同的測試集會導(dǎo)致結(jié)果差異很大,這將導(dǎo)致與不同學(xué)者的不公平的方法比較。此外,原論文中沒有提供劃分近岸和遠(yuǎn)海目標(biāo)的標(biāo)準(zhǔn),導(dǎo)致后來的學(xué)者對近岸和遠(yuǎn)海船舶的檢測精度進(jìn)行不公平的比較。

更重要的是,目前該數(shù)據(jù)集仍缺乏全面的數(shù)據(jù)統(tǒng)計分析,這不利于其他學(xué)者的進(jìn)一步研究。因此,為了公平的算法比較和有效的學(xué)術(shù)交流,這里明確制定了一些嚴(yán)格的使用標(biāo)準(zhǔn),包括訓(xùn)練測試的劃分,近岸和遠(yuǎn)海目標(biāo)的定義,船舶尺寸的定義,確定密集分布的小型船舶樣本,確定在港口密集平行停泊的樣本。
SSDD初始版本是垂直矩形邊界框(BBox)的標(biāo)簽,但垂直邊框不夠緊湊,其中存在大量背景雜亂,減少了船舶特征學(xué)習(xí),導(dǎo)致船舶特征提取不足,它也不適用于長寬比大且方向任意的船舶,當(dāng)港口船舶排列過于密集時,BBox無法有效區(qū)分,從而導(dǎo)致檢測缺失。
因此BBox不再能夠滿足可旋轉(zhuǎn)邊界框(RBox)任務(wù)和像素級多邊形分割(PSeg)任務(wù)的研究需求。RBox可以更好地描述目標(biāo)的真實形狀,同時在船舶檢測中提供更好的準(zhǔn)確性。像素級多邊形分割(PSeg)可完全抑制背景雜亂,是進(jìn)行SAR船舶檢測是最理想的標(biāo)注。

因此這里發(fā)布的最新版本的SSDD涵蓋三種標(biāo)注類型:邊界框SSDD(BBox-SSDD),可旋轉(zhuǎn)邊界框SSDD(RBox-SSDD)和多邊形分割SSDD(PSeg-SSDD)。需要對BBox-SSDD,RBox-SSDD和PSeg-SSDD進(jìn)行全面的數(shù)據(jù)統(tǒng)計,分析結(jié)果將為未來可能的學(xué)者提供一些有價值的建議,以便在使用SSDD時進(jìn)一步精心設(shè)計更高精度和更強(qiáng)魯棒性的基于深度學(xué)習(xí)的SAR船舶檢測算法。
以上內(nèi)容來自論文:SAR Ship Detection Dataset (SSDD)-Of?cial Release and Comprehensive Data Analysis

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉