澎思科技刷新視頻行人再識(shí)別三大數(shù)據(jù)集歷史最好成績(jī)
繼在三大主流單幀圖片行人再識(shí)別數(shù)據(jù)集(Market1501,DukeMTMC-reID,CUHK03)刷新世界紀(jì)錄后,近日,澎思科技(Pensees)在基于視頻的行人再識(shí)別數(shù)據(jù)集(PRID-2011,iLIDS-VID,MA RS)中再次取得突破性進(jìn)展,一舉實(shí)現(xiàn)在三大數(shù)據(jù)集上實(shí)現(xiàn)算法關(guān)鍵指標(biāo)首位命中率(Rank-1 Accuracy)大幅度提升,準(zhǔn)確率均創(chuàng)歷史新高。
PRID-2011、iLIDS-VID和MARS均為基于視頻的行人再識(shí)別數(shù)據(jù)集。PRID-2011數(shù)據(jù)集中的視頻對(duì)通過(guò)兩個(gè)固定的監(jiān)控?cái)z像頭進(jìn)行采集,攝像頭A包含385個(gè)行人,攝像頭B包含749個(gè)行人。
這些行人中,只有200個(gè)行人同時(shí)出現(xiàn)在兩個(gè)攝像頭中。
iLIDS-VID是在PRID-2011之后公布的數(shù)據(jù)集,與PRID-2011相比,數(shù)據(jù)更加整齊,也更有挑戰(zhàn)性。iLIDS-VID數(shù)據(jù)集是通過(guò)機(jī)場(chǎng)到達(dá)大廳的CCTV監(jiān)控視頻采集得到的,包含300個(gè)行人在兩個(gè)攝像頭下的600段視頻。視頻中存在嚴(yán)重的著裝相似,光照和視角變化,復(fù)雜背景和遮擋現(xiàn)象,因此識(shí)別難度大。
MARS數(shù)據(jù)集是目前基于視頻ReID最大的數(shù)據(jù)集,是單幀圖片行人再識(shí)別數(shù)據(jù)集Market1501的擴(kuò)充版,圖像數(shù)量由32,668幅擴(kuò)展到了1,191,003幅。 與單幀圖片的行人再識(shí)別數(shù)據(jù)集一樣,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量視頻行人再識(shí)別ReID算法水平的核心指標(biāo)。
澎思科技此次一舉實(shí)現(xiàn)在三大數(shù)據(jù)庫(kù)上,僅利用原始數(shù)據(jù)就實(shí)現(xiàn)Rank-1 Accuracy關(guān)鍵指標(biāo)大幅度提升。目前,澎思科技算法在最大的視頻數(shù)據(jù)集MARS上的首位命中率指標(biāo)已經(jīng)達(dá)到88.8%,領(lǐng)先香港中文大學(xué)、中科大、北京大學(xué)等國(guó)內(nèi)外知名機(jī)構(gòu)。
在iLIDS-VID和PRID-2011等數(shù)據(jù)集上首位命中率也分別達(dá)到了88.0%和95.5%。
澎思科技行人再識(shí)別ReID算法在MARS數(shù)據(jù)集的部分測(cè)試結(jié)果