近日,海康威視參與PASCAL VOC視覺識別競賽,其中目標檢測任務成績mAP性能達到87.9,刷新了世界記錄,排名第一名,領先第二名4.1個點。評測中,海康威視20類目標中的19類結果在所有的算法中均處于領先地位。
(數(shù)據(jù)來源:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4)
PASCAL VOC目標檢測任務囊括了車、人、貓、狗等20類常見目標。訓練樣本較少、場景變化多端,非常具有挑戰(zhàn)性。提到奪冠之道,海康威視研究院常務副院長浦世亮表示:“我們的預研團隊基于Faster R-CNN深度學習目標檢測算法,通過調整網(wǎng)絡結構、上下文建模、優(yōu)化訓練和預測等策略,大幅提升了檢測性能。研究成果可以應用到視頻監(jiān)控的車輛檢測、車牌識別、人體檢測、人體屬性分析、視頻結構化等產品中,將大幅提升產品性能與應用效果。長遠來看,在智能安全監(jiān)控、汽車輔助駕駛、智能交通感知、視頻語義理解、機器人和無人機等各方面都有著巨大的應用價值。”
PASCAL VOC可謂視覺識別類競賽的鼻祖,是由利茲大學、蘇黎世聯(lián)邦理工學院、愛丁堡大學、微軟、牛津大學等組織的一個視覺識別競賽,包含了物體分類、目標檢測、圖像分割等任務。PASCAL VOC對計算機視覺的發(fā)展具有深遠而巨大的影響,后續(xù)的ImageNet競賽的任務設置就基本沿用了它的設定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發(fā)團隊先后在這個排行榜上刷新紀錄。
海康威視研究院由智能分析、大數(shù)據(jù)技術、感知技術和多媒體技術等專業(yè)團隊組成,突出在音視頻技術的專注和積累,著重研究視音頻的智能算法、大數(shù)據(jù)的分析、挖掘和計算,同時針對新的圖像傳感器等感知技術,視頻的播放技術,人機交互等多媒體技術進行深入研究。目前在海康威視研究院眾多領域的研究都走在行業(yè)前列,2015年,海康威視研究院在KITTI的評測中,車輛檢測和車頭朝向估計兩項任務評分均排名世界第一;在MOT Challenge算法測評中獲得“計算機視覺的多目標跟蹤算法”世界第一;名列TRECVID2016 SED第二名、PASCAL VOC 2012圖像分割任務第二名。