
目前,自動(dòng)駕駛領(lǐng)域已經(jīng)出現(xiàn)很多數(shù)據(jù)集,例如 KITTI、Oxford、Cityscape、nuScenes、BDD100K 等。
但在自動(dòng)駕駛創(chuàng)業(yè)公司代表 Waymo 看來(lái),到了 2019 年,KITTI 這樣的數(shù)據(jù)集已經(jīng)太小了,在使用過(guò)程中需要大量的時(shí)間做數(shù)據(jù)增強(qiáng)、防止過(guò)擬合,算法結(jié)果也不能很好地泛化到更大數(shù)據(jù)集上。
因此,在 CVPR 2019 現(xiàn)場(chǎng),Waymo 首席科學(xué)家 Drago Anguelov 發(fā)布了包含完整傳感器信息的全新標(biāo)注數(shù)據(jù)集 Waymo Open Dataset,它與 KITTI、NuScenes 等數(shù)據(jù)集的對(duì)比數(shù)據(jù)如下,在傳感器配置、數(shù)據(jù)集大小上都有很大的提升。
Waymo 數(shù)據(jù)集的傳感器包含 5 個(gè)激光雷達(dá)、5 個(gè)攝像頭,激光雷達(dá)和攝像頭的同步效果也更好。
更重要的是,Waymo 數(shù)據(jù)集包含 3000 段駕駛記錄,時(shí)長(zhǎng)共 16.7 小時(shí),平均每段長(zhǎng)度約為 20 秒。整個(gè)數(shù)據(jù)集一共包含 60 萬(wàn)幀,共有大約 2500 萬(wàn) 3D 邊界框、2200 萬(wàn) 2D 邊界框。
此外,在數(shù)據(jù)集多樣性上,Waymo Open Dataset 也有很大的提升,該數(shù)據(jù)集涵蓋不同的天氣條件,白天、夜晚不同的時(shí)間段,市中心、郊區(qū)不同地點(diǎn),行人、自行車等不同道路對(duì)象,等等。
Drago Anguelov 介紹說(shuō),Waymo 將在 7 月份發(fā)布 1K 數(shù)據(jù)集,且將在近期公布數(shù)據(jù)集基準(zhǔn)并組織競(jìng)賽。
除了發(fā)布數(shù)據(jù)集,此次演講也透露了 Waymo 的傳感器配置,如下圖所示,包括視覺(jué)系統(tǒng)、激光雷達(dá)系統(tǒng)和雷達(dá)系統(tǒng)。
目前,Waymo Open Dataset 尚未公開(kāi),但官網(wǎng)已經(jīng)開(kāi)始注冊(cè),感興趣的讀者可從以下鏈接注冊(cè)郵箱。只要數(shù)據(jù)開(kāi)放,注冊(cè)用戶就能收到通知。