行人檢測作為計算機視覺領域最基本的主題之一,多年來被廣泛研究。盡管最先進的行人檢測器已在無遮擋行人上取得了超過 90% 的準確率,但在嚴重遮擋行人檢測上依然無法達到滿意的效果。究其根源,主要存在以下兩個難點:
嚴重遮擋的行人框大部分為背景,檢測器難以將其與背景類別區分;
給定一個遮擋行人框,檢測器無法得到可見區域的信息;
Tube Feature Aggregation Network(TFAN)新方法,即利用時序信息來輔助當前幀的遮擋行人檢測,目前該方法已在 Caltech 和 NightOwls 兩個數據集取得了業界領先的準確率。
核心思路
利用時序信息輔助當前幀遮擋行人檢測
目前大部分行人檢測工作都集中于靜態圖像檢測,但在實際車路環境中大部分目標都處于運動狀態。針對嚴重遮擋行人的復雜場景,單幀圖像難以提供足夠有效的信息。為了優化遮擋場景下行人的識別,地平線團隊提出通過相鄰幀尋找無遮擋或少遮擋目標,對當前圖像中的遮擋行人識別進行輔助檢測。
實驗新方法
Proposal tube 解決嚴重遮擋行人檢測
如下圖,給定一個視頻序列,首先對每幀圖像提取特征并使用 RPN(Region Proposal Network)網絡生成 proposal 框。從當前幀的某個 proposal 框出發,依次在相鄰幀的空間鄰域內尋找最相似的proposal框并連接成 proposal tube。
資料獲取 | |
新聞資訊 | |
== 資訊 == | |
» 人形機器人未來3-5年能夠實現產業化的方 | |
» 導診服務機器人上崗門診大廳 助力醫院智慧 | |
» 山東省青島市政府辦公廳發布《數字青島20 | |
» 關于印發《青海省支持大數據產業發展政策措 | |
» 全屋無主燈智能化規范 | |
» 微波雷達傳感技術室內照明應用規范 | |
» 人工智能研發運營體系(ML0ps)實踐指 | |
» 四驅四轉移動機器人運動模型及應用分析 | |
» 國內細分賽道企業在 AIGC 各應用場景 | |
» 國內科技大廠布局生成式 AI,未來有望借 | |
» AIGC領域相關初創公司及業務場景梳理 | |
» ChatGPT 以 GPT+RLHF 模 | |
» AIGC提升文字 圖片滲透率,視頻 直播 | |
» AI商業化空間前景廣闊應用場景豐富 | |
» AI 內容創作成本大幅降低且耗時更短 優 | |
== 機器人推薦 == | |
服務機器人(迎賓、講解、導診...) |
|
智能消毒機器人 |
|
機器人底盤 |