草庐IT

PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

PETRv2:AUnifiedFrameworkfor3DPerceptionfromMulti-CameraImages作者单位旷视目的本文的目标是通过扩展PETR,使其有时序建模和多任务学习的能力以此建立一个强有力且统一的框架。本文主要贡献:将位置embedding转换到时序表示学习,时序的对齐是在3DPE上做姿态变换实现的。提出了feature-guided位置编码,可以通过2D图像特征reweigth3DPE提出了一个简单但有效的方法(引入了基于特定任务的queries),让PETR支持多任务学习,包括BEV分割和3Dlane检测本文提出的框架想,在3D目标检测,BEV分割和3Dlan

Nuscenes最新SOTA | DynamicBEV超越PETRv2/BEVDepth!

1.论文信息2.引言这篇论文介绍了一种新的3Dobjectdetection方法,这对于自动驾驶、机器人技术和监控等应用至关重要。传统的3Dobjectdetection方法使用鸟瞰视角(BEV)方法,将3D场景简化为2D表示。然而,常规的BEV方法在本质上大多是静态的。本文提出了一种名为DynamicBEV的动态方法。传统BEV方法的局限性静态Queries:传统方法主要使用静态Queries,其中Queries权重在训练阶段预定义,并且在推理期间不会更改。有限的背景利用:由于Queries的静态性质,这些模型难以有效地利用空间和时间背景,并适应复杂场景。DynamicBEV的进步动态Que