草庐IT

[论文阅读]VirConv(KITTI SOTA 2023.10.17)——用于多模态 3D 目标检测的虚拟稀疏卷积

VirConvVirtualSparseConvolutionforMultimodal3DObjectDetection用于多模态3D目标检测的虚拟稀疏卷积论文网址:VirConv论文代码:VirConv简读论文这篇论文提出了一个称为VirConv的操作符,用于基于虚拟点的多模态3D对象检测。主要的贡献和创新点包括:提出了StochasticVoxelDiscard(StVD)机制,用于加速网络并提高密度鲁棒性。StVD通过丢弃大量冗余的附近体素来减轻计算量,同时保留远处的体素。这可以大大加速检测速度。提出了Noise-ResistantSubmanifoldConvolution(NRCo

KITTI数据集介绍

本文为个人学习笔记,参考文献已经标注出。kitti数据集主要分为以下几个文件夹。下面分别介绍。一、标定校准文件calib训练集存储为data_object_calib/training/calib/xxxxxx.txt,共7481个文件。 calib测试集存储为data_object_calib/testing/calib/xxxxxx.txt,共7518个文件。标定校准文件内容解析1234左边灰度相机右边灰度相机左边彩色相机右边彩色相机1.1内参矩阵P0-P3分别表示4个相机的内参矩阵,或投影矩阵,大小为3x4。相机内参矩阵是为了计算点云空间位置坐标在相机坐标系下的坐标,即把点云坐标投影到相

Paper Reading- Center-based 3D Object Detection and Tracking (Based: KITTI)

Background随着2D目标检测的逐渐成熟,3D目标检测在近几年的研究领域受到了广泛的关注。但是3D目标的特性2D不同,面临着很多的挑战。点云的稀疏性;2D图像当前分辨率较高,但是点云相对于2D图像显得很稀疏,而且他举越远,点云越稀疏;点云目标大小不一致;3D目标有很多种类,没有固定的大小。导致很容易发生误检。它不同于2D有色彩信息,只可以通过空间关系判断当前目标属性;3D的bounding-box不好和全局的数据对齐;因为3D的bounding-box不同于传统2D,而且在一般的3D点云检测网络中会存在2D和3D特征提取网络,所以3D的bounding-box很难和全局数据做到对齐;3D

3D目标检测数据集 KITTI(标签格式解析、3D框可视化、点云转图像、BEV鸟瞰图)

本文介绍在3D目标检测中,理解和使用KITTI数据集,包括KITTI的基本情况、下载数据集、标签格式解析、3D框可视化、点云转图像、画BEV鸟瞰图等,并配有实现代码。目录 1、KITTI数据集3D框可视化2、KITTI3D数据集3、下载数据集4、标签格式5、标定参数解析6、点云数据-->投影到图像7、图像数据-->投影到点云8、可视化图像2D结果、3D结果9、点云3D结果-->图像BEV鸟瞰图结果(坐标系转换)10、绘制BEV鸟瞰图11、BEV鸟瞰图画2d框12、完整工程代码 1、KITTI数据集3D框可视化2、KITTI3D数据集kitti3D数据集的基本情况:KITTI整个数据集是在德国卡

KITTI数据集raw_data下载(用chrome浏览器)

目录一、KITTI数据集官方raw_data下载二、ubuntu下利用chrome下载的脚本三、Windows下的用chrome浏览器下载四、解压脚本一、KITTI数据集官方raw_data下载KITTI是广泛用于自动驾驶领域评估的数据集之一,但是该数据集的数据很难下载。官方提供的下载方式是下载下图中的scripts,然后运行文件夹中的脚本,但是国内连接不上。科学上网只能在chrome浏览器上(网上教程很多哈),一个一个的去官网地址下载实在太麻烦了,因此写了一个脚本利用chrome浏览器下载raw_data。数据集地址:https://www.cvlibs.net/datasets/kitti

【MMDetection3D】环境搭建,使用PointPillers训练&测试&可视化KITTI数据集

文章目录前言3D目标检测概述KITTI数据集简介MMDetection3D环境搭建数据集准备训练测试及可视化绘制损失函数曲线参考资料前言2D卷不动了,来卷3D,之后更多地工作会放到3D检测上本文将简单介绍什么是3D目标检测、KITTI数据集以及MMDetection3D算法库,重点介绍如何在MMDetection3D中,使用PointPillars算法训练KITTI数据集,并对结果进行测试和可视化。 3D目标检测概述对于一张输入图像,2D目标检测旨在给出物体类别并标出物体位置,而3D目标检测则要给出物体的位置(x,y,z)、尺寸(x_size,y_size,z_size)以及大致方向(框的朝向

A-loam运行kitti及轨迹保存

目录运行kitti数据集方法一、使用rosbag播放方法二、使用kitti_helper.launch故障:rviz界面没有图像查看rosbag发布的topica-loam代码中所接收的topicrqt启动rqt查看rqt界面保存轨迹方法一、简单的 方法二、使用ros::Subscriber和回调函数方法三、创建新节点用于保存轨迹小结总结使用A-loam运行kitti数据集。运行kitti数据集方法一、使用rosbag播放使用代码:  roslaunchaloam_velodynexxx.launch   rosbagplay/.../xxx.bag其中,运行kitti数据集时,xxx.lau

KITTI 数据集简介

数据集简介KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上自动驾驶场景下常用的数据集之一。KITTI数据集的数据采集平台装配有2个灰度摄像机,2个彩色摄像机,一个Velodyne64线3D激光雷达,4个光学镜头,以及1个GPS导航系统。官网国内下载地址1国内下载地址2为了生成双目立体图像,相同类型的摄像头相距54cm安装。由于彩色摄像机的分辨率和对比度不够好,所以还使用了两个立体灰度摄像机,它和彩色摄像机相距6cm安装。为了方便传感器数据标定,规定坐标系方向如下[2]:•Camera:x=right,y=down,z=forward•Velodyne:x=fo

KITTI数据集解析和可视化

文章目录一、KITTI数据集简介1.1介绍1.2下载二、数据解析2.0数据集结构2.1ImageSets2.2Testing&Training2.2.1calib2.2.2image_22.2.3label_22.2.4planes2.2.5velodyne三、数据集的下载和组织四、可视化4.1CloudCompare软件4.2PCL库参考一、KITTI数据集简介1.1介绍文章链接《ArewereadyforAutonomousDriving?TheKITTIVisionBenchmarkSuite(2012)》概述KITTI数据集是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该

ORB_SLAM2运行KITTI数据集

        在前文我们已经安装运行了ORB_SLAM2,下载和编译(包括报错)在文章:ORB_SLAM2下载编译及运行EuRoC数据集_浅梦语11的博客-CSDN博客_euroc数据集下载    并且我们使用运行了EuRoC数据集。今天利用框架运行KITTI数据集。    注意:如果没有运行成功EuRoC数据集,可能本教程并不适合,因为运行成功EuRoC数据集时,ORB_SLAM2已经成功编译了,在ros空间创建好后,直接将编译过的文件夹整个复制进去,之后再catkin_make等,然后运行数据集。    但是如果是从头开始,没有编译过ORBSLAM2而是刚刚下载,可以考虑这个教程试试:O