Transformers_草庐IT

【论文阅读】[CVPR2022]TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers

(1)当前面临的问题是什么以及原因？虽然sensorfusion在该领域越来越受欢迎，但是对劣质图像(inferiorimage)条件鲁棒性不好，（例如照明不佳和传感器未对准），现有的融合方法很容易受到这些条件的影响，主要是由于calibrationmatrices建立的LiDARpoints和imagepixels的硬关联(hardassociation)。注：calibrationmatrices标定矩阵：用于校准相机和LiDAR硬关联(hardassociation）机制是指利用标定矩阵来建立LiDAR点和image像素的关联(2)作者提出的解决问题的方法作者提出TransFusion

【论文阅读】[CVPR2022]TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers

(1)当前面临的问题是什么以及原因？虽然sensorfusion在该领域越来越受欢迎，但是对劣质图像(inferiorimage)条件鲁棒性不好，（例如照明不佳和传感器未对准），现有的融合方法很容易受到这些条件的影响，主要是由于calibrationmatrices建立的LiDARpoints和imagepixels的硬关联(hardassociation)。注：calibrationmatrices标定矩阵：用于校准相机和LiDAR硬关联(hardassociation）机制是指利用标定矩阵来建立LiDAR点和image像素的关联(2)作者提出的解决问题的方法作者提出TransFusion

LiDAR-Camera Transformers span strong style 3d 目标检测深度学习神经网络计算机视觉

[YOLOv7/YOLOv5系列算法改进NO.17]CNN+Transformer——融合Bottleneck Transformers（更新，代码已开放分享）

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv5的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。解决问题：YOLOv5主干特征提取网络为CNN网络，CNN具有平移不变性和局部性，缺乏全局建模长距离建模的能力，引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构，充分两者的优点，提高目标检测效果，本人经过实验，对小目标以及密集预测任

YOLOv mdash amp self 61

[YOLOv7/YOLOv5系列算法改进NO.17]CNN+Transformer——融合Bottleneck Transformers（更新，代码已开放分享）

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv5的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。解决问题：YOLOv5主干特征提取网络为CNN网络，CNN具有平移不变性和局部性，缺乏全局建模长距离建模的能力，引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构，充分两者的优点，提高目标检测效果，本人经过实验，对小目标以及密集预测任

YOLOv mdash amp self 61

[深度学习论文笔记]UNETR: Transformers for 3D Medical Image Segmentation

UNETR:Transformersfor3DMedicalImageSegmentationUNETR：用于三维医学图像分割的TransformerPublished:Oct2021Publishedin:IEEEWinterConferenceonApplicationsofComputerVision(WACV)2022论文：https://arxiv.org/abs/2103.10504代码：https://monai.io/research/unetr摘要：过去十年以来，具有收缩路径和扩展路径（编码器和解码器）的全卷积神经网络（FCNNs）在各种医学图像分割应用中表现突出。在这些

Transformers Segmentation xff0c xff0 xff 深度学习 $人工智能 $医学图像分割 $多器官分割 $脑肿瘤分割

[深度学习论文笔记]UNETR: Transformers for 3D Medical Image Segmentation

UNETR:Transformersfor3DMedicalImageSegmentationUNETR：用于三维医学图像分割的TransformerPublished:Oct2021Publishedin:IEEEWinterConferenceonApplicationsofComputerVision(WACV)2022论文：https://arxiv.org/abs/2103.10504代码：https://monai.io/research/unetr摘要：过去十年以来，具有收缩路径和扩展路径（编码器和解码器）的全卷积神经网络（FCNNs）在各种医学图像分割应用中表现突出。在这些

Transformers Segmentation xff0c xff0 xff 深度学习 $人工智能 $医学图像分割 $多器官分割 $脑肿瘤分割

Huggingface之transformers零基础使用指南

pre{line-height:125%}td.linenos.normal{color:inherit;background-color:rgba(0,0,0,0);padding-left:5px;padding-right:5px}span.linenos{color:inherit;background-color:rgba(0,0,0,0);padding-left:5px;padding-right:5px}td.linenos.special{color:rgba(0,0,0,1);background-color:rgba(255,255,192,1);padding-left

零基使用指南 bp3 bp span Python

Huggingface之transformers零基础使用指南

pre{line-height:125%}td.linenos.normal{color:inherit;background-color:rgba(0,0,0,0);padding-left:5px;padding-right:5px}span.linenos{color:inherit;background-color:rgba(0,0,0,0);padding-left:5px;padding-right:5px}td.linenos.special{color:rgba(0,0,0,1);background-color:rgba(255,255,192,1);padding-left

零基使用指南 bp3 bp span Python

Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting

摘要多步（尺度）预测通常包含一个复杂的输入组合——包括静态（即时不变）协变量、已知的未来输入，以及其他仅在过去观察到的外生时间序列——没有任何关于它们如何与目标相互作用的先验信息。几种深度学习方法已经被提出，但它们通常是“黑盒”模型，并不能阐明它们如何使用实际场景中出现的全部输入。在本文中，我们介绍了时间融合变压器(TFT)——一种新的基于注意的架构，它结合了高性能的多步预测和对时间动态的可解释的洞察力。为了学习不同尺度上的时间关系，TFT使用循环层进行局部处理，并使用可解释的自我注意层进行长期依赖。TFT利用专门的组件来选择相关的特性和一系列的门控层来抑制不必要的组件，从而在广泛的场景中实现

Interpretable Multi-horizon 的 section 2522

Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting

摘要多步（尺度）预测通常包含一个复杂的输入组合——包括静态（即时不变）协变量、已知的未来输入，以及其他仅在过去观察到的外生时间序列——没有任何关于它们如何与目标相互作用的先验信息。几种深度学习方法已经被提出，但它们通常是“黑盒”模型，并不能阐明它们如何使用实际场景中出现的全部输入。在本文中，我们介绍了时间融合变压器(TFT)——一种新的基于注意的架构，它结合了高性能的多步预测和对时间动态的可解释的洞察力。为了学习不同尺度上的时间关系，TFT使用循环层进行局部处理，并使用可解释的自我注意层进行长期依赖。TFT利用专门的组件来选择相关的特性和一系列的门控层来抑制不必要的组件，从而在广泛的场景中实现

Interpretable Multi-horizon 的 section 2522