草庐IT

论文选题

全部标签

FastSpeech2——TTS论文阅读

笔记地址:https://flowus.cn/share/1683b50b-1469-4d57-bef0-7631d39ac8f0【FlowUs息流】FastSpeech2论文地址:lFastSpeech2:FastandHigh-QualityEnd-to-EndTexttoSpeechhttps://arxiv.org/abs/2006.04558Abstract:tacotron→fastspeech,引入knowledgedistillation,缓解TTS中one-to-manyproblem。问题:teacher-studentdistillationpipeline1)复杂速度慢

【YOLO系列】YOLOv4论文超详细解读1(翻译 +学习笔记)

前言    经过上一期的开篇介绍,我们知道YOLO之父Redmon在twitter正式宣布退出cv界,大家都以为YOLO系列就此终结的时候,天空一声巨响,YOLOv4闪亮登场!v4作者是AlexeyAB大神,虽然换人了,但论文中给出的测试结果依然保留YOLO系列的血统:保持相对较高的mAP的同时,大大降低计算量,可谓是学术成果在工业应用的典范,至于实际使用如何,还需要时间的进一步检验。    YOLOv4的论文是我读文献以来最不“爽”的一篇,YOLOv4像一个“缝合怪”,几乎没有提出什么创新性的东西,其实是一个结合了大量前人研究技术,加以组合并进行适当创新的算法,实现了速度和精度的完美平衡。里

【YOLOv8改进-论文笔记】 AKConv(可改变核卷积):任意数量的参数和任意采样形状的即插即用的卷积

文章目录AKConv介绍摘要AKConv的创新特点:文章链接主要思想任意形状任意参数数量核心代码注释版本在YoloV8中使用AKconv下载YoloV8代码直接下载GitClone安装环境新建ultralytics/nn/Conv/AKConv.py

RSIS 系列 Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation 论文阅读

RSIS系列RotatedMulti-ScaleInteractionNetworkforReferringRemoteSensingImageSegmentation论文阅读笔记一、Abstract二、引言三、相关工作ReferringImageDetectionandSegmentationRemoteSensingReferringImageDetectionandSegmentation四、RRSIS-D五、RMSIN5.1总览5.2CompoundedScaleInteractionEncoder(CSIE)5.2.1尺度内交互模块各种感知分支跨模态对齐分支5.2.2跨尺度交互模块多

【图像拼接】论文精读:Content-Preserving Warps for 3D Video Stabilization(CPW)

第一次来请先看这篇文章:【图像拼接(ImageStitching)】关于【图像拼接论文精读】专栏的相关说明,包含专栏使用说明、创新思路分享等(不定期更新)图像拼接系列相关论文精读SeamCarvingforContent-AwareImageResizingAs-Rigid-As-PossibleShapeManipulationAdaptiveAs-Natural-As-PossibleImageStitchingShape-PreservingHalf-ProjectiveWarpsforImageStitchingSeam-DrivenImageStitchingParallax-tol

EfficientViT: Memory Efficient Vision Transformer withCascaded Group Attention论文阅读

高效的记忆视觉transformer与级联的群体注意摘要。视觉transformer由于其高模型能力而取得了巨大的成功。然而,它们卓越的性能伴随着沉重的计算成本,这使得它们不适合实时应用。在这篇论文中,我们提出了一个高速视觉transformer家族,名为EfficientViT。我们发现现有的transformer模型的速度通常受到内存低效操作的限制,特别是在MHSA中的张量重塑和单元函数。因此,我们设计了一种具有三明治布局的新构建块,即在高效FFN层之间使用单个内存绑定的MHSA,从而提高了内存效率,同时增强了信道通信。此外,我们发现注意图在头部之间具有很高的相似性,从而导致计算冗余。为了

数据科学与大数据专业毕业设计(论文)选题指导 2024

前言    大四是整个大学期间最忙碌的时光,一边要忙着准备考研,考公,考教资或者实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。大四的同学马上要开始毕业设计,对选题有疑问可以问学长哦!以下整理了适合不同方向的计算机专业的毕业设计选题    🚀对毕设有任何疑问都可以问学长哦!    更多选题指导:    最新最全计算机专业毕设选题精选推荐汇总     大家好,这里是毕设选题专场,本次分享的是    🎯 数据科学与大数据专业毕业设计(论文)选题指导2024选题背景意义    随着计算机科学与技术领域的迅速发展,计算机方向的毕业设计已经成为培养学生综合能力和创新思维的重要环节。计算机

《Aspect-Sentiment-Multiple-Opinion Triplet Extraction》论文阅读

文章目录文章介绍文章模型encoder部分ATE任务TOWE任务ATSA任务番外文章地址:https://arxiv.org/abs/2110.07303v1文章介绍  目前的关于ASTE三元组提取的方面级情感分析论文大多关注于简单的句式,比如一个方面实体仅有一个意见词加以修饰,但在一些情况下,由于我们通常会对事物的不同的属性做出不同的评价,因此对于某一个事物的最终情感将取决于这些不同意见词的总和。为了应对上述问题,这篇论文在ASTE方面级情感三元组提取任务的基础上提出了方面级情感多意见修饰三元组提取任务(aspectSentimentMultipleOpinionsTripletExtrac

论文阅读<Contrastive Learning-based Robust Object Detection under Smoky Conditions>

论文链接:https://openaccess.thecvf.com/content/CVPR2022W/UG2/papers/Wu_Contrastive_Learning-Based_Robust_Object_Detection_Under_Smoky_Conditions_CVPRW_2022_paper.pdfAbstract        目标检测是指有效地找出图像中感兴趣的目标,然后准确地确定它们的类别和位置。近年来,许多优秀的方法被开发出来,以提供强大的检测能力。然而,在恶劣天气如烟熏条件下,它们的性能可能会显著降低。在这篇论文基于对比下学习提出了一个鲁棒的烟雾图像目标检测算法

Group DETR论文阅读笔记

先大概分析了现阶段加速DETR训练的两条线:1)改进cross-attention部分,关注更有效的feature2)稳定二分图匹配这篇论文用到的方法是从第二条线出发,稳定二分图匹配,但是并不像DN那样去噪训练稳定匹配,而是通过引入更多的监督。一、motivation:1)稳定二分图匹配2)传统目标检测中一对多分配的性能好二、innovation通过将一对多分配解耦为多组一对一分分配来引入更多的监督。三、方法先说一下上图abc:【c】:直接进行原始一对多分配,这里把decoder画一整个就是指decoder里面的self-attention和cross-attention和FNN都是所有que