草庐IT

【YOLOv8改进】Shape-IoU:考虑边框形状与尺度的指标(论文笔记+引入代码)

介绍摘要​作为检测器定位分支的重要组成,边框回归损失在目标检测任务中发挥巨大作用。现有的边框回归方法,通常考虑了GT框与预测框之间的几何关系,通过使用边框间的相对位置与相对形状等计算损失,而忽略了边框其自身的形状与尺度等固有属性对边框回归的影响。为了弥补现有研究的不足,本文提出聚焦边框自身形状与尺度的边框回归方法。首先我们对边框回归特性进行分析,得出边框自身形状因素与尺度因素会对回归结果产生影响。接着基于以上结论我们,我们提出了Shape-IoU方法,其能够通过聚焦边框自身形状与自身尺度计算损失,从而使得边框回归更为精确。最后我们通过大量的对比实验来验证本文方法,实验结果表明本文方法能够有效提

读人工不智能:计算机如何误解世界笔记07_自动驾驶

1.      认知能力1.1.        认知能力是人工智能从一开始就面临的核心挑战1.2.        卡雷尔机器人1.2.1.          解决卡雷尔问题的关键在于提前了解障碍物的位置,并让卡雷尔绕过它们1.2.2.          人类程序员可以看到网格,即卡雷尔世界的全景地图1.2.2.1.           狭义人工智能解决方案,依赖于更好的地图绘制技术1.2.3.          使用汽车上的激光雷达、摄像头和传感器来构建它所处空间的3D模型1.2.4.          在这个3D模型里,没有汽车“识别”出来的“物体”,有的只是使用机器学习识别的可导航区域和非

EBAZ4025学习笔记02

基于vivado2023.2第1个工程用ZYNQ的PL(FPGA)设计流水灯程序员的第一个程序都是helloword,在FPGA领域,点亮一个LED灯的意义相当于helloword,你可以在过程中了解项目从创建到运行的完整流程,下面我用图文来详细介绍每一步的操作。1、具体步骤1)具体步骤新建一个VIVADO工程,打开软件选中CreateProject,如下图所示2)点击NEXT,在出现的第二个对话框“Projectname”中输入工程名;在“Projectlocation”中选择保存路径;勾选“Createprojectsubdirectory”,最后点击“Next” 备注,所有的路径均不能出

安路FPGA-TangDynasty软件学习笔记一

1.前言   之前用过很长一段时间的Quartus和Vivado,第一次用国产的安路fpga时,需要使用配套的软件TangDynasty,软件如下图。2.新建工程  打开软件,新建工程。点击project,然后点击newproject  ①工程取名:projectname ;建议取英文名称。                                        ②工程路径:projectpath  ;建议整个路径全是英文。                                  ③器件系列:devicefamily ;选择自己开发板的芯片。                  

DeepLearning深度学习(花书)读书笔记——线性代数(一)

第一部分应用数学与机器学习基础  本部分包含四个章节:线性代数、概率与信息论、数值计算和机器学习基础。在这部分介绍了深度学习所需的重要的基本数学概念。以及机器学习的基本目标,并描述了如何实现这些目标。四个章节层层递进,由浅入深逐步介绍到深度学习技术。第2章线性代数目录1、标量、向量、矩阵和张量2、矩阵和向量相乘3、单位矩阵和逆矩阵4、线性相关和生成子空间5、范数  线性代数作为数学的一个分支,主要是面向连续数学而非离散数学,被广泛应用于科学和工程中。掌握好线性代数对于从事机器学习算法(尤其是深度学习算法)相关工作而言,是非常重要的。  如果已掌握线性代数相关知识,可以跳过本章。如果未接触或已忘

AIGC学习笔记——CLIP详解加推理

clip论文地址:https://arxiv.org/pdf/2103.00020.pdfclip代码地址:https://github.com/openai/CLIP小辉问:能不能解释一下zero-shot?小G答:零次学习(Zero-ShotLearning,简称ZSL)假设斑马是未见过的类别,但根据描述外形和马相似、有类似老虎的条纹、具有熊猫相似的颜色,通过这些描述推理出斑马的具体形态,从而能对斑马进行辨认。零次学习就是希望能够模仿人类的这个推理过程,使得计算机具有识别新事物的能力。标准图像模型联合训练一个图像特征提取器和一个线性分类器来预测某些标签,而CLIP联合训练图像编码器和文本编

seo - Facebook 上发布的笔记中的链接是否传递值?

注释中发布的链接代码如下所示:justiceclaus.com因为其他任何地方的链接都像这样明确禁止关注:http://www.justiceclause.com/ 最佳答案 我相信每个链接都会提供一些值(value),即使值(value)很小。它不会传递facebook主页上的juice链接,但即使没有关注和重定向链接也意味着什么。 关于seo-Facebook上发布的笔记中的链接是否传递值?,我们在StackOverflow上找到一个类似的问题: http

git命令笔记

文章目录0、参考文档1、常用指令gitcheckout系列gitpull系列gitpush系列gitreset系列gitbranch系列gitlog系列gitrevert撤销某次提交gitdiff其他2、查看和修改用户名和邮箱,生成密钥other0、参考文档Git使用教程:最详细、最傻瓜、最浅显、真正手把手教!1、常用指令gitcheckout系列gitcheckout[–]file/目录:使用暂存区内容覆盖工作区,在工作区修改了,不想要了,可以用这个操作。如果某个目录被污染,想一次还原,可以删除那个目录下面的内容,然后:gitcheckout.gitcheckout-b分支:创建并切换到新分

Stable Diffusion学习笔记

目录1.扩散模型2.DDPM和DDIM3.LatentDiffusionModels4.StableDiffusionModels参考链接1.扩散模型扩散模型包括两个过程:前向过程和反向过程,其中前向过程即扩散过程。前向过程和反向过程都是一个参数化的马尔可夫链(Markovchain),其中反向过程可以用来生成数据。扩散过程扩散过程即对数据逐渐增加高斯噪音直至数据变成随机噪音的过程。,即每一步采用的方差,varianceschedule或noise schedule,介于0-1之间,满足。所以在一个设计好的varianceschedule下,如果T足够大,则将完全丢失原始数据从而变成一个随机噪

NGUI学习笔记(1)

三大基础组件root基本概念:分辨率(常见的1920:1080)像素(图片中的最小的色块)屏幕尺寸(屏幕对角线长度)屏幕比例(像素的密度,单位面积上有多少像素点,一般指一英寸有多少像素点)Root的适配模式灵活模式:约束模式模式一二的综合模式总结:灵活模式适用于PC端,频繁拖动窗口的项目约束模式适用于移动设备横屏勾选高fit竖屏勾选宽fit注意背景图要按照最大宽高比来做panelpanel的作用:panel面板对象管理子控件EventSystem作用:主要作用是让摄像机渲染出来的物体能够接收到NGUI的事件。大部分设置不需要我们去修改图集制作图集是用来做什么的?图集是将一些琐碎细小的UI的图片