草庐IT

cached_network_image

全部标签

特征金字塔(Feature Pyramid Networks )

前言:现在的很多网络都使用了利用单个高层特征(比如说FasterR-CNN利用下采样四倍的卷积层——Conv4,进行后续的物体的分类和boundingbox的回归),但是这样做有一个明显的缺陷,即小物体本身具有的像素信息较少,在下采样的过程中极易被丢失,为了处理这种物体大小差异十分明显的检测问题,经典的方法是利用图像金字塔的方式进行多尺度变化增强,但这样会带来极大的计算量。所以提出了特征金字塔的网络结构,能在增加极小的计算量的情况下,处理好物体检测中的多尺度变化问题。特征金字塔是目前用于目标检测、语义分割、行为识别等方面比较重要的一个部分,对于提高模型性能具有非常好的表现。不同大小的目标都经过

AIGC实战——生成对抗网络(Generative Adversarial Network)

AIGC实战——生成对抗网络0.前言1.生成对抗网络1.1生成对抗网络核心思想1.2深度卷积生成对抗网络2.数据集分析3.构建深度卷积生成对抗网络3.1判别器3.2生成器3.3DCGAN模型训练4.GAN训练技巧4.1判别器强于生成器4.2生成器强于判别器4.3信息量不足4.4超参数小结系列链接0.前言生成对抗网络(GenerativeAdversarialNetwork,GAN)是由IanGoodfellow等人在2014年提出的一种强大的深度学习模型,可以用于生成新数据样本,比如图像、音频、文本等。GAN包含两个神经网络:生成器和判别器。生成器根据输入的噪声信号生成一些伪造的数据样本,而判

论文解读:STANet | A Spatial-Temporal Attention-Based Method and a New Dataset for Remote Sensing Image

ASpatial-TemporalAttention-BasedMethodandaNewDatasetforRemoteSensingImageChangeDetection论文地址:https://www.mdpi.com/2072-4292/12/10/1662项目代码:https://gitcode.net/mirrors/justchenhao/STANet?utm_source=csdn_github_accelerator发表时间:2020遥感图像变化检测(CD)可以识别双时间图像之间的显著变化。给定在不同时间拍摄的两幅共配准图像,但是,光照变化和配准偏移(拍摄角度变化)超过了真

SpringBoot整合Redis(作为Cache缓存)+Lua

SpringBoot整合Redis开发者只需要引入SpringDataRedis依赖,然后简单配下redis的基本信息,系统就会提供一个RedisTemplate供开发者使用结合Cache的用法,Spring3.1中开始引入了令人激动的Cache,在SpringBoot中,可以非常方便的使用Redis来作为Cache的实现,进而实现数据的缓存。一、工程创建(web、cache以及redis)dependency>groupId>org.springframework.bootgroupId>artifactId>spring-boot-starter-cacheartifactId>depen

[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer

Ghost-freeHDRIwithContext-awareTransformer背景介绍已有算法本文算法实验对比背景介绍高动态范围成像(HDR)是一种图像技术,它能够捕捉到比传统图像更广泛的亮度范围。1997年,PaulDebevec在他的论文《RecoveringHighDynamicRangeRadianceMapsfromPhotographs》中提出了HDR的概念。论文里提出可以通过对同一个场景进行不同曝光时间的拍摄,然后用这些低动态范围(LDR)图像合成一张高动态范围(HDR)图像。这样做可以捕捉到从暗部的阴影到亮部的高光,或者说是高反光的更大动态范围的场景。HDR技术主要应用于

Empowering Low-Light Image Enhancer through Customized Learnable Priors 论文阅读笔记

中科大、西安交大、南开大学发表在ICCV2023的论文,作者里有李重仪老师和中科大的JieHuang(ECCV2022的FECCVPR2022的ENC和CVPR2023的ERL的一作)喔,看来可能是和JieHuang同一个课题组的,而且同样代码是开源的,我很喜欢。文章利用了MAE的encoder来做一些事情,提出了一个叫customizedunfoldingenhancer(CUE)的方法。从MAE中学了illuminationprior和noiseprior两个先验,用到了retinex模型中。流程如下图所示:文章用的是如下的常规retinex公式:目标是最小化如下表达式:把限制项(2b)放

android - ACTION_IMAGE_CAPTURE 的相机 Intent 未出现在 Samsung Galaxy Nexus(4.0.2) 上

我使用以下代码从相机拍摄照片并获取照片的路径。...IntentcameraIntent=newIntent(android.provider.MediaStore.ACTION_IMAGE_CAPTURE);startActivityForResult(cameraIntent,CAMERA_IMAGE_CAPTURE);//imagecapture...@OverrideprotectedvoidonActivityResult(intrequestCode,intresultCode,Intentdata){super.onActivityResult(requestCode,r

论文精读:《DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries》

DETR3D:3DObjectDetectionfromMulti-viewImagesvia3D-to-2DQueries文章目录DETR3D:3DObjectDetectionfromMulti-viewImagesvia3D-to-2DQueries论文精读摘要(Abstract)1.介绍(Introduction)2.相关工作(Relatedwork)3.多视角3D目标检测(Multi-view3DObjectDetection)3.1综述(Overview)3.2特征学习(FeatureLearning)3.3检测头(DetectionHead)3.4损失(Loss)论文精读摘要(A

ExposureDiffusion: Learning to Expose for Low-light Image Enhancement论文阅读笔记

南洋理工大学、鹏城实验室、香港理工大学在ICCV2023发表的暗图增强论文。用diffusion模型来进行raw图像暗图增强,同时提出了一个自适应的残差层用来对具有不同信噪比的不同区域采取不同的去噪策略。方法的框图如下所示:一张raw图片可以由信号和噪声组成,其中信号是曝光时间、增益和场景光子转化为电子数量三者乘积,噪声是由服从泊松分布的散粒噪声和与信号相独立的噪声的加和:文章定义暗图增强的目标为从一张λt=λT\lambda_t=\lambda_Tλt​=λT​的暗图XTX_TXT​恢复出一张λt=λ0>λT\lambda_t=\lambda_0>\lambda_Tλt​=λ0​>λT​的正

selenium库获取浏览器请求链接(Network)

获取浏览器请求的地址,和network差不多一致根据获取内容进行过滤importjsonfromseleniumimportwebdriverfromselenium.webdriver.common.desired_capabilitiesimportDesiredCapabilitiescaps=DesiredCapabilities.CHROMEcaps['goog:loggingPrefs']={'performance':'ALL'}driver=webdriver.Chrome(desired_capabilities=caps)driver.get('https://www.ba