草庐IT

image-recognition

全部标签

High-Resolution Image Synthesis with Latent Diffusion Models 稳定扩散模型论文笔记

一、研究现状    早期图像生成方法主要是变分自动编码器(VariationalAutoencoders,VAEs),该算法利用编码器和解码器以及变分推断的方法学习隐空间到真实图像空间的映射从而完成图像的生成。其优势是特征空间可迁移并且训练较为稳定,但是不容易进行模型评估,当输入的图像数据的分布情况复杂时,其学习到的特征泛化能力不足,而且生成的图像模糊。    生成对抗网络(GenerativeAdversarialNetworks,GAN)通过生成器与判别器的动态博弈来优化模型,允许以良好的感知质量对高分辨率图像进行有效采样,生成的图像比较清晰。但该方法模型训练不稳定并难以捕捉完整的数据分布

【步态识别】GaitSet 算法学习+配置环境+代码调试运行《GaitSet: Regarding Gait as a Set for Cross-View Gait Recognition》

目录1.论文&代码源2.配置环境2.1硬件环境2.2软件配置3.运行代码3.1关于CASIA-B数据集3.2pretreatment.py3.2.1log2str函数3.2.2log_print函数3.2.3cut_img函数3.2.4cut_pickle函数3.2.5图像预处理完整代码3.3config.py3.4train.py运行结果3.5test.py3.5.1概念补充:probeset与galleryset3.5.2运行结果4.算法核心代码4.1gaitset.py☆4.2model.py4.3triplet.py5.(原作)运行结果附录关于GaitSet核心算法,建议直接跳到“4.

open-set recognition(OSR)开集识别

开集识别闭集识别​训练集中的类别和测试集中的类别是一致的,最常见的就是使用公开数据集进行训练,所有数据集中的图像的类别都是已知的,没有未知种类的图像。传统的机器学习的算法在这些任务上已经取得了比较好的效果。(训练集和测试集的类别是一致的)开集识别描述开集识别是一个在现实世界中最常见的问题,但是这个问题只有你在真正实施项目的时候才会遇到,使用公开数据集是不会遇到这个问题的。所谓的开集识别白话说就是在一个开放的数据集中进行识别,更为准确的说就是:测试集中含有训练集中没有的类别,而在使用测试集进行测试的时候,输入一张不属于训练集中已知类别的图像,由于Softmax的输出特性,模型有可能会将其以较高的

android - Fragment BackStack 在使用 Glide Image Library 加载图像后清除

我使用Glide加载图像(图像在我的fragment中)。并处理backpress上的fragmentbackstack以在fragment之间导航。加载图像后,我的fragment堆栈替换为以下fragmentcom.bumptech.glide.manager.SupportRequestManagerFragment条目所以我现在无法处理后台堆栈,我不希望将glideSupportRequestManagerFragment附加到fragment后台堆栈中,我还阅读了以下链接中的glide文档http://bumptech.github.io/glide/javadocs/360

android - Android 版 OpenCV : Simple example to convert Image to Greyscale

作为初学者,我只想通过OpenCV将位图转换为灰度。我已拥有一切正在运行,但一旦我想将图像转换为灰度,它就会崩溃。任何人都可以帮忙吗?我希望这些fragment足够了,如果不够我可以附上其余部分。部分java文件://converttoopencvstructureMatimage=newMat();Matgrayimage=newMat();Utils.bitmapToMat(b2,image);//callopencvforprocessinggrayimage=convertToGray(image);//convertbackUtils.matToBitmap(grayimag

微信小程序image组件的mode总结+介绍(包含heightFix)

2.10.3版本后,微信小程序的图片即image组件新增了heightFix属性(mode),总共具有14种属性,满足各种情况的放置需要。14种属性可以分为两大类,一种是完全保留的缩放属性,一种是裁剪属性。原图缩放属性 scaleToFill缩放模式,不保持纵横比缩放图片,使图片的宽高完全拉伸至填满image元素效果:aspectFit 缩放模式,保持纵横比缩放图片,使图片的长边能完全显示出来。短边按比例缩放。也就是说,可以完整地将图片显示出来。效果:aspectFill 缩放模式,保持纵横比缩放图片,只保证图片的短边能完全显示出来,长边按比例缩放,。也就是说,图片通常只在水平或垂直方向是完整

安卓 : How to set an image to an imageview from a url programatically

我有一个来self的restAPI的图片url。现在我想在加载Activity时将其设置为ImageView。下面是我如何从restapi获取bean,然后从中获取URL。Messagemessage=newMessage();StringimageUrl=message.getImageUrl();我从我的数据库中获取Message对象,图像url包含在该Message对象中。然后我使用Url对象获取该图像url。URLurl=null;try{url=newURL(imageUrl);Bitmapbmp=BitmapFactory.decodeStream(url.openConn

FileNotFoundError: [WinError 2] 系统找不到指定的文件。: '0054243eb93327df4b590230781f3ce5.png' -> 'image_1.png'

importos#指定目录directory='E:\\pythonProject\\a'#获取当前目录下所有图片文件image_files=[fforfinos.listdir(directory)iff.endswith('.jpg')orf.endswith('.png')orf.endswith('.jpeg')]#重命名图片文件fori,fileinenumerate(image_files):new_name=f'image_{i+1}.{file.split(".")[-1]}'#新的文件名格式#try:#os.rename(file,new_name)#exceptFileNo

android - Universal Image Loader UIL nostra 内存不足错误

我正在使用UIL加载远程图像并填充FragmentStatePagerAdapter中的fragment。我已阅读自述文件和常见错误,但无法解决此错误。配置如下:ImageLoaderConfigurationconfig=newImageLoaderConfiguration.Builder(getApplicationContext()).threadPoolSize(1).build();ImageLoader.getInstance().init(config);这里是我展示图片的地方:publicViewonCreateView(LayoutInflaterinflater,

Towards Robust Tampered Text Detection in Document Image: New dataset and New Solution

DocTamper: https://github.com/qcf-568/DocTamper Introduction文件图像是现代社会最重要的信息传播媒介之一,它包含了大量的敏感和隐私信息,如电话号码。随着图像编辑技术的快速发展,这种敏感的文本信息更容易被恶意篡改,构成欺诈等,造成严重的信息安全风险[33,42,48,50]。因此,检测文档图像中的篡改已成为近年来重要的研究课题[18,47]。开发有效的方法来检查文档图像是否被修改,同时确定篡改文本的确切位置是至关重要的。大多数文档图像中的文本篡改方法大致可以分为三种类型:(1)拼接,将一个图像中的区域复制并粘贴到其他图像中;(2)Copy