草庐IT

High-throughput

全部标签

High-Resolution Image Synthesis with Latent Diffusion Models 稳定扩散模型论文笔记

一、研究现状    早期图像生成方法主要是变分自动编码器(VariationalAutoencoders,VAEs),该算法利用编码器和解码器以及变分推断的方法学习隐空间到真实图像空间的映射从而完成图像的生成。其优势是特征空间可迁移并且训练较为稳定,但是不容易进行模型评估,当输入的图像数据的分布情况复杂时,其学习到的特征泛化能力不足,而且生成的图像模糊。    生成对抗网络(GenerativeAdversarialNetworks,GAN)通过生成器与判别器的动态博弈来优化模型,允许以良好的感知质量对高分辨率图像进行有效采样,生成的图像比较清晰。但该方法模型训练不稳定并难以捕捉完整的数据分布

(FEDCVAE-KD)DATA-FREE ONE-SHOT FEDERATED LEARNING UNDER VERY HIGH STATISTICAL HETEROGENEITY论文笔记

摘要出于对扩展通信和潜在攻击的担忧,一次性FL将通信限制在单一回合,同时试图保持性能。然而,一次性FL方法在高统计异质性的情况下往往会退化,无法提高管道的安全性,或者需要一个辅助的公共数据集。为了解决这些局限性,我们提出了两种新的无数据的一次性FL方法:FEDCVAE-ENS和它的扩展FEDCVAEKD。这两种方法都使用条件变分自动编码器(CVAE)重构局部学习任务,以解决高统计异质性。此外,FEDCVAE-KD利用知识蒸馏将客户端解码器的集合压缩到单个解码器中。我们提出了一种改变CVAE先验分布中心的方法,并通过实验证明这种方法提高了安全性,并展示了这两种方法是如何结合异构局部模型的。论文通

[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer

Ghost-freeHDRIwithContext-awareTransformer背景介绍已有算法本文算法实验对比背景介绍高动态范围成像(HDR)是一种图像技术,它能够捕捉到比传统图像更广泛的亮度范围。1997年,PaulDebevec在他的论文《RecoveringHighDynamicRangeRadianceMapsfromPhotographs》中提出了HDR的概念。论文里提出可以通过对同一个场景进行不同曝光时间的拍摄,然后用这些低动态范围(LDR)图像合成一张高动态范围(HDR)图像。这样做可以捕捉到从暗部的阴影到亮部的高光,或者说是高反光的更大动态范围的场景。HDR技术主要应用于

SparseBEV:High-Performance Sparse 3D Object Detection from Multi-Camera Videos

参考代码:SparseBEV动机与主要贡献:BEV感知可以按照是否显式构建BEV特征进行划分,显式构建BEV特征的方法需要额外计算量用于特征构建,而类似query方案的方法则不需要这样做。比较两种类型的方法,前者需要更多计算资源但是效果好,后者需要的计算资源相对较少,但是性能相比起来不足。在这篇文章中从如下3个维度去分析和优化基于query的感知方法:1)分析query之间的关联,在基于query的方法中往往使用self-attention的方式构建query之间的关联,但是对于3D空间中的物体它们是存在空间距离的,相隔较远的物体它们之间的关联性自然就弱2)自身和目标的运动补偿,自动驾驶的场景

java - 机器人 : rotate a high resolution picture generates an out of memory error

我尝试在“onPictureTaken”中旋转图片publicvoidonPictureTaken(byte[]data,Cameracamera){StringfileName="last"+Calendar.getInstance().getTimeInMillis();StringfinalFilePath=null;Filetemp=Environment.getExternalStorageDirectory();Stringdestination=temp.getAbsolutePath()+"/pictureTest/";Bitmapbitmap1=BitmapFacto

Android GPS ACCURACY_HIGH 导致强制关闭?

我正在处理GPS部分和标准,我可以将精度设置为ACCURACY_FINE、ACCURACY_MEDIUM等。但是,由于某种原因,如果我将标准设置为ACCURACY_HIGH,我会不断收到强制关闭错误。关于可能导致它的原因有什么想法吗?这是我的list,我很确定一切正常,因为我可以使用不同的条件:这是我的日志:07-0508:51:48.641:W/dalvikvm(1040):threadid=1:threadexitingwithuncaughtexception(group=0x40015578)07-0508:51:48.657:E/AndroidRuntime(1040):FA

【论文笔记】GeneFace: Generalized and High-FidelityAudio-Driven 3D Talking Face Synthesis

一.背景1.1挑战这项工作泛化能力弱,存在的两个挑战:(1)训练数据规模小。(2)容易产生“平均脸”。音频到其对应的面部运动是一对多映射,这意味着相同的音频输入可能具有多个正确的运动模式。使用基于回归的模型学习此类映射会导致过度平滑和模糊结果1.2解决方案(1)为了处理弱泛化问题,我们设计了一个音频到运动模型,在给定输入音频的情况下预测三维人脸标志。我们利用来自大规模唇读数据集的数百小时的音频运动对学习鲁棒映射。(2)对于“平均脸”问题,我们采用基于流先验的变分自动编码器(VAE)代替基于回归的模型,作为音频到运动模型的结构,有助于生成准确且富有表情的人脸运动。(3)然而,由于生成的标志(多说

SpringBoot整合ElasticSearch之Java High Level REST Client

1搭建SpringBoot工程2引入ElasticSearch相关坐标。properties> elasticsearch.version>7.4.0elasticsearch.version>properties>dependencies>dependency>groupId>org.elasticsearch.clientgroupId>artifactId>elasticsearch-rest-high-level-clientartifactId>version>7.4.0version>dependency>................3编写核心配置类编写核心配置文件:这里可以

带有 WiredTiger : High CPU load 的 MongoDB 3

我们在副本中有3个实例。主要有2核CPU和4GBRAM。次要具有1个核心CPU和4GBRAM。具有1个核心CPU和2GBRAM的仲裁器。第一个测试:mongodb-org-server-2.6.10-1.x86_64logpath=/var/log/mongodb/mongod.loglogappend=truefork=truedbpath=/mnt/mongopidfilepath=/var/run/mongodb/mongod.pid第二个测试:mongodb-org-server-3.0.4-1.x86_64processManagement:pidFilePath:"/var

Nerf论文阅读笔记Neuralangelo: High-Fidelity Neural Surface Reconstruction

Neuralangelo:高保真神经表面重建公众号:AI知识物语;B站暂定;知乎同名视频入门介绍可以参考B站——CVPR2023最新工作!Neuralangelo:高保真Nerf表面重建https://www.bilibili.com/video/BV1Ju411W7FL/spm_id_from=333.337.searchcard.all.click&vd_source=03387e75fde3d924cb207c0c18ffa567图1所示。本文提出Neuralangelo,一种用神经体渲染从RGB图像中进行高保真3D表面重建的框架,即使没有分割或深度等辅助数据。图中显示的是一个提取的法院