草庐IT

基于so-vits-svc语音模型实现AI翻唱歌曲

目录获取数据集开始训练开始推理(翻唱)获取数据集工具整合包来源【AI翻唱/SoVITS4.0】手把手教你老婆唱歌给你听~无需配置环境的本地训练/推理教程[懒人整合包]_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_custom_collection.content.click&vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5音频来源QQ音乐-HQ高品质下载zutomayo的歌曲列表DearMr[F]去和声、

“AI+机器人”持续为多领域增“智”添“质”,开启效益增长飞轮

近期,工信部等17部门联合推出《“机器人+”应用行动实施方案》,全面加快机器人领域应用拓展。据方案提出,至2025年,制造业机器人密度较2020年将实现翻番,服务机器人及特种机器人行业应用深度与广度显著提升。机器人融合多类创新技术,强有力推动各行业往高附加值方向发展。智能机器人的背后是算力、算法、通信、数据等核心要素的有机融合。具备算力、算法与无线通信能力的模组能够帮助机器人实现各类场景的自主导航、自动作业与自主决策,令智能机器人在庭园草坪、物流配送、清洁巡查、公共安全、酒店零售中发挥更大效用。让草坪保持整洁是任何家庭业主的重要任务之一,但是剪草需要耗费大量的人力和时间。智能无边界割草机器人是

让AI帮你工作(2)-如何阅读pdf论文

这个系列快结束了,后面会有一到两篇文章介绍,如何用AI实实在在的应用在工业生产研发,如何指导化工分子合成,如何做DNA的研究预测,合成。背景最近chatpdf在各媒体传的风风火火,从效果上是很震撼的。原因大概分析有三:1.pdf在大家印象中是一种保存性文档,很不容易做二次数据处理2.可以对pdf中内容做问答,还可以顺带做翻译,做长文章的摘要观点生成3.可以找到某个观点出现在哪但其实如果是做nlp的同学又稍微熟悉办公自动化的同学,应该知道上面几点都不难。1.pdf其实是可以想word一样的方便操作的。2.文章摘要有难度,但是chatgpt对知识整理能力是可以的,调api就好3.把自动化能力+ch

[UE4]使用UMG的用户界面,设置UMG的模块依赖性(C++)

主要关注UE4的C++项目中如何使用UMG:C++项目中设置UMG的模块依赖性,并在C++使用UMG中创建游戏UI。详情参考官方文档:使用UMG的用户界面:官方文档1.设置UMG的模块依赖性虚幻引擎4,建议先阅读编程快速入门tutorial。本教程将假设您已熟悉项目的创建、向其中添加C++代码,以及编译代码。同时也会向 蓝图 公开函数和属性。如欲了解更多信息,可从变量、定时器和事件tutorial将从新建项目开始:点击新项目中的 游戏 分类,然后点击 下一步。选择一个空白模板并点击 下一步。确认启用了 C++、台式机/主机 和 使用初学者内容包(WithStarterContent) 设置。将

UE4 创建暂停和结束游戏UI

效果:步骤:1.创建控件蓝图,命名为Pause 2.双击打开Pause,拖入一个边界控件并调整大小3.更改下边界的颜色和透明度 4.将锚点居中,这样屏幕改变时,边界控件会向中间移动和缩放 5.将边界控件的位置x和位置y的值改为0,对齐改为0.5,0.5,这样边界控件就会在屏幕中间显示 6.将文本拖入7.再一次将锚点居中,位置x,y设为0,对齐为0.5,0.5,这样文本块居中显示8.勾选大小到内容 9.编辑文本内容和字体大小 10.拖入按钮控件 11.同样将按钮锚点居中,调整按钮的位置和大小 12.拖入文本并更改文本、字体尺寸等参数 13.选中按钮和文本进行复制粘贴,来再次添加一个按钮 14.可

【AI绘画】NovelAI泄露版本地安装全过程

关于AI画画这个系列已经开了个头,前面已经简单的介绍了stable-diffusion的一些效果和简单的使用方法。这几天NovelAI模型泄露了。那就凑巧了,就以这个模型为例。完整的介绍一下stable-diffusion-webui本地安装方法几乎是从零开始说起(除了不教操作系统安装)。WebUI就是stable-diffusion的可视化版本!本地安装的好处是:无限出图不受限。作品尺度不受限。当然本地安装,相比直接用别人的网页版,难度也增加了。需要一定的硬件配置,N卡显存4G+要保证网络通畅,能高速外网那种最好。需要一些耐心,懂一些命令行。客观条件准备充分的情况下,根据这篇文章一步一步来,

基于SadTalker的AI主播,Stable Diffusion也可用

基于之前的AI主播的的学习基础基于Wav2Lip的AI主播和基于Wav2Lip+GFPGAN的高清版AI主播,这次尝试一下VideoRetalking生成效果。总体来说,面部处理效果要好于Wav2Lip,而且速度相对于Wav2Lip+GFPGAN也提升很多,也支持自由旋转角度,但是如果不修改源码的情况下,视频的部分截取稍微有点问题。这个训练图片还好,如果是做视频的话还是比较吃GPU资源的16G显存是个起步配置。文章目录准备工作环境配置创建虚拟环境激活虚拟环境pip安装匹配版本模型预测对口型必要的数据准备图片、视频预测参数说明有趣的操作StableDiffusion使用方法准备工作

学习AI画画

AI画画学习利用算法进行画画,通过文本或者以图生图等形式生成相应的图像。之前在云端服务器Linux部署过一遍,这里总结一下相关的过程。常见AI绘画软件使用方式方式优势不足1在线版直接打开浏览器注册即可使用,非常方便大部分不能无限生成,可能要收费2本地电脑部署安全方便,不受限制对机器性能有要求,GPU要求大于4G3云端服务器部署不需要实体电脑,云服务器即可免费的或者租用的,免费的可能慢,云服务器收费较贵在线绘图网站在线绘图网站是否收费www.midjourney.com收费,25次免费使用,需要在discord.com进行注册beta.dreamstudio/dream收费,可免费试用lexic

UE4-材质编辑常用节点

此篇是对材质蓝图中经常使用的材质节点 进行的介绍。纹理坐标:TextureCoordinate点击节点,展示在细节面板的参数:坐标索引:材质可以拥有不止一套UV通道,设置索引值使用通道。(0第一个通道,1第二个通道)U平铺:指定U方向上的平铺量。V平铺:指定V方向上的平铺量。快捷键:U+鼠标左键一:加、减、乘、除1.加Add相关计算涉及到常量+常量,同维向量+同维向量,多维向量+常量。(1)常量+常量:0.6+0.4结果为:1(2)同维向量+同维向量:(0.2,0.3,0.4)+(0.1,0.2,0.3)结果为:(0.3,0.5,0.7)解释:材质中每个通道分别相加,最后输出颜色值。(3)多维

语言模型ChatGPT,为什么能引领各行各业的AI技术革命

为什么ChatGPT这样一个语言模型的发展能引发所有行业的AI技术革命呢?答案就在于它能理解我们的自然语言,并能将我们的语言转换成计算机能够完全理解的特征。自然语言与计算机理解ChatGPT之所以能引领技术革命,关键在于它能理解我们的自然语言,并能将我们的语言转换成计算机能够完全理解的特征。自然语言所包含的信息庞大且丰富,远远超过了代码所能表达的范围。就像三维与二维的关系,通过自然语言,计算机能够理解的事物范围大大扩展。过去很多事物很难通过编码来描述,而现在只需用语言描述,计算机便能理解。以生成国风美女照片为例,用代码描述几乎不可能,但通过语言模型,只需要简单的一句话。这就使得以前难以实现的事