草庐IT

手把手教你声音克隆(so-vits-svc)

前言随着ChatGPT的爆火,AIGC(人工智能生成内容)再一次走到人们眼前。尤其是在文本、图像生成领域,通过GPT-4、Midjourney等应用生成各种令人惊叹定的文本和图片。但AI在生成方面的能力,可远非如此如此。我用长约一个小时的音频数据,训练了一个AI音色转换模型,生成了这首歌曲,效果如下所示,大家可以在评论区留言猜猜是谁?小半-AI合成视频里所使用的技术是so-vits-svc,是音频转音频,属于音色转换算法,支持正常的说话,也支持歌声的音色转换。下面具体介绍如何使用so-vits-svc。 一、准备工作训练数据很关键,越多高质量的音频数据,效果越好,建议至少准备一个小时以上的音频

云端炼丹,算力白嫖,基于云端GPU(Colab)使用So-vits库制作AI特朗普演唱《国际歌》

人工智能AI技术早已深入到人们生活的每一个角落,君不见AI孙燕姿的歌声此起彼伏,不绝于耳,但并不是每个人都拥有一块N卡,没有GPU的日子总是不好过的,但是没关系,山人有妙计,本次我们基于Google的Colab免费云端服务器来搭建深度学习环境,制作AI特朗普,让他高唱《国际歌》。Colab(全名Colaboratory),它是Google公司的一款基于云端的基础免费服务器产品,可以在B端,也就是浏览器里面编写和执行Python代码,非常方便,贴心的是,Colab可以给用户分配免费的GPU进行使用,对于没有N卡的朋友来说,这已经远远超出了业界良心的范畴,简直就是在做慈善事业。配置ColabCol

民谣女神唱流行,基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

流行天后孙燕姿的音色固然是极好的,但是目前全网都是她的声音复刻,听多了难免会有些审美疲劳,在网络上检索了一圈,还没有发现民谣歌手的音色模型,人就是这样,得不到的永远在骚动,本次我们自己构建训练集,来打造自己的音色模型,让民谣女神来唱流行歌曲,要多带劲就有多带劲。构建训练集训练集是指用于训练神经网络模型的数据集合。这个数据集通常由大量的输入和对应的输出组成,神经网络模型通过学习输入和输出之间的关系来进行训练,并且在训练过程中调整模型的参数以最小化误差。通俗地讲,如果我们想要训练民谣歌手叶蓓的音色模型,就需要将她的歌曲作为输入参数,也就是训练集,训练集的作用是为模型提供学习的材料,使其能够从输入数

so-vits-svc3.0 中文详细安装、训练、推理使用教程

SO-VITS-SVC3.0详细安装、训练、推理使用步骤2023-3-12文档更新说明:由于特殊原因,本项目文档将停止更新,详情请见原作者首页,感谢各位的支持!本文档的Github项目地址点击前往本帮助文档为项目so-vits-svc补档的详细中文安装、调试、推理教程,您也可以直接选择官方README文档撰写:Sucial点击跳转B站主页1.环境依赖本项目需要的环境:NVIDIA-CUDAPythonPytorchFFmpeg-Cuda在cmd控制台里输入nvidia-smi.exe以查看显卡驱动版本和对应的cuda版本前往NVIDIA-Developer官网下载与系统对应的Cuda版本以Cu

so-vits-svc3.0 中文详细安装、训练、推理使用教程

SO-VITS-SVC3.0详细安装、训练、推理使用步骤2023-3-12文档更新说明:由于特殊原因,本项目文档将停止更新,详情请见原作者首页,感谢各位的支持!本文档的Github项目地址点击前往本帮助文档为项目so-vits-svc补档的详细中文安装、调试、推理教程,您也可以直接选择官方README文档撰写:Sucial点击跳转B站主页1.环境依赖本项目需要的环境:NVIDIA-CUDAPythonPytorchFFmpeg-Cuda在cmd控制台里输入nvidia-smi.exe以查看显卡驱动版本和对应的cuda版本前往NVIDIA-Developer官网下载与系统对应的Cuda版本以Cu