草庐IT

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

所谓"扒谱"是指通过听歌或观看演奏视频等方式,逐步分析和还原音乐作品的曲谱或乐谱的过程。它是音乐学习和演奏的一种常见方法,通常由音乐爱好者、乐手或学生使用。在扒谱的过程中,人们会仔细聆听音乐作品,辨别和记录出各个音符、和弦、节奏等元素,并通过试错和反复推敲来逐渐还原出准确的曲谱或乐谱。这对于那些没有正式乐谱或想学习特定曲目的人来说,是一种有效的方式。扒谱的目的是为了更好地理解和演奏音乐作品,从中学习技巧、乐曲结构和艺术表达等方面。但不懂乐理的人很难听出音符和音准,本次我们通过openvpi的开源项目some来直接针对mp3文件进行扒谱,将mp3转换为midi文件。项目配置首先我们来克隆项目:g

Win10 环境配置 Github SSH Key

使用Git关联远程仓库通常可以使用HTTP协议或者SSH协议,在使用上SSH只需要一次配置,之后提交操作都不需要进行用户密码验证;但是HTTP方式每次Push操作都需要验证用户名和密码。当然,HTTP方式更方便开源,匿名用户可以随意进行克隆和代码阅读;在个人项目使用的时候则需要反复进行Push操作,可以通过配置SSH实现快捷的代码提交。01为指定账户创建密钥1️⃣首先需要设置绑定密钥的Git用户名和邮箱地址,在终端运行如下命令gitconfig--globaluser.name'yourname'gitconfig--globaluser.email'youremail@example.com

LockBit 勒索软件利用 Citrix Bleed 进行攻击,10K 服务器暴露

据BleepingComputer11月14日消息,Lockbit勒索软件正利用CitrixBleed已公开的漏洞(CVE-2023-4966)来破坏大型企业系统、窃取数据并加密文件。该组织近来因陆续攻击勒索波音、中国工商银行等知名企业而再度引发世人关注。威胁研究员KevinBeaumont 一直在追踪针对中国工商银行、  DPWorld、Allen&Overy 和波音等多家公司的攻击,发现了其中的一些共同点。这些暴露的Citrix服务器容易受到CitrixBleed漏洞的影响。《华尔街日报》进一步证实了这一点,该报获得了美国财政部发给特定金融服务提供商的一封电子邮件,其中提到LockBit对

实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万

文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。图源:https://twitter.com/javilopen/status/1724398666889224590LCM的全称是LatentConsistencyModels(潜在一致性模型),由清华大学交叉信息研究院的研究者们构建。在这个模型发布之前,StableDiffusion等潜在扩散模型(LDM)由于迭代采样过程计算量大,生成速度非常缓慢。通过一些创新性的方法,LCM只用少数的几步推

1分钟预测10天全球天气!谷歌DeepMind全新AI天气预报登上Science,碾压行业SOTA

不到1分钟,高精度预测出10天的全球天气。ChatGPT之后,又一个AI模型的能力再次惊艳了全世界!从15日开始,未来十天的全球天气状况它就是,谷歌DeepMind团队提出全新的全球天气预报模型——GraphCast,最新研究登上Science。图片论文地址:https://www.science.org/doi/10.1126/science.adi2336当前天气预报的主流方式就是「数值天气预报」(NWP),使用复杂的算法求解物理方程,既耗时又昂贵。而深度学习模型GraphCast在欧洲中期天气预报中心(ECMWF)近40年的数据上进行训练,来了解天气如何随时间演变。图片研究发现,与行业黄

c++ - 以编程方式复制 Windows 10 上的桌面

我一直在寻找使用C++以编程方式管理我的显示器的方法。它看起来像EnumDisplayDevices这样的函数,EnumDisplaySettings和ChangeDisplaySettings可用于,例如,更改单个显示设备的分辨率以及将所述设备附加到桌面/从桌面分离。除了这些操作之外,我还希望能够将我的桌面复制到多个显示器。一个具体的例子是从这个桌面跨越两个设备的设置开始.........在此设置中,桌面被复制到所述设备。我已经尝试调查MSDN上的API,并寻找类似的问题,但似乎找不到任何迹象表明这是否可行。是否可以使用C++将我的桌面复制到多个显示设备,如果可以,怎么做?如果没有,

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

视频以及图片修复技术是一项具有挑战性的AI视觉任务,它涉及在视频或者图片序列中填补缺失或损坏的区域,同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来,两种突出的方案在视频修复中崭露头角:flow-basedpropagation和spatiotemporalTransformers。尽管两套方案都还不错,但它们也存在一些局限性,如空间错位、时间范围有限和过高的成本。说白了,你通过AI技术移除水印或者修复一段不清晰的视频,但结果却没法保证连贯性,让人一眼能看出来这个视频或者图片还是缺失状态,与此同时,过高的算力成本也是普通人难以承受的。本次,我们通过Pro

Tensorflow-gpu-2.7.0安装教程和接入PyCharm(学生党详细教程,win10,Anaconda3,python3.9)

Tensorflow-gpu-2.7.0安装教程和接入PyCharm(学生党详细教程,win10,Anaconda3,python3.9)目录前言 安装前的必要工作!!!一定要看!!!一、查看自己电脑的显卡:  二、Anaconda的安装三、CUDA下载与安装四、cuDNN下载和安装五、创建tensorflow环境六、测试Tensorflow-gpu是否安装成功前言 Tensorflow有cpu和gpu之分,一般你的电脑上要是有GPU(也就是显卡)推荐安装GPU版本的,这样相对于cpu版本而已,运行速度更快! 本次教程主要是GPU版本,需要提前下载对应的cuda和cudnn。安装前的必要工作!

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。BERT的核心思想是通过在大规模文本语料上进行无监督预训练,学习到通用的语言表示,然后将这些表示用于下游任务的微调。相比传统的基于词嵌入的模型,BERT引入了双向上下文信息的建模,使得模型能够更好地理解句子中的语义和关系。BERT的模型结构基于Transformer,它由多个编码器层组成。每个编码器层都有多头自注意力机制和前馈神经网络,用于对输入序列进行多

综合使用各类方法,彻底关闭win10自动更新

目录 一:禁用windowupdate服务 二:在策略中关闭win10自动更新的相关设置 三:任务计划内的Win10更新 四:在注册表中关闭Win10自动更新 结果: 另一种针对注册表的方法:各个网站文章,作者找了很久综合下来,写下这一篇文章。一:禁用windowupdate服务1.键盘按下Win+R,打开运行个对话框,输入services.msc2.在服务中找到WindowUpdate,这一项,3.右键-属性,将启动类型,设置为“禁用”,服务设置为“停止”,点击确定 4.在界面上方的选项中选择“恢复”选项,下拉框都选择“无操作”。然后点击确定。  二:在策略中关闭win10自动更新的相关设置