草庐IT

Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

6月12日消息,Meta近日在Github上开源了其AI语言模型MusicGen,该模型基于谷歌2017年推出的Transformer模型。如同模型名称所示,MusicGen主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。研发团队表示:“我们使用了20000小时的授权音乐来对训练该模型,并采用Meta的EnCodec编码器将音频数据分解为更小的单元进行并行处理,进而让MusicGen的运算效率和生成速度都比同类型AI模型更为出色。”除此之外,MusicGen还支持文本与旋律的组合输入,例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。研发团队还对Mu

openai 包里含有的model;可以写文章、画图片、作音乐曲...

openai包里含有的model;可以写文章、画图片、作音乐曲...OpenAIPython包包含许多不同的预训练模型,可用于执行各种自然语言处理和计算机视觉任务。以下是OpenAIPython包支持的一些模型及其用途的示例:GPT-3GPT-3是OpenAI的最新自然语言处理模型,具有惊人的文本生成能力。它可以用于生成各种文本,例如文章、故事、新闻报道等。DALL-EDALL-E是一种计算机视觉模型,可以生成各种图像,例如动物、家具、食物等。您可以向模型提供描述图像的文本,它将生成与描述匹配的图像。CLIPCLIP是一种计算机视觉模型,具有出色的图像分类和语义搜索能力。您可以使用它来查找与给