草庐IT

国内AI绘画哪家强?十大免费工具横评,BAT参战,但不是最强

对国内10款免费AI文生图工具5个梯度的进阶体验对比,哪款工具更得心应手?▲提示词:生成一张龙年头像,要有喜庆的氛围,还能体现招财进宝、大吉大利(第一排为百度文心一言、百度文心一格、360智绘、阿里云通义万相、讯飞星火;第二排为智谱AI智谱清言、抖音豆包、腾讯混元助手、美图MiracleVision、讯飞星火绘画助手)过去一年,AI文生图模型持续进化,不仅能熟练驾驭各路画风,而且陆续解决画不好手、搞不明白空间位置、不理解“红烧狮子头”等有歧义或抽象概念的种种难点。国外Midjourney、DALL·E3、Imagen2虽好,但用起来有一定门槛。好在国内大模型企业们急追猛赶,发布了一大波适合中国

开辟天地!苹果股东大会有史以来最强AI信号!CEO库克终于正式宣战GenAI,2024重新定义未来的大招产品会是什么

撰稿| 云昭、诺亚出品|51CTO技术栈(微信号:blog51cto)2月28日,就在刚刚宣布放弃造车项目一天后,苹果公司CEO蒂姆·库克释放出一个苹果历史上前所有未有的强烈信号:breaknewgroundinGenAI(在生成式AI上开辟新天地)。在苹果公司的年度股东大会上,库克表示,苹果正在向人工智能领域投入大量资金,表明这家iPhone制造商正在火热地拥抱席卷整个科技圈的生成式人工智能。库克进一步解释道:苹果公司看到了生成式AI的巨大突破潜力,这也是为什么目前正在这一领域进行大量投资的原因。“我们相信,GenAI将为苹果用户在生产力、解决问题等方面带来变革性的机会。”虽然苹果公司尚未推

英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑

最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址:https://arxiv.org/abs/2402.16819在7个评估基准上,与同等参数规模的模型相比,Nemotron-415B表现出色。甚至,其性能超过了4倍大的模型,以及专用于多语言任务的模型。如今LLM已经非常多了,英伟达新发布的语言模型,有何不同?打造最强通用LLM,单个A100/H100可跑最近发表的LLM研究受到了Chinchilla模型「缩放定律」的启发——给定固定计算预算,数据和模型大小一同

全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战

一声炸雷深夜炸响,谷歌居然也开源LLM了?!这次,重磅开源的Gemma有2B和7B两种规模,并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持,Gemma不仅在相同的规模下实现SOTA的性能。而且更令人印象深刻的是,还能在关键基准上越级碾压更大的模型,比如Llama213B。与此同时,谷歌还放出了16页的技术报告。谷歌表示,Gemma这个名字源自拉丁语「gemma」,也就是「宝石」的意思,似乎是在象征着它的珍贵性。历史上,Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode,都是谷歌为开源社区贡献的创新。谷歌:

布朗桥扩散模型 BBDM:全网最强图像转换算法,完胜 GAN、扩散模型

布朗桥扩散模型BBDM:全网最强图像转换算法,完胜GAN、扩散模型图像转换发展史完胜GAN完胜扩散模型BBDM结构总结 图像转换发展史论文:https://arxiv.org/pdf/2205.07680.pdf代码:https://github.com/xuekt98/BBDM Isola等人首次提出了基于条件GAN的图像到图像转换统一框架Pix2Pix。Wang等人扩展了Pix2Pix框架以生成高分辨率图像Pix2PixHD。基于CycleGAN和DualGAN的未配对转换方法,使用两个分开的GAN在两个域上进行训练,能够处理未配对的数据。这些一对一映射的方法无法生成多样的输出。为了生成多

端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动

「在移动设备上运行LLM?可能需要Meta的一些技巧。」刚刚,图灵奖得主YannLeCun在个人社交平台表示。他所宣传的这项研究来自Meta最新论文《MobileLLM:OptimizingSub-billionParameterLanguageModelsforOn-DeviceUseCases》,在众多作者中也有我们熟悉的来自MetaFAIR田渊栋。田渊栋表示:「我们的MobileLLM预训练模型(125M/350M),性能达到SoTA,特别是在聊天/API调用方面表现出色。此外,本工作中的一个有趣研究是跨Transformer层的权重共享,这样不仅节省了参数,还减少了推理过程中的延迟。」

全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,重燃开源之战

一声炸雷深夜炸响,谷歌居然也开源LLM了?!这次,重磅开源的Gemma有2B和7B两种规模,并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持,Gemma不仅在相同的规模下实现SOTA的性能。而且更令人印象深刻的是,还能在关键基准上越级碾压更大的模型,比如Llama213B。与此同时,谷歌还放出了16页的技术报告。技术报告地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf谷歌表示,Gemma这个名字源自拉丁语「gemma」,也就是「宝石」的意思,似乎是在象征着它的珍贵性。历史上

【obs】最强开源视频直播软件OBS介绍

▒目录▒🛫导读需求开发环境1️⃣简介名词解释常见功能应用场景2️⃣obs简单使用配置向导创建场景添加来源-显示器添加来源-视频采集设备(摄像头)最终效果3️⃣技巧修改`来源`的位置和大小区域截屏设置`来源`的层级切换场景过度动画📖参考资料🛫导读需求随着视频行业的崛起,越来越多的视频录制需求应运而生,小编也悲催的加入了此行业。作为新手玩家,搜罗万象,总结下最近所学内容,希望能帮助到大家。开发环境版本号描述文章日期2023-12-12操作系统Win10-22H219045.3570OBS30.0.0最新的OBS版本OBS27.2.4最后的32位版本1️⃣简介在现今数字化时代,流媒体已成为人们分享和

Linux下最强安卓模拟器,流畅又丝滑(附详细安装教程)此瓜保熟|Linux游戏党

我打算完全从头开始,写一个专门用于桌面办公的纯国产操作系统 ,规避主流操作系统上影响用户体验的问题,系统力求简洁。有兴趣加QQ群:709652950好东西让更多人发现!我找了整整两年,什么Anbox,什么Genymotion,最后还是这个模拟器安装最便捷(比Anbox强),丝毫不卡顿(比Genymotion强)。网课期间,当时我家电脑操作系统是Ubuntu21.04,我整整上了两个月的网课,第一个月用的虚拟机,安装Windows上课,然后电费单不敢直视......第二个月,钉钉终于有能看直播的Linux安装包了,但是QQ和微信都都没有Linux版本(别跟我提反人类的QQLinux版!),就造成

数学建模-灰色预测最强讲义 GM(1,1)原理及Python实现

目录一、GM(1,1)模型预测原理二、GM(1,1)模型预测步骤2.1数据的检验与处理2.2建立模型2.3检验预测值三、案例 灰色预测应用场景:时间序列预测灰色预测的主要特点是模型使用的不是原始数据序列,而是生成的数据序列。其核心体系是灰色模型,即对原始数据做累加生成得到近似的指数规律再进行建模的方法。优点是不需要很多的数据,一般只需要4个数据就可以,能解决历史数据少、序列的完整性及可靠性低的问题;能利用微分方程来充分挖掘系统的本质,精度高;能将无规律的原始数据进行生成得到规律性较强的生成序列,运算简便,易于检验,具有不考虑分布规律,不考虑变化趋势。缺点是只适用于中短期的预测,只适合指数增长的