草庐IT

实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万

文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。图源:https://twitter.com/javilopen/status/1724398666889224590LCM的全称是LatentConsistencyModels(潜在一致性模型),由清华大学交叉信息研究院的研究者们构建。在这个模型发布之前,StableDiffusion等潜在扩散模型(LDM)由于迭代采样过程计算量大,生成速度非常缓慢。通过一些创新性的方法,LCM只用少数的几步推

谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析

GoogleDeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。网友看了之后纷纷表示:「终于,他们发了点普通人能看懂的东西了」。「哦豁,这下懂了」「对,就是这么简单!」「太棒了,感谢感谢,这下我明白了。」「简单明了」,「已经不能再简单了!」当然,也有个别老实人在角落里小声地嘀咕,「像极了嘴上说着懂了懂了,实际上啥也看不懂的我。」如果你还不确定自己真的没懂LLM的工作原理,看了这个视频之后就能确定你其实真的不懂。😂果然应了那句老话,「人类的悲(ren)喜(zhi)并不相通」。除了皇帝的新装外,也有网友尝试解释DeepMind做出这

就这也想取代手机?爆火全网的AI硬件遭炮轰:谷歌眼镜+寻呼机

就这,也想取代手机?最近刷屏的新型AI设备AIPin,在引发全球关注后,马上遭到巨大质疑。有人直言,这不就是谷歌眼镜和寻呼机的结合体吗?没屏幕、没APP,还带个摄像头。因为由苹果前高管联手打造、OpenAI奥特曼投资,AIPin一经发布即吸引全世界的目光。它没有屏幕、只支持语音手势交互,但又具备诸多AI能力,可以搞定很多智能手机任务。由此被许多人视为智能手机的挑战者、“AI时代的iPhone”。但这些亮点,也成为了AIPin饱受质疑的原因:语音交互在公共场合怎么保障隐私?不支持APP是不是倒退?胸前摄像头直接对准人脸没有屏幕,用户理解信息成本不升高吗?有人甚至将AIPin称为近期看到过的“最会

互联网博物馆爆火,网友满满回忆杀,看看你能想起几个?

要是给互联网做个博物馆,你会放哪些“藏品”?现在有个程序员以时间为轴制作了一个,结果引得网友们满满回忆杀。比如第一封垃圾邮件、第一个笑脸、第一个亚马逊订单……而且有心的是,里面一些曾经风靡的小游戏或者Flash动画、视频什么的,都是可以实实在在体验和观看的。我们摘取部分,一起来回溯一下吧。互联网鼻祖ARPANET这是1977年的逻辑图,连接到该网络的111台计算机终端。到1983年,ARPANET已拥有4000多台联网计算机,电子邮件用户数量不断增加。ARPANET完成报告的结论是,该项目引发的技术变革,可能需要很多年才能被理解。1978,第一封垃圾邮件在ARPANET上有320个用户都收到了

ChatGPT爆火至今,国内十余家知名公司竞相入局!高质量文本标注需求不断

2022年底OpenAi推出chatGpt,爆火至今。 据《华尔街日报》报道,百度将于3月16日左右推出类似ChatGPT的聊天机器人。科大讯飞预计今年5月落地ChatGPT相关AI学习机。与此同时,更有腾讯、华为、字节、京东、360、网易、快手等10余家企业宣布有相关技术储备,或准备发布类似产品。当前,ChatGPT已可以对大部分问答做到“对答如流”。但ChatGPT本质上是一个应用在对话场景的语言模型,它能够回答问题、承认错误以及拒绝不适当的请求,是预训练模型驱动的产物。它回答的准确度与训练模型的成熟度、完善度有着密不可分的关系。当被提问“2023年在中国会是买房的好时机吗?”“哪只股票会

操作系统级ChatGPT爆火,实测让电脑自己整理桌面,Mac/Windows/Linux都支持

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。操作系统级ChatGPT,微软还没搞出来,被开源项目先实现了——支持Windows、Mac、Linux三大系统,相当于直接和你的电脑对话。指定文件夹下打开终端,一句话,所有Word文件秒变PDF。与单个文件互动,直接拖拽进来就行。与应用程序互动也不在话下,一句话读取系统日历、整理日程并发到指定邮箱。甚至从头写一个本不存在的番茄钟应用,写好直接就能用上了。这个神器,就是开源版代码解释器OpenInterpreter,一经发布就冲上过GitHub热榜第一,到现在已累积1.8w星。现在更是开启了桌面版的提前排队,这下不熟悉终

中电金信:ChatGPT一夜爆火,知识图谱何以应战?

                         随着ChatGPT的爆火出圈                       人工智能再次迎来发展小高潮                      那么作为此前搜索领域的主流技术                         知识图谱前路又将如何呢?事实上,ChatGPT也并非“万能”,作为黑箱模型,ChatGPT很难验证生成的知识是否准确。并且ChatGPT是通过概率模型执行推理的,这也使得它在对知识精准性要求高的领域比较难真正落地。反观知识图谱(KnowledgeGraph),其作为一种用于描述复杂知识的数据模型,本质是一种语义网络,主要目的

李云龙、谢耳朵专业陪聊!角色扮演系统ChatHaruhi爆火:支持32个中外角色,开源5.4万条对话数据

「角色扮演」是大型语言模型众多应用场景中比较有意思的,LLM可以用指定角色的口吻跟用户对话,还可以实现诸如「乔布斯与苏格拉底」的超时空交流。很多公司也发布了基于语言模型的角色扮演产品,如Glow,Character.AI等,用户可以轻松打造出一个「赛博老婆」,在游戏、创意产业等领域都有许多潜在的应用场景。最近,GitHub上开源一个好玩的角色扮演聊天系统「Chat凉宫春日」,基于中文语言模型「骆驼」(Luotuo),可以模仿32位中外角色的对话风格,同时提供超过5.4万个对话数据集。项目链接:https://github.com/LC1332/ChatHaruhi-Suzumiya论文链接:h

Bun 1.0 正式发布,爆火的前端运行时,速度遥遥领先!

9月8日,前端运行时Bun1.0正式发布,如今,Bun已经稳定并且适用于生产环境。Bun不仅是一个专注性能与开发者体验的全新JavaScript运行时,还是一个快速的、全能的工具包,可用于运行、构建、测试和调试JavaScript和TypeScript代码,无论是单个文件还是完整的全栈应用。2022年7月,Bun发布,随即爆火,成为年度最火的前端项目:Bun的流行程度伴随着在去年夏天发布的第一个Beta版而爆炸性增长:仅一个月内,就在GitHub上获得了超过两万颗Star。Bun不仅仅是一个运行时。它也是:一个包管理器(类似Yarn、NPM、PNPM)一个构建工具(类似Webpack、ESBu

这二维码也太美了吧!利用AI绘画[Stable Diffusion的 ControlNet]生成爆火的艺术风格二维码

文章目录引子爆火的艺术二维码这种艺术二维码是如何制作出来的ControlNet介绍ControlNet的限制条件边缘检测示例人体姿态检测示例使用Canny边缘检测和Openpose有什么区别?安装稳定扩散控制网ControlNet安装ControlNet更新ControlNet扩展如何使用StableDiffusion生成艺术二维码生成二维码效果引子先看两张图上面的话是两张有效的二维码,只要你拿起手机扫描这些图像,是可以扫出内容的。是不是难以置信?爆火的艺术二维码最近,在互联网上疯传一种崭新形式的二维码,它们摆脱了传统黑白方块的外观,而是呈现出令人赏心悦目的图像,一眼望去令人印象深刻。这种艺术