草庐IT

大世界

全部标签

读人工不智能:计算机如何误解世界笔记06_机器学习

1.      技术世界1.1.        为了创造一个更加公正的技术世界,我们在创造技术的时候,需要接受更多不同的声音1.2.        在计算机科学中,很难说清楚‘简单’和‘几乎不可能’的区别1.3.        谈论计算太难了,这导致了很多误解1.3.1.          计算机在某些方面表现得非常优秀,而在另外一些方面表现得非常糟糕1.3.2.          当人们误判计算机在执行任务时的参与程度时,社会问题就会产生1.4.        蹒跚学步的孩子一般可以在不踩到玩具的情况下在房间内行走(当然,她可能会偏不这样干),但机器人做不到1.5.        使用机器人

【Python百宝箱】声音的数字化探索:Python引领音频奇妙世界

Python音频魔力:数字化时代的声音创意探索前言在数字化时代,声音技术的迅速发展不仅革新了音乐产业,也在语音识别、虚拟现实、智能系统等领域引发了革命性变革。Python作为强大的编程语言,引领着音频处理与分析的新潮流。本文将探索Python在音频领域的广泛应用,从声音数据的处理到创意性应用。文章目录Python音频魔力:数字化时代的声音创意探索前言1.`librosa`介绍与应用1.1加载音频文件和波形可视化1.2音频特征提取1.3节拍估计与音频分析1.4音频时间序列分析1.5音频频谱分析与可视化1.6音频时频图与色彩映射1.7混音和音频处理1.8实时音频处理与流式数据1.9实时音频可视化与

创意无限:用Midjourney探索Icon设计的奇妙世界-对比v6和v5版本

所有的提示词,gzh:七哥的AI日常hello,大家好,欢迎回来。在数字世界中,app应用程序已成为我们日常生活中不可或缺的一部分,一个精心设计的app图标是吸引用户注意力并留下深刻印象的关键。app图标的形状对其识别度和记忆度起着至关重要的作用。有些图标选择正方形或圆形等传统形状,而有些图标则采用更加独特和抽象的形式。有了Midjourney,您可以尝试不同的形状,找到最能代表您的应用程序身份和目的的形状。今天,我为大家精选了20多条midjourney提示词,这些提示词类型各异,功能独特,可以帮助你创建出引人注目的app应用程序图标,在众多图标中脱颖而出。我们将会为大家介绍以下5种类型的图

AI新工具(20240221) OOTDiffusion-虚拟试穿技术的实现;Groq-世界上最快的大模型,每秒可以输出近500个token

OOTDiffusion-虚拟试穿技术的实现OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够在虚拟环境中试穿不同的服装。该技术通过融合最新的机器学习算法与图像处理技术,为用户提供了一种新颖的虚拟试穿体验。https://github.com/levihsu/OOTDiffusionSoraWebui-使用文本和OpenAI的Sora模型在线生成视频SoraWebui是一个开源项目,它的主要功能是利用OpenAI开发的Sora模型,通过文本输入在线生成视频,非常简便易用,还支持一键式网站部署。https://github.com/Sora

华为云峰会2024,GaussDB扬帆出海,给世界一个更优选择

本文分享自华为云社区《华为云峰会2024,GaussDB扬帆出海,给世界一个更优选择》,作者:GaussDB数据库。2024年2月26~29日,由GSM协会主办的“2024年世界移动通信大会”(MobileWorldCongress2024,简称MWC2024)在西班牙巴塞罗那举行。MWC2024前夕,以“一切皆服务,加速千行万业智能升级”为主题的华为云峰会在当地成功举办。华为云CTO张宇昕峰会上,华为云CTO张宇昕发表了主题演讲。数据库是支撑企业智能升级的坚实数据底座,华为持续战略投入20余年,打造了新一代企业级分布式数据库GaussDB,广泛应用于金融、电信、政府等行业关键核心系统。华为云

南大俞扬深度解读:什么是「世界模型」?

随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「worldsimulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论Sora是不是worldsimulator。什么是worldmodels/世界模型当AI领域中讲到世界/world、环境/environment这个词的时候,通常是为了与智能体/agent加以区分。研究智能体最多的领域,一个是强化学习,一个是机器人领域。因此可以看到,worldmodels、worldmodeling最早也最常出现在机器人领域的论文中。而今天worldmodels这个词影响最大的,可能是Jurgen

读人工不智能:计算机如何误解世界笔记05_人的问题

1.      人的问题1.1.        关于教育和数字技术的观点似乎来自很多不同的作者和思想家1.2.        计算机系统是它们制作者的代言人1.3.        由于历史上创建计算机系统的人并没有什么多样性可言,技术系统的设计和概念中有一些嵌入的信念,我们最好重新思考并做出修改1.4.        数据问题就是人的问题1.4.1.          我们总把数据看作不变的真理,却忘记了数据是由人类创建的,数据收集也是人类所为1.4.2.          需要有血肉之躯的人类去数一数学校的存书数量,然后把数字输入数据库1.4.3.          如果没有人来管理,再好的

Web Components,启动!带你走进 Web Components 的世界!

WebComponents是W3C制定的一套规范,它允许开发者创建可复用的自定义元素,这些元素可以像普通的HTML元素一样在DOM中使用。这些自定义元素封装了结构、样式和脚本,并且具有明确的接口,以便在其他Web应用中使用。WebComponents主要包括以下部分:CustomElements:允许开发者定义自己的HTML元素,这些元素具有封装好的结构、样式和脚本。CustomElements的接口可以让开发者在自定义元素上添加属性和方法,以扩展HTML的功能。ShadowDOM:为自定义元素提供了一个隔离的DOM环境,使得自定义元素的样式和脚本不会影响到其他元素。ShadowDOM使得开发

谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

Sora 问世才不到两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。刚刚,谷歌定义了生成式AI的全新范式——生成式交互环境(Genie,GenerativeInteractiveEnvironments)。Genie是一个110亿参数的基础世界模型,可以通过单张图像提示生成可玩的交互式环境。我们可以用它从未见过的图像进行提示,然后与自己想象中的虚拟世界进行互动。不管是合成图像、照片甚至手绘草图,Genie都可以从中生成无穷无尽的可玩世界。Genie由三个部分组成:一个潜在动作模型,用于推断每对帧之间的潜在动作;一个视频tokenizer,用于将原始视频帧转换为离

LeCun怒斥Sora是世界模型,自回归LLM太简化了

最近几天,Sora成为了全世界关注的焦点。与之相关的一切,都被放大到极致。Sora如此出圈,不仅在于它能输出高质量的视频,更在于OpenAI将其定义为一个「世界模拟器」(worldsimulators)。英伟达高级研究科学家JimFan甚至断言:「Sora是一个数据驱动的物理引擎」,「是一个可学习的模拟器,或『世界模型』」。「Sora是世界模型」这种观点,让一直将「世界模型」作为研究重心的图灵奖得主YannLeCun有些坐不住了。在LeCun看来,仅仅根据prompt生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。图源:https://twitte