大世界_草庐IT

读人工不智能：计算机如何误解世界笔记06_机器学习

1. 技术世界1.1. 为了创造一个更加公正的技术世界，我们在创造技术的时候，需要接受更多不同的声音1.2. 在计算机科学中，很难说清楚‘简单’和‘几乎不可能’的区别1.3. 谈论计算太难了，这导致了很多误解1.3.1. 计算机在某些方面表现得非常优秀，而在另外一些方面表现得非常糟糕1.3.2. 当人们误判计算机在执行任务时的参与程度时，社会问题就会产生1.4. 蹒跚学步的孩子一般可以在不踩到玩具的情况下在房间内行走（当然，她可能会偏不这样干），但机器人做不到1.5. 使用机器人

【Python百宝箱】声音的数字化探索：Python引领音频奇妙世界

Python音频魔力：数字化时代的声音创意探索前言在数字化时代，声音技术的迅速发展不仅革新了音乐产业，也在语音识别、虚拟现实、智能系统等领域引发了革命性变革。Python作为强大的编程语言，引领着音频处理与分析的新潮流。本文将探索Python在音频领域的广泛应用，从声音数据的处理到创意性应用。文章目录Python音频魔力：数字化时代的声音创意探索前言1.`librosa`介绍与应用1.1加载音频文件和波形可视化1.2音频特征提取1.3节拍估计与音频分析1.4音频时间序列分析1.5音频频谱分析与可视化1.6音频时频图与色彩映射1.7混音和音频处理1.8实时音频处理与流式数据1.9实时音频可视化与

创意无限：用Midjourney探索Icon设计的奇妙世界-对比v6和v5版本

所有的提示词，gzh：七哥的AI日常hello，大家好，欢迎回来。在数字世界中，app应用程序已成为我们日常生活中不可或缺的一部分，一个精心设计的app图标是吸引用户注意力并留下深刻印象的关键。app图标的形状对其识别度和记忆度起着至关重要的作用。有些图标选择正方形或圆形等传统形状，而有些图标则采用更加独特和抽象的形式。有了Midjourney，您可以尝试不同的形状，找到最能代表您的应用程序身份和目的的形状。今天，我为大家精选了20多条midjourney提示词，这些提示词类型各异，功能独特，可以帮助你创建出引人注目的app应用程序图标，在众多图标中脱颖而出。我们将会为大家介绍以下5种类型的图

AI新工具(20240221) OOTDiffusion-虚拟试穿技术的实现；Groq-世界上最快的大模型，每秒可以输出近500个token

OOTDiffusion-虚拟试穿技术的实现OOTDiffusion是一种基于潜在扩散的虚拟试穿技术，其主要目的是通过实现控制性的换装融合，让用户能够在虚拟环境中试穿不同的服装。该技术通过融合最新的机器学习算法与图像处理技术，为用户提供了一种新颖的虚拟试穿体验。https://github.com/levihsu/OOTDiffusionSoraWebui-使用文本和OpenAI的Sora模型在线生成视频SoraWebui是一个开源项目，它的主要功能是利用OpenAI开发的Sora模型，通过文本输入在线生成视频，非常简便易用，还支持一键式网站部署。https://github.com/Sora

华为云峰会2024，GaussDB扬帆出海，给世界一个更优选择

本文分享自华为云社区《华为云峰会2024，GaussDB扬帆出海，给世界一个更优选择》，作者：GaussDB数据库。2024年2月26~29日，由GSM协会主办的“2024年世界移动通信大会”（MobileWorldCongress2024，简称MWC2024）在西班牙巴塞罗那举行。MWC2024前夕，以“一切皆服务，加速千行万业智能升级”为主题的华为云峰会在当地成功举办。华为云CTO张宇昕峰会上，华为云CTO张宇昕发表了主题演讲。数据库是支撑企业智能升级的坚实数据底座，华为持续战略投入20余年，打造了新一代企业级分布式数据库GaussDB，广泛应用于金融、电信、政府等行业关键核心系统。华为云

南大俞扬深度解读：什么是「世界模型」？

随着媒体狂炒Sora，OpenAI的介绍材料中称Sora是「worldsimulator」，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论Sora是不是worldsimulator。什么是worldmodels/世界模型当AI领域中讲到世界/world、环境/environment这个词的时候，通常是为了与智能体/agent加以区分。研究智能体最多的领域，一个是强化学习，一个是机器人领域。因此可以看到，worldmodels、worldmodeling最早也最常出现在机器人领域的论文中。而今天worldmodels这个词影响最大的，可能是Jurgen

读人工不智能：计算机如何误解世界笔记05_人的问题

1. 人的问题1.1. 关于教育和数字技术的观点似乎来自很多不同的作者和思想家1.2. 计算机系统是它们制作者的代言人1.3. 由于历史上创建计算机系统的人并没有什么多样性可言，技术系统的设计和概念中有一些嵌入的信念，我们最好重新思考并做出修改1.4. 数据问题就是人的问题1.4.1. 我们总把数据看作不变的真理，却忘记了数据是由人类创建的，数据收集也是人类所为1.4.2. 需要有血肉之躯的人类去数一数学校的存书数量，然后把数字输入数据库1.4.3. 如果没有人来管理，再好的

Web Components，启动！带你走进 Web Components 的世界！

WebComponents是W3C制定的一套规范，它允许开发者创建可复用的自定义元素，这些元素可以像普通的HTML元素一样在DOM中使用。这些自定义元素封装了结构、样式和脚本，并且具有明确的接口，以便在其他Web应用中使用。WebComponents主要包括以下部分：CustomElements：允许开发者定义自己的HTML元素，这些元素具有封装好的结构、样式和脚本。CustomElements的接口可以让开发者在自定义元素上添加属性和方法，以扩展HTML的功能。ShadowDOM：为自定义元素提供了一个隔离的DOM环境，使得自定义元素的样式和脚本不会影响到其他元素。ShadowDOM使得开发

谷歌发布基础世界模型：11B参数，能生成可交互虚拟世界

Sora 问世才不到两个星期，谷歌的世界模型也来了，能力看起来更强大：它生成的虚拟世界「自主可控」。刚刚，谷歌定义了生成式AI的全新范式——生成式交互环境（Genie，GenerativeInteractiveEnvironments）。Genie是一个110亿参数的基础世界模型，可以通过单张图像提示生成可玩的交互式环境。我们可以用它从未见过的图像进行提示，然后与自己想象中的虚拟世界进行互动。不管是合成图像、照片甚至手绘草图，Genie都可以从中生成无穷无尽的可玩世界。Genie由三个部分组成：一个潜在动作模型，用于推断每对帧之间的潜在动作；一个视频tokenizer，用于将原始视频帧转换为离

LeCun怒斥Sora是世界模型，自回归LLM太简化了

最近几天，Sora成为了全世界关注的焦点。与之相关的一切，都被放大到极致。Sora如此出圈，不仅在于它能输出高质量的视频，更在于OpenAI将其定义为一个「世界模拟器」（worldsimulators）。英伟达高级研究科学家JimFan甚至断言：「Sora是一个数据驱动的物理引擎」，「是一个可学习的模拟器，或『世界模型』」。「Sora是世界模型」这种观点，让一直将「世界模型」作为研究重心的图灵奖得主YannLeCun有些坐不住了。在LeCun看来，仅仅根据prompt生成逼真视频并不能代表一个模型理解了物理世界，生成视频的过程与基于世界模型的因果预测完全不同。图源：https://twitte