来了_草庐IT

实现输入到输出「模态自由」, NUS华人团队开源NExT-GPT，最接近AGI的大一统多模态大模型来了

ChatGPT的诞生，引爆了2023年的基于大语言模型的AI浪潮，此后各类开源大语言模型陆续问世，包括Flan-T5、Vicuna、LLaMA、Alpaca等。随后，社区继续发力，为模拟这个多模态的世界，研究者们将纯语言的大模型扩展到了处理语言之外的多模态大语言模型，诸如支持图像类的MiniGPT-4、BLIP-2、Flamingo、InstructBLIP等，支持视频类的Video-LLaMA、PandaGPT等，以及支持声音类的SpeechGPT等等。但目前的多模态大语言模型，距离真正人类级别的AGI，总感觉少了点「内味」。没错，人类的认知和沟通必须无缝地在任何信息模态之间进行转换。作为人

JDK21来了！附重要更新说明

JDK21计划23年9月19日正式发布，虽然一直以来都是“版本随便出，换8算我输”，但这么多年这么多版本的折腾，如果说之前的LTS版本JDK17你还觉得不香，那JDK21还是有必要关注一下，因为会有一批重要更新发布到生产环境中，特别是千呼万唤的虚拟线程，虽然说这东西我感觉不需要的用不到，需要的早都转go了，哈哈，但作为近几年JDK一个“重大”的更新，在实际开发应用中还是是有很大价值的。所以这篇文章主要提取了这次更新中个人感觉比较有价值的几点做个基本的介绍，想要尝鲜的同学可以看下。VisualThreads（虚拟线程）-JEP444先看下官方对虚拟线程（VisualThreads）描述：Toda

承载22倍于自身重量前行，垂直跳跃59厘米，用爆炸驱动的昆虫机器人来了

小小机器人能量大爆发，身体如昆虫一般大小，却可以携带22倍于自身重量的物品，爬行、跳跃都不是问题。高于自身几倍的跳台，机器人一下子就跳上去了：更高的高度也是可以的：负重物前行：这款机器人由来自康奈尔大学的研究者研发，该机器人长29毫米，重量仅为1.6克，可以垂直跳跃59厘米，并且可以携带22倍（36克）于自身重量的物品行走。相关论文《Powerful,softcombustionactuatorsforinsect-scalerobots》发表在Science上。论文地址：https://www.science.org/doi/10.1126/science.adg5067该研究利用内燃机解决

8K视频来了，8K 视频编辑的最低系统要求

当今RED、Canon、Ikegami、Sony等公司的8K摄像机以及8K电视，许多视频内容制作人和电影制作人正在认真考虑8K拍摄、编辑和后期处理，需要什么样的系统来处理如此海量的数据？中央处理器（CPU）首先，我们将从CPU（计算机的大脑）开始，这可以说是最重要的部分。为什么它是最重要的？您使用的CPU将严重影响您的系统在视频编辑和渲染方面的速度。用于8K编辑的一种强大的CPU选项是IntelCoreI7-12700K处理器，它具有12核和20线程的性能。这将花费您大约2000元。另一个更强大的CPU核心是IntelCorei9-12900K处理器，拥有16核心24线程的性能。只比I7贵几百

Nginx神奇的499竟然不在HTTP响应码标准内？快来了解一下！

1前言高性能的HTTP和反向代理服务器，Nginx用来：搭建WebServer作负载均衡供配置的日志字段丰富，从各类HTTP头部到内部性能数据都有Nginx的访问日志中，存在499状态码的日志。但常见4xx状态码只有400、401、403、404等，499并未在HTTPRFC文档。这499错误日志，在流量较大场景下，特别是面向Internet的Web站点场景下还是很常见。2案例某客户反馈：Nginx服务器连续几天记录较多499错误日志，之后几天趋零，再回升，整体状况不定。经营的ToC产品，跟手机端App协同。App会定时把消息上传到微信消息网关，后者再把这些消息推送到该客户的服务端（在公有云上

反驳来了！放弃TypeScript？说明你无知！

作者| RobertVitonsky编译 |云中几天前，汉森(DavidHeinemeierHansson)宣布Turbo8即将放弃TypeScript。我心想：放弃就放弃吧，反正我也不知道Turbo8是什么鬼。然而，在过去的几年里，一些前端程序员试图向我推销“TypeScript没用，只测着玩玩”的想法。我认为，有这种观点的人要么不关心代码质量，要么根本不知道TypeScript是什么。在这里，我将解释为什么应该使用TypeScript。注：本文作者Vitonsky是一名超过10年的有着复杂项目的前端大牛，参与了许多开源项目的开发：比如翻译网站的浏览器插件Linguist、模块UI工具Ele

大模型「上车」关键一步：全球首个语言+自动驾驶开源数据集来了

DriveLM是一个基于语言的驱动项目，它包含一个数据集和一个模型。通过DriveLM，我们介绍了自动驾驶（AD）中大型语言模型的推理能力，以做出决策并确保可解释的规划。在DriveLM的数据集中，将人工书写的推理逻辑作为连接，促进感知、预测和规划（P3）。在模型中，我们提出了一个具有思维图能力的AD视觉语言模型，以产生更好的规划结果。目前，数据集的演示已经发布，完整的数据集和模型将在未来发布。项目链接：https://github.com/OpenDriveLab/DriveLMWhatisGraph-of-ThoughtsinAD?数据集最令人兴奋的方面是，P3中的问答（QA）以图形风格的

【中科院】新一代人工智能大模型——紫东太初2.0 发布 —— 六月起AI大模型产品和应用迎来了集中发布

【中科院：自主研制新一代人工智能大模型问世】中国科学院自动化研究所今天（16日）上午在上海发布了该所研制的新一代人工智能大模型——紫东太初2.0。全新大模型相比第一代着力提升了决策与判断能力，实现了从感知、认知到决策的跨越，未来将在医疗、交通、工业生产等领域发挥更大作用。　　中国科学院自动化研究所今天（16日）上午在上海发布了该所研制的新一代人工智能大模型——紫东太初2.0。全新大模型相比第一代着力提升了决策与判断能力，实现了从感知、认知到决策的跨越，未来将在医疗、交通、工业生产等领域发挥更大作用。人工智能大模型是一个庞大复杂的网络系统，类似于人的大脑，其中的节点和数据量越多，处理能力也越强大

新编儿时童话【389】小花猫流浪记之热带雨林217---来了，话痨？

鲁迅口吻表达穷：我裤子后面又两个兜，一个是空的，另一个也是空的。大抵是我的口袋，清高了，世俗的铜臭味已经入不了它的世界。→【新人0元开通简书会员，可获大熊400万权重点赞助力！】“哎呀，灰灰呀，灰灰呀，灰灰呀，我叫你，你怎么不应我啊？呼呼······呼呼······”······“你呀你，你不是我们家耳朵最好使的吗？”······“我·······我我嗓子都喊哑了！你不应我，我就得继续喊你，嗓子都喊疼了，你不应我，我就继续喊，然后嗓子继续疼。疼到最后说不出话来了，这就是你的目的吧，你就是故意的，你嫉妒我嗓子比你好，嗓音比你动听，你你你太恶毒了······你·····呼呼呼······”····

北航打破模态壁垒，跨可见光-红外模态的通用物理对抗打击方法来了

近年来，针对视觉感知系统安全性评估的探索逐步深入，先后有研究者成功实现基于眼镜、贴纸、衣服等不同载体的可见光模态安全评估技术，也有一些针对红外模态的新尝试。但是它们都只能作用于单一模态。随着人工智能技术的发展，可见光-热红外成像技术已同时应用于治安监控、自动驾驶等诸多安全关键任务中，其中可见光成像可以在白天提供丰富的纹理信息，红外成像则可以在夜间清晰显示目标的热辐射分布，二者结合更为视觉感知系统带来24小时全覆盖和不受环境局限等诸多优势。因此，针对多模态视觉感知系统的统一安全评估方法也亟须研究。然而，实现多模态评估极具挑战性。首先，在不同成像机制下打击方法通用难。以前的方法都分别基于特定目标模