草庐IT

MIT-BEVFusion

全部标签

提示工程夭折?MIT斯坦福让大模型主动提问,自己搞明白你想要什么

我就说嘛,提示工程正在消失,这篇新研究即可解释原因。AI圈百万粉丝大V的一条推特,可把大家给惊到了。要知道,提示工程可是ChatGPT趋势中的大热词。由它衍生出的新岗位提示工程师年薪可高达几十万美元,“未来人人都要学会提示工程”的观点更是引发热议……结果现在,提示工程就开始消失了???而且有理有据。博主伊森·莫利克提到的这篇论文,由MIT、斯坦福和Anthropic(Claude2打造者)共同提出。论文提出了一种新型的机器学习框架,能让大模型学会主动向人类提问,自己搞明白用户的偏好。他们使用GPT-4进行实验,结果发现和提示工程、监督学习等方法比,在这个框架的辅助下GPT-4在多个任务上更懂人

专访MIT贾皓钧&段辰儒博士:AI4S时代的化学材料发现——「AI炼金术」

大家可能从小就听说过爱迪生尝试上千种材料作为灯丝,凭着不断试错方法以及永不言弃的精神,最后研发出日用白炽灯的故事——天才靠的是百分之一的灵感和百分之九十九的汗水。然而,随着科学的进步和现代社会的发展,新型材料的研发变得愈发复杂。现在,研究者经常需要在上百万大小的材料空间同时优化数十个不同的性质,以寻找适用于电池、半导体、催化剂和合金等领域的新材料。如果说爱迪生需要99%的汗水,那现在研究者可能需要99.99%的汗水。而新型材料的研发历程就有点像人们去「沙滩」上捡「贝壳」,在「沙滩」表面好找的贝壳在大家不断发掘下已经被拾的差不多了,更漂亮的「贝壳」却还埋在在更深的「沙滩」下面。这些「贝壳」可能用

GUN、MIT、Apache、BSD、MPL各种开源协议介绍和区别

文章目录目前主流的开源协议GNU通用公共许可证(GNUGeneralPublicLicense,GPL)MIT许可证Apache许可证BSD许可证MPLMozilla公共许可证(MozillaPublicLicense,MPL)各种主流开源协议的区别GNU通用公共许可证(GNUGeneralPublicLicense,GPL)MIT许可证Apache许可证BSD许可证主流开源协议的一些典型开源项目GNU通用公共许可证(GPL)MIT许可证Apache许可证BSD许可证Mozilla公共许可证(MPL)关于开源项目是否可以用来商用MIT许可证Apache许可证BSD许可证总结目前主流的开源协议目

03 MIT线性代数-矩阵乘法和逆矩阵Multiplication & inverse matrices

1.矩阵乘法Matrixmultiplication我们通过四种方法讨论如何使矩阵A与B相乘得到矩阵C。其中A为mxn(m行n列)矩阵,而B为nxp矩阵,则C为mxp矩阵,记cij为矩阵C中第i行第j列的元素1.1Regularway矩阵乘法的标准计算方法是通过矩阵A第i行的行向量和矩阵B 第j列的列向量点积得到cijeg.1.2Columnway列操作是指矩阵C的第j列是通过矩阵A乘以矩阵B第j列的列向量得到的。这表明矩阵C的列向量是矩阵A列向量的线性组合,组合的“权”就是矩阵B第j列的各个分量 ColumnofCarecombinationsofcolumnsofA1.3Rowway行操作

BEVFusion论文解读

论文链接:[2205.13542]BEVFusion:Multi-TaskMulti-SensorFusionwithUnifiedBird's-EyeViewRepresentation(arxiv.org)代码链接:BEVFusion:Multi-TaskMulti-SensorFusionwithUnifiedBird's-EyeViewRepresentation(github.com)摘要 多传感器融合对于精确可靠的自动驾驶系统至关重要。最近的方法是基于点级融合:用相机功能增强LiDAR点云。然而,相机到激光雷达的投影抛弃了相机特征的语义密度,阻碍了这种方法的有效性,特别是对于面向语

揭秘iPhone里的Transformer:基于GPT-2架构,分词器含emoji,MIT校友出品

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。苹果Transformer的“秘密”,让发烧友给扒出来了。大模型浪潮下,即使保守如苹果,也每逢发布会必提“Transformer”。比如,在今年的WWDC上,苹果就已宣布,船新版本的iOS和macOS将内置Transformer语言模型,以提供带文本预测功能的输入法。苹果官方没有透露更多信息,但技术爱好者们可坐不住了。一位名叫JackCook的小哥,就把macOSSonomabeta翻了个底朝天,结果,还真挖出不少新鲜信息:模型架构上,Cook小哥认为苹果的语言模型更像是基于GPT-2打造的。在分词器(tokenize

「字少信息量大」,Salesforce、MIT 研究者教 GPT-4「改稿」,数据集已开源

近年来,自动摘要技术取得了长足的进步,这主要归功于范式的转变——从在标注数据集上进行有监督微调转变为使用大语言模型(LLM)进行零样本prompt,例如GPT-4。不需要额外的训练,细致的prompt就能实现对摘要长度、主题、风格等方面特征的精细控制。但一个方面常常被忽视:摘要的信息密度。从理论上讲,作为对另一个文本的压缩,摘要应该比源文件更密集,也就是包含更多的信息。考虑到LLM解码的高延迟,用更少的字数涵盖更多的信息非常重要,尤其是对于实时应用而言。然而,信息量密度是一个开放式的问题:如果摘要包含的细节不足,那么相当于没有信息量;如果包含的信息过多,又不增加总长度,就会变得难以理解。要在固

老黄参投,MIT华人女科学家融资2亿美元!1万块H100训超千亿参数AI智能体

刚刚,又一家AI独角兽在硅谷诞生!这家华人女科学家创办的公司名为Imbue,近日获得了2亿美元融资,估值已达10亿美元。而Imbue也是少数创始人为女性的独角兽之一。不仅如此,Imbue还手握1万张英伟达H100显卡,硬通货已经不愁了。是的,你没猜错,这家AI独角兽,英伟达又投了!英伟达高级科学家JimFan也开心地发推祝贺:去年我们还一起在NeurIPS上一起谈论Avalon和MineDojo呢,现在Avalon背后的公司,已经成为独角兽了!这个故事告诉我们,不要忽视你在顶会上遇到的每个其貌不扬的研究者,说不准在哪天,他们的公司就会获得顶级融资,诞生下一个SamAltman。没有一份钱创收,

材料空间「填空解谜」:MIT 利用深度学习解决无损检测难题

内容一览:材料检测在工程、科学及制造业中扮演着至关重要的角色。传统的材料检测方法,例如切割和化学试剂检测具有破坏性,同时较为耗费时间和资源。近期,MIT科学家利用深度学习开发了一种技术,能够填补缺失信息,并进一步通过表面观察确定材料的内部结构。关键词:深度学习材料检测CNN作者|daserney编辑|三羊本文首发于HyperAI超神经微信公众平台~在数据处理时,经常遇到一种挑战,即从模糊的图像或部分信息中复原完整的图像。这种挑战被称为「逆问题」(inverseproblem),它不仅在医学诊断中普遍存在,也在材料科学中频繁出现。如果我们能够有效地填补这些缺失的信息,就有可能更全面、更准确地理解

吴恩达力赞!哈佛、MIT学者用下棋证明:大型语言模型确实「理解」了世界

2021年,华盛顿大学语言学家EmilyM.Bender发表了一篇论文,认为大型语言模型不过是「随机鹦鹉」(stochasticparrots)而已,它们并不理解真实世界,只是统计某个词语出现的概率,然后像鹦鹉一样随机产生看起来合理的字句。由于神经网络的不可解释性,学术界也弄不清楚语言模型到底是不是随机鹦鹉,各方观点差异分歧极大。由于缺乏广泛认可的测试,模型是否能「理解世界」也成为了哲学问题而非科学问题。最近,来自哈佛大学、麻省理工学院的研究人员共同发表了一项新研究Othello-GPT,在简单的棋盘游戏中验证了内部表征的有效性,他们认为语言模型的内部确实建立了一个世界模型,而不只是单纯的记忆