提示词中加上“深呼吸”,AI大模型数学成绩就能再涨8.4分!谷歌DeepMind团队最新发现,用这个新“咒语”(Takeadeepbreath)结合大家已经熟悉的“一步一步地想”(Let’sthinkstepbystep),大模型在GSM8K数据集上的成绩就从71.8提高到80.2分。而且这个最有效的提示词,是AI自己找出来的。有网友开玩笑说,深呼吸以后,散热风扇就转速就提高了。也有人表示,刚高薪入职的提示工程师们也应该深呼吸,工作可能干不久了相关论文《大语言模型是优化器》,再次引起轰动。具体来说,大模型自己设计的提示词在Big-BenchHard数据集上最高提升50%。也有人的关注点在“不同
AI发展到现在,到底是否具有了意识?前几天,由图灵奖得主Benjio参与的一个研究项目刊登上了Nature,给出了一个初步的答案:现在没有,但是未来可能有。按照这个研究中的说法,AI现在还不具备意识,但是已经有了意识的雏形。在未来的某一天,可能AI真的能像生物一样进化出全面的感知能力。然而,OpenAI和NYU,牛津大学的研究人员的一项新研究进一步表明,AI可能具有感知自己状态的能力!https://owainevans.github.io/awareness_berglund.pdf具体来说,研究人员设想了一种情况,就是在对AI进行安全性检测的时候,如果AI能知道现它完成的任务目的是为了检测
考虑到几十年来新闻头条和科幻小说都在预测AI将如何很快取代从卡车司机和商场警察到艺术家和首席执行官的一切,这似乎是一个令人震惊的断言。然而,这些担忧忽略了一个重要的考虑:AI操纵杆背后的人,以及他们将继续受到人性驱动的事实。人类的本性,人类的工作人们被成功的欲望所驱使,而不仅仅是为了生存。普林斯顿大学的一项研究发现,收入最高的人往往工作时间更长,花在休闲或社交活动上的时间更少。当《纽约时报》问为什么许多超级富豪在他们的经济需求得到满足后还会继续工作很长时间,答案很简单:“富人是沉迷于金钱、竞争,还是只觉得自己很重要?是的。“。人们可能会对其中的措辞吹毛求疵,但重点仍然是:获得并保持地位仍然是成
机器人技术已经从科幻小说的概念发展成为正在改变各行各业、改善人类生活的现实。本文探讨了机器人技术的进步、在各个行业的应用,以及彻底改变我们工作、生活和互动方式的潜力。工业自动化:提高效率和安全性机器人技术和自动化技术彻底改变了制造业和工业流程。机器人可以精确、快速、一致地执行重复性和危险的任务,从而提高生产力和工作场所安全性。医疗保健机器人:彻底改变患者护理机器人技术在医疗保健、协助手术、康复和护理方面取得了重大进展。手术机器人可实现微创手术,减少患者创伤,并缩短康复时间。机器人外骨骼有助于康复,而伴侣机器人则为老年人和残疾人提供情感支持和帮助。自动驾驶汽车:重塑交通自动驾驶汽车,包括自动驾驶
「人类可能在2030年之前,开发出AGI」。SamAltman在最近的播客采访中透露,GPT-10就是AGI,它比全世界所有人加起来还要聪明!而当主持人问道,如何定义AGI?Altman称:如果我们能够开发出一个系统,能自主研发出人类无法研发出的科学知识时,我就会称这个系统为AGI。ChatGPT的横空出世,已经在世界各地掀起了巨大的冲击波,远远超过AlphaGo人机大战的反响。或许你会问,OpenAI究竟想要的是什么?WIRED在本期的封面报道中,深度分析了OpenAI的雄心、战略,以及它在企业发展过程中保留实验室文化的尝试。文章指出,OpenAI的最终的目标:改变一切。其中还有有趣的一点是
3月29日,非营利组织“未来生命研究所(FutureofLifeInstitute)”发表了一封题为“暂停巨型AI实验”的公开信,呼吁全球的AI实验室暂停训练比GPT-4更强大的系统至少6个月,并在此期间开发出一份针对AI的共享安全协议,必要时需要政府介入。1000多名科技人士在这份公开信上签名,包括特斯拉CEO马斯克、StabilityAI的CEOEmadMostaque等企业掌门人,也包括Alphabet旗下DeepMin的研究人员,还有诸如图灵奖得主YoshuaBengio这样的重量级学者。当然,也有人表达了不同意见,认为这是在阻碍技术进步。开发出GPT-4模型的OpenAI公司内还没有
AI真的把人类工作抢走了——知名科技网站Gizmodo被爆西班牙语频道翻译员集体被炒。甚至元老级人物也被裁了,之后翻译工作将由AI接手。其中,在这家公司已经待了13年的老编辑MatíasS.Zavia还表示:自己还是通过视频会议被告知的。被炒后,MatíasS.Zavia在社交媒体无奈发帖求职:家人们,上周二,GizmodoES变成了一个AI自动翻译发布平台,AI真的夺走了我的工作。我很快就会寻找新的工作。我有13年工作经验,如果你们有了解的符合我的工作机会,我将非常感激你们的帮助。与此同时,网友也看不下去了:昨天就注意到一些文章写作质量下降了。我还以为这是一个写作测试,但看来不是,所以我把它
打造能自己写代码的机器,这是计算机科学和人工智能先锋者一直在追寻的目标。而随着GPT类大模型的快速发展,这样的目标正在从遥不可及开始变得近在咫尺。大语言模型(LargeLanguageModels)的出现,让模型的编程能力越来越受到研究者的关注。在此态势下,上海交通大学APEX实验室推出了CodeApex--一个专注于评估LLMs的编程理解和代码生成能力的双语基准数据集。在评估大语言模型的编程理解能力上,CodeApex设计了三种类型的选择题:概念理解、常识推理和多跳推理。此外,CodeApex也利用算法问题和相应的测试用例来评估LLMs的代码生成能力。CodeApex总共评估了14个大语言模
随着人工智能技术的快速发展,它在图像识别、语音识别等很多领域已经取得了巨大进步,并在一些领域开始接近或超过人类的能力。尽管如此,人工智能相比人类的智能在许多方面还存在明显的局限性:同理心与情商:虽然在某些专注的领域人工智能展现出一些类人的同理心,例如:在聊天对话中显露出的同理心和关心,但相比人类而言这仅仅是皮毛。人类可以感受他人的情绪变化并作出符合情境的回应,而人工智能不具备这种深层次的情感理解能力。创造力和想象力:在特定的任务上,有了一定创造性,如:图形生成、文本创作等。人工智能的创造主要是基于对大规模数据的分析整合。而人类富有创造力的思维和丰富的想象力,通过想象力可以创造出新的概念和设计。
如果说,RLHF中的「人类」被取代,可行吗?谷歌团队的最新研究提出了,用大模型替代人类,进行偏好标注,也就是AI反馈强化学习(RLAIF)。论文地址:https://arxiv.org/abs/2309.00267结果发现,RLAIF可以在不依赖人类标注员的情况下,产生与RLHF相当的改进效果,胜率50%。同时,谷歌研究再次证明了RLAIF和RLHF,比起监督微调(SFT)胜率都超过了70%。如今,大型语言模型训练中一个关键部分便是RLHF。人类通过对AI输出的质量进行评级,让回应更加有用。但是,这需要付出很多的努力,包括让许多标注人员暴露在AI输出的有害内容中。既然RLAIF能够与RLHF相