GPT-Engineer_草庐IT

GPT-4发布后，其他大模型怎么办？Yann LeCun：增强语言模型或许是条路

ChatGPT、GPT-4的火爆，让大型语言模型迎来了迄今为止的高光时刻。但下一步又该往何处去？YannLeCun最近参与的一项研究指出，增强语言模型或许是个极具潜力的方向。这是一篇综述文章，本文将简单介绍该论文的主要内容。研究背景大型语言模型极大地推动了自然语言处理的进步，相关技术造就了几个拥有数百万用户的产品，包括编码助手Copilot，谷歌搜索引擎以及最近大火的ChatGPT。将记忆与组合性功能相结合后，大型语言模型能够以超前的性能执行各种任务，如语言理解或条件和无条件文本生成，从而让更高带宽的人机交互成为现实。然而，大型语言模型依旧存在一些限制，妨碍其进行更广泛的部署。大型语言模型通常

许是 LeCun span font-size style 人工智能新闻 $模型 AI

GPT-4发布后，其他大模型怎么办？Yann LeCun：增强语言模型或许是条路

ChatGPT、GPT-4的火爆，让大型语言模型迎来了迄今为止的高光时刻。但下一步又该往何处去？YannLeCun最近参与的一项研究指出，增强语言模型或许是个极具潜力的方向。这是一篇综述文章，本文将简单介绍该论文的主要内容。研究背景大型语言模型极大地推动了自然语言处理的进步，相关技术造就了几个拥有数百万用户的产品，包括编码助手Copilot，谷歌搜索引擎以及最近大火的ChatGPT。将记忆与组合性功能相结合后，大型语言模型能够以超前的性能执行各种任务，如语言理解或条件和无条件文本生成，从而让更高带宽的人机交互成为现实。然而，大型语言模型依旧存在一些限制，妨碍其进行更广泛的部署。大型语言模型通常

许是 LeCun span font-size style 人工智能新闻 $模型 AI

斯坦福“草泥马”火了：100美元就能比肩GPT-3.5！手机都能运行的那种

一夜之间，大模型界又炸出个bignews！斯坦福发布Alpaca（羊驼，网友口中的“草泥马”）：只花100美元，人人都可微调Meta家70亿参数的LLaMA大模型，效果竟可比肩1750亿参数的GPT-3.5（text-davinci-003）。而且还是单卡就能运行的那种，甚至树莓派、手机都能hold住！还有一个更绝的“骚操作”。研究所涉及到的数据集，是斯坦福团队花了不到500美元用OpenAI的API来生成的。所以整个过程下来，就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。然后团队还说，用大多数云计算平台去微调训练好的模型，成本也不到100美元：复制一个GPT-3.5效果的AI，很便宜

斯坦比肩 visibility data-type style 人工智能 $代码 AI 绘画

斯坦福“草泥马”火了：100美元就能比肩GPT-3.5！手机都能运行的那种

一夜之间，大模型界又炸出个bignews！斯坦福发布Alpaca（羊驼，网友口中的“草泥马”）：只花100美元，人人都可微调Meta家70亿参数的LLaMA大模型，效果竟可比肩1750亿参数的GPT-3.5（text-davinci-003）。而且还是单卡就能运行的那种，甚至树莓派、手机都能hold住！还有一个更绝的“骚操作”。研究所涉及到的数据集，是斯坦福团队花了不到500美元用OpenAI的API来生成的。所以整个过程下来，就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。然后团队还说，用大多数云计算平台去微调训练好的模型，成本也不到100美元：复制一个GPT-3.5效果的AI，很便宜

斯坦比肩 visibility data-type style 人工智能 $代码 AI 绘画

GPT-3解数学题准确率升至92.5%！微软提出MathPrompter，无需微调即可打造「理科」语言模型

大型语言模型最为人诟病的缺点，除了一本正经地胡言乱语以外，估计就是「不会算数」了。比如一个需要多步推理的复杂数学问题，语言模型通常都无法给出正确答案，即便有「思维链」技术的加持，往往中间步骤也会出错。与文科类的自然语言理解任务不同，数学问题通常只有一个正确答案，在不那么开放的答案范围下，使得生成准确解的任务对大型语言模型来说更具挑战性。并且，在数学问题上，现有的语言模型通常不会对自己的答案提供置信度（confidence），让用户无从判断生成答案的可信度。为了解决这个问题，微软研究院提出了MathPrompter技术，可以提高LLM在算术问题上的性能，同时增加对预测的依赖。论文链接：https

数学题准确率 span style font-size 人工智能新闻 $ChatGPT 数学

GPT-3解数学题准确率升至92.5%！微软提出MathPrompter，无需微调即可打造「理科」语言模型

大型语言模型最为人诟病的缺点，除了一本正经地胡言乱语以外，估计就是「不会算数」了。比如一个需要多步推理的复杂数学问题，语言模型通常都无法给出正确答案，即便有「思维链」技术的加持，往往中间步骤也会出错。与文科类的自然语言理解任务不同，数学问题通常只有一个正确答案，在不那么开放的答案范围下，使得生成准确解的任务对大型语言模型来说更具挑战性。并且，在数学问题上，现有的语言模型通常不会对自己的答案提供置信度（confidence），让用户无从判断生成答案的可信度。为了解决这个问题，微软研究院提出了MathPrompter技术，可以提高LLM在算术问题上的性能，同时增加对预测的依赖。论文链接：https

数学题准确率 span style font-size 人工智能新闻 $ChatGPT 数学

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

昨天，百度没有现场demo的发布会，似乎被群嘲了一波。一位穿白衬衣、黑裤子，系一条白色腰带的美男子，给我们带来了一场中规中矩、似乎缺乏亮点的演示。不过，CEO的腰带和颜值倒是出了圈。有人调侃，这些天被ChatGPT、GPT-4整焦虑的人，发布会后忽然又觉得自己可以了。但是拿到内测码的小编，火速测评了一波。看着文心一言洋洋洒洒腾蛟起凤，感慨万千：或许，当时百度要是心一横，牙一咬，愿意在发布会上露一手，结果会大不一样。实测报告火热出炉！先来试试最近很火的一道鸡兔同笼题。因为这道题本身有问题，算出来结果是负的，所以经常被用来调戏各种「ChatGPT」们。如果只是单纯问这个问题，文心一言会非常机智地

大行林黛玉 visibility data-type visible 人工智能 $GPT-4 实测文心一言

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

昨天，百度没有现场demo的发布会，似乎被群嘲了一波。一位穿白衬衣、黑裤子，系一条白色腰带的美男子，给我们带来了一场中规中矩、似乎缺乏亮点的演示。不过，CEO的腰带和颜值倒是出了圈。有人调侃，这些天被ChatGPT、GPT-4整焦虑的人，发布会后忽然又觉得自己可以了。但是拿到内测码的小编，火速测评了一波。看着文心一言洋洋洒洒腾蛟起凤，感慨万千：或许，当时百度要是心一横，牙一咬，愿意在发布会上露一手，结果会大不一样。实测报告火热出炉！先来试试最近很火的一道鸡兔同笼题。因为这道题本身有问题，算出来结果是负的，所以经常被用来调戏各种「ChatGPT」们。如果只是单纯问这个问题，文心一言会非常机智地

大行林黛玉 visibility data-type visible 人工智能 $GPT-4 实测文心一言

LeCun狂赞：600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火，LLaMA杀疯了

一觉醒来，斯坦福大模型Alpaca火了。没错，Alpaca是由Meta的LLaMA7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。具体花费如下：在8个80GBA100上训练了3个小时，不到100美元；生成数据使用OpenAI的API，500美元。斯坦福大学计算机科学副教授PercyLiang称，由于缺乏透明度/无法完全访问像GPT3.5这样的有能力的指令模型，进而限制了这一重要领域的学术研究。我们在Alpaca（LLaMA7B+text-davinci-003）上迈出了一小步。看到又有人在自家大模型上取得了新的成果，YannLeCun疯狂

斯坦 LeCun span style font-size 人工智能新闻 $模型 AI

LeCun狂赞：600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火，LLaMA杀疯了

一觉醒来，斯坦福大模型Alpaca火了。没错，Alpaca是由Meta的LLaMA7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。具体花费如下：在8个80GBA100上训练了3个小时，不到100美元；生成数据使用OpenAI的API，500美元。斯坦福大学计算机科学副教授PercyLiang称，由于缺乏透明度/无法完全访问像GPT3.5这样的有能力的指令模型，进而限制了这一重要领域的学术研究。我们在Alpaca（LLaMA7B+text-davinci-003）上迈出了一小步。看到又有人在自家大模型上取得了新的成果，YannLeCun疯狂

斯坦 LeCun span style font-size 人工智能新闻 $模型 AI