一觉醒来,斯坦福大模型Alpaca火了。没错,Alpaca是由Meta的LLaMA7B微调而来的全新模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。具体花费如下:在8个80GBA100上训练了3个小时,不到100美元;生成数据使用OpenAI的API,500美元。斯坦福大学计算机科学副教授PercyLiang称,由于缺乏透明度/无法完全访问像GPT3.5这样的有能力的指令模型,进而限制了这一重要领域的学术研究。我们在Alpaca(LLaMA7B+text-davinci-003)上迈出了一小步。看到又有人在自家大模型上取得了新的成果,YannLeCun疯狂
1956年,在达特茅斯学院召开的一个研讨会上,人工智能这一概念正式被提出。之后这个词一直挑战着心理学家、哲学家和计算机科学家,因为它太难被定义了。1994年,52名心理学家联合发文试图捕捉它的本质。随着时间的推移,研究者开始将注意力转移到特定领域的AI系统,如2016年AlphaGo挑战韩国冠军棋手大获全胜。之后,时间来到20世纪90年代末和21世纪初,研究者不满足于专用AI,因此开发更通用的人工智能系统呼声越来越高。随之而来的是,通用人工智能(AGI)一词开始在2000年代初期流行起来。最近一段时间,如大家所见,大型语言模型(LLM)走到聚光灯下,这些神经网络基于Transformer架构,
1956年,在达特茅斯学院召开的一个研讨会上,人工智能这一概念正式被提出。之后这个词一直挑战着心理学家、哲学家和计算机科学家,因为它太难被定义了。1994年,52名心理学家联合发文试图捕捉它的本质。随着时间的推移,研究者开始将注意力转移到特定领域的AI系统,如2016年AlphaGo挑战韩国冠军棋手大获全胜。之后,时间来到20世纪90年代末和21世纪初,研究者不满足于专用AI,因此开发更通用的人工智能系统呼声越来越高。随之而来的是,通用人工智能(AGI)一词开始在2000年代初期流行起来。最近一段时间,如大家所见,大型语言模型(LLM)走到聚光灯下,这些神经网络基于Transformer架构,