「如今,LLM(大语言模型)并不是单点突破的——而是需要多个重要组件有效协同工作的系统。Speculativedecoding是帮助我们从系统角度思考的一个很好的例子。」爱丁堡大学博士生符尧表示道。符尧上述观点评论的是特斯拉前AI总监、年初重回OpenAI的AndrejKarpathy刚刚发布的一条推特。人形机器人公司1XTechnologies的AI副总裁EricJang评价道:「Karpathy很好的解释了LLM的speculativeexecution。其他自回归模型可能会以类似的方式加速。连续(扩散)模型可能从K步中获益较少(可能在第1步后偏离猜测),但可以将其应用于VQ-latent
一年一度的微软「Build开发者大会」前两天刚刚开幕。微软CEOSatyaNadella在发布会上介绍了这次主要的更新,以ChatGPT为代表的生成式AI成为本次大会的重中之重,其中包括自家的重头戏——WindowsCopilot。演讲视频链接:https://youtu.be/6PRiAexITSs前段时间刚宣布回归OpenAI的业界大牛、李飞飞高徒、特斯拉前AI总监AndrejKarpathy,也在大会发表了题为「GPT现状」(StateofGPT)的主题演讲。演讲内容主要包括了解ChatGPT等GPT助手的训练途径,他将其分为标记化(Tokenization)、预训练(Pretraini
只要你懂Python,大概记得高中学过的求导知识,看完这个视频你还不理解反向传播和神经网络核心要点的话,那我就吃鞋:DAndrejKarpathy,前特斯拉AI高级总监、曾设计并担任斯坦福深度学习课程CS231n讲师、OpenAI创始成员和研究科学家。在7月离职特斯拉后,Andrej在家录制了一个详解反向传播的课程,自信表示“这是8年来领域内对神经网络和反向传播的最佳讲解”,并在推特打赌“看不懂就吃鞋”。虽然很想看Andrej直播吃鞋,但实话实说,作为小白的我,好像真的看懂了。课程视频【中英字幕】AndrejKarpathy|详解神经网络和反向传播(基于micrograd)字幕由矩池云翻译制作
只要你懂Python,大概记得高中学过的求导知识,看完这个视频你还不理解反向传播和神经网络核心要点的话,那我就吃鞋:DAndrejKarpathy,前特斯拉AI高级总监、曾设计并担任斯坦福深度学习课程CS231n讲师、OpenAI创始成员和研究科学家。在7月离职特斯拉后,Andrej在家录制了一个详解反向传播的课程,自信表示“这是8年来领域内对神经网络和反向传播的最佳讲解”,并在推特打赌“看不懂就吃鞋”。虽然很想看Andrej直播吃鞋,但实话实说,作为小白的我,好像真的看懂了。课程视频【中英字幕】AndrejKarpathy|详解神经网络和反向传播(基于micrograd)字幕由矩池云翻译制作