Andrej_草庐IT

Andrej Karpathy：大模型有内存限制，这个妙招挺好用

「如今，LLM（大语言模型）并不是单点突破的——而是需要多个重要组件有效协同工作的系统。Speculativedecoding是帮助我们从系统角度思考的一个很好的例子。」爱丁堡大学博士生符尧表示道。符尧上述观点评论的是特斯拉前AI总监、年初重回OpenAI的AndrejKarpathy刚刚发布的一条推特。人形机器人公司1XTechnologies的AI副总裁EricJang评价道：「Karpathy很好的解释了LLM的speculativeexecution。其他自回归模型可能会以类似的方式加速。连续（扩散）模型可能从K步中获益较少（可能在第1步后偏离猜测），但可以将其应用于VQ-latent

好用妙招模型 token Speculative 开发语言大语言模型

回归OpenAI后首次演讲！李飞飞高徒Andrej Karpathy：GPT将走向何方？

一年一度的微软「Build开发者大会」前两天刚刚开幕。微软CEOSatyaNadella在发布会上介绍了这次主要的更新，以ChatGPT为代表的生成式AI成为本次大会的重中之重，其中包括自家的重头戏——WindowsCopilot。演讲视频链接：https://youtu.be/6PRiAexITSs前段时间刚宣布回归OpenAI的业界大牛、李飞飞高徒、特斯拉前AI总监AndrejKarpathy，也在大会发表了题为「GPT现状」（StateofGPT）的主题演讲。演讲内容主要包括了解ChatGPT等GPT助手的训练途径，他将其分为标记化（Tokenization）、预训练（Pretraini

何方高徒 style text-align align 人工智能新闻 AI 李飞飞

Andrej Karpathy | 详解神经网络和反向传播（基于 micrograd）

只要你懂Python，大概记得高中学过的求导知识，看完这个视频你还不理解反向传播和神经网络核心要点的话，那我就吃鞋:DAndrejKarpathy，前特斯拉AI高级总监、曾设计并担任斯坦福深度学习课程CS231n讲师、OpenAI创始成员和研究科学家。在7月离职特斯拉后，Andrej在家录制了一个详解反向传播的课程，自信表示“这是8年来领域内对神经网络和反向传播的最佳讲解”，并在推特打赌“看不懂就吃鞋”。虽然很想看Andrej直播吃鞋，但实话实说，作为小白的我，好像真的看懂了。课程视频【中英字幕】AndrejKarpathy|详解神经网络和反向传播（基于micrograd）字幕由矩池云翻译制作

反向详解 Andrej 特斯人工智能

Andrej Karpathy | 详解神经网络和反向传播（基于 micrograd）

只要你懂Python，大概记得高中学过的求导知识，看完这个视频你还不理解反向传播和神经网络核心要点的话，那我就吃鞋:DAndrejKarpathy，前特斯拉AI高级总监、曾设计并担任斯坦福深度学习课程CS231n讲师、OpenAI创始成员和研究科学家。在7月离职特斯拉后，Andrej在家录制了一个详解反向传播的课程，自信表示“这是8年来领域内对神经网络和反向传播的最佳讲解”，并在推特打赌“看不懂就吃鞋”。虽然很想看Andrej直播吃鞋，但实话实说，作为小白的我，好像真的看懂了。课程视频【中英字幕】AndrejKarpathy|详解神经网络和反向传播（基于micrograd）字幕由矩池云翻译制作

反向详解 Andrej 特斯人工智能