GPT2_草庐IT

OpenAI科学家Karpathy周末造出「婴儿Llama2」！GPT-4辅助写500行纯C代码，速揽1.6k星

你有没有想过仅用C语言去推理一个Llama2的baby模型？没有？现在就能做到了！就在刚刚过去的这个周末，OpenAI科学家AndrejKarpathy做了一个非常有趣的项目——llama2.c。项目灵感正是来自于之前的明星项目——llama.cpp首先，在PyTorch中训练一个较小的Llama2模型。然后，用500行代码在纯C环境下进行推理，并且无需任何依赖项。最后得到的预训练模型（基于TinyStories），可以在MacBookAirM1CPU上用fp32以每秒18个token的速度生成故事样本。图片llama2.c一经发布，就在GitHub上速揽1.6k星，并且还在快速攀升中。图片项

五分钟技术趣谈 | GPT-4——多模态大模型新特性与优势

Part01与GPT-3.5的区别1.1GPT-4文本输入字数大幅提升，可达25000字图片通常对语言模型来说，输入字数的提升有以下几个好处：(1)理解和回应更长的文本：随着模型的输入容量增加，GPT-4将能够处理更长的文本输入。这对于处理长篇文章、技术文档或复杂的问题陈述可能会更有优势，可以更全面地理解上下文，并给出更详细和准确的回答。(2)更好地处理上下文和连贯性：具备更大的输入容量有助于GPT-4更好地维护对话的上下文，并生成连贯的回应。更长的输入序列能提供更多关于对话历史和语境的信息，使其能够更好地理解用户的意图并生成更一致的回答。(3)支持更复杂的任务和需求：拥有更大的模型输入容量可

模态趣谈矩阵权重可以人工智能 ChatGPT GPT-4

从Chat-GPT看爆火技术概念及医疗领域科技与应用场景

作者：京东健康陈刚一、前言最近OpenAI在官网上宣告了多模态大模型GPT-4的诞生，它可能是迄今为止最好的多模态模型。主要更新内容如下：1.逻辑分析能力更加全面、「考试」能力大幅提升2.拥有了识图能力，可以进行更多元的交流3.回答更有条理，理解更加准确4.创作力大幅提升，可以进行更全面的创作双击编辑块引用内容近日、风靡全球的ChatGPT刷新了很多人对人机交互的认知，具有极高的灵活性和适应性，可以很容易的应用到各种不同的产业，引起了行业的诸多变革。ChatGPT的出现正在迅速改变如今的互联网局势，“AIGC”“人工智能”“搜索引擎”等话题迅速成为当下热点。众多互联网企业加速布局AI产业，可以

念及 Chat-GPT strong 的 https 人工智能

从Chat-GPT看爆火技术概念及医疗领域科技与应用场景

作者：京东健康陈刚一、前言最近OpenAI在官网上宣告了多模态大模型GPT-4的诞生，它可能是迄今为止最好的多模态模型。主要更新内容如下：1.逻辑分析能力更加全面、「考试」能力大幅提升2.拥有了识图能力，可以进行更多元的交流3.回答更有条理，理解更加准确4.创作力大幅提升，可以进行更全面的创作双击编辑块引用内容近日、风靡全球的ChatGPT刷新了很多人对人机交互的认知，具有极高的灵活性和适应性，可以很容易的应用到各种不同的产业，引起了行业的诸多变革。ChatGPT的出现正在迅速改变如今的互联网局势，“AIGC”“人工智能”“搜索引擎”等话题迅速成为当下热点。众多互联网企业加速布局AI产业，可以

念及 Chat-GPT strong 的 https 人工智能

GPT 吞噬一切！我们还需要编程语言吗？

本文由GPT-4所创作，配图由StableDoodle及ChatGPT们生成。编者按AGI的未来，究竟属于Rust还是Mojo？或者我们还需要编程语言吗？今天，LLVM之父、苹果的编程语言Swift之父、新编程语言Mojo之父ChrisLattner转了一篇题为「RustorMojoforthefutureofAI?」的文章，文章标题很吸睛，于是我综合使用了ChatGPT（GPT-3.5）、微软的BingAI、终于支持中文的GoogleBard和GPT-4轮番上阵来以这篇文章做素材写文章。结果非常明显，最终比较靠谱能采用的依然是GPT-4。但也有几点显著的不同：首先，让翻译，ChatGPT（G

编程语言吞噬 xff0c xff xff0 人工智能 gpt chatgpt bard rust mojo

击败Llama 2，抗衡GPT-3.5，Stability AI新模型登顶开源大模型排行榜

「我就午休了30分钟，我们的领域又变了？」在看到最新的开源大模型排行榜后，一位AI领域的创业者发出了灵魂追问。图片排行榜链接：https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard上图红框中的「新秀」是来自StabilityAI和CarperAIlab的两个大模型：FreeWilly1和FreeWilly2。刚刚，它们超越了Meta三天前发布的Llama-2-70b-hf，成功登顶HuggingFace的OpenLLM排行榜榜首。更引人注目的是，FreeWilly2在很多基准上还击败了ChatGPT（GPT-3.5），成

模型登顶 span text-align style 人工智能新闻开源

斯坦福大学实锤GPT-4变笨了！OpenAI最新回应：确实存在“智力下降”

图片大模型天花板GPT-4，它是不是……变笨了？之前有不少用户提出质疑，并晒出了不少证据。对此，OpenAI7月14日澄清：“我们没有把GPT4弄笨。相反的，我们的每个新版本，都让GPT4比以前更聪明了。”图片PeterWelinder是OpenAI的产品产品VP但为了验证OpenAI的说法，斯坦福大学和加利福尼亚大学伯克利分校的三位研究员调查了3月至6月期间ChatGPT性能的变化。图片论文地址：https://arxiv.org/abs/2307.09009评估的对象包括GPT-3.5和GPT-4两个大模型，并在四个任务上进行测试：数学问题、回答敏感/危险问题、代码生成以及视觉推理。调查结

斯坦福大学斯坦图片 GPT 模型人工智能 GPT-4 OpenAI

AI智能体联手GPT-4淘汰人类导演！模仿斯坦福西部世界拍出《南方公园》

AIAgent，又给我们带来了亿点点震撼——AI智能体直接晋升导演，拍出了一集《南方公园》！没错，编剧、动画、导演、语音、编辑……剧集制作的全流程，都是由AI完成。初创公司Fable新发布的节目统筹智能体（Showrunner），如同一声惊雷炸响。项目的灵感，就来自于此前斯坦福爆火的西部世界虚拟小镇论文，其中25个AI智能体居住在包含学校、医院、家庭的沙盒虚拟城镇中。而在这次的《南方公园》中，同样是一群AI角色通过复杂的社交互动来推动自己的日常生活，每个人都有自己独特的背景故事、个性和动机。图片论文地址：https://fablestudio.github.io/showrunner-agen

斯坦斯坦福 span text-align style 人工智能新闻 AI 导演

GPT-5只会更笨！斯坦福莱斯研究警告，AI训AI超过5次，模型反噬，性能大减

用AI生成的数据训练AI，不会有魔法，只会被反噬。近日，莱斯大学和斯坦福团队发现，将AI生成的内容喂给模型，只会导致性能下降。研究人员对此给出一种解释，叫做「模型自噬障碍」（MAD）。图片论文地址：https://arxiv.org/abs/2307.01850研究发现在使用AI数据，经过第5次迭代训练后，模型就会患上MAD。在合成数据上训练AI模型会逐渐放大伪影换句话说，如果不能给模型提供「新鲜的数据」，即由人类标注的数据，其输出质量将会受到严重影响。拒绝模型「内耗」目前，MAD尚未确认会影响所有AI模型，不过研究人员已经对自编码器、高斯混合模型、大语言模型进行了验证。作者写道，「世界正在奔

莱斯斯坦 span text-align style 人工智能新闻 AI 训练

GPT-4计算能力差怎么破？把它当小学生，保证结果跟计算器一样准

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。大语言模型的数学能力到底怎么破？一位数学本科生发现：实际上，咱们只需像一年级小学生一样教它们“掰着手指头算”，就能让它立马变身数学小能手。图片比如像“34756918247632+7934619867453210082”这样的大数加法，任你丢给哪个大模型，即使强如GPT-4，都算不明白。但如果你按照他说的做，保证结果跟用计算器摁出来的一模一样。具体怎么操作？像小学生一样教GPT-4我们就以上面的加法题为例，要想让GPT-4算对，需要给它举两个例子。但只需非常简单的那种就行，重点是把计算过程给它“掰开了揉碎了”讲出来。第

计算计算器 js_darkmode class darkmode 人工智能新闻模型