草庐IT

OpenAI科学家Karpathy周末造出「婴儿Llama2」!GPT-4辅助写500行纯C代码,速揽1.6k星

你有没有想过仅用C语言去推理一个Llama2的baby模型?没有?现在就能做到了!就在刚刚过去的这个周末,OpenAI科学家AndrejKarpathy做了一个非常有趣的项目——llama2.c。项目灵感正是来自于之前的明星项目——llama.cpp首先,在PyTorch中训练一个较小的Llama2模型。然后,用500行代码在纯C环境下进行推理,并且无需任何依赖项。最后得到的预训练模型(基于TinyStories),可以在MacBookAirM1CPU上用fp32以每秒18个token的速度生成故事样本。图片llama2.c一经发布,就在GitHub上速揽1.6k星,并且还在快速攀升中。图片项

五分钟技术趣谈 | GPT-4——多模态大模型新特性与优势

Part01与GPT-3.5的区别1.1GPT-4文本输入字数大幅提升,可达25000字图片通常对语言模型来说,输入字数的提升有以下几个好处:(1)理解和回应更长的文本:随着模型的输入容量增加,GPT-4将能够处理更长的文本输入。这对于处理长篇文章、技术文档或复杂的问题陈述可能会更有优势,可以更全面地理解上下文,并给出更详细和准确的回答。(2)更好地处理上下文和连贯性:具备更大的输入容量有助于GPT-4更好地维护对话的上下文,并生成连贯的回应。更长的输入序列能提供更多关于对话历史和语境的信息,使其能够更好地理解用户的意图并生成更一致的回答。(3)支持更复杂的任务和需求:拥有更大的模型输入容量可

从Chat-GPT看爆火技术概念及医疗领域科技与应用场景

作者:京东健康陈刚一、前言最近OpenAI在官网上宣告了多模态大模型GPT-4的诞生,它可能是迄今为止最好的多模态模型。主要更新内容如下:1.逻辑分析能力更加全面、「考试」能力大幅提升2.拥有了识图能力,可以进行更多元的交流3.回答更有条理,理解更加准确4.创作力大幅提升,可以进行更全面的创作双击编辑块引用内容近日、风靡全球的ChatGPT刷新了很多人对人机交互的认知,具有极高的灵活性和适应性,可以很容易的应用到各种不同的产业,引起了行业的诸多变革。ChatGPT的出现正在迅速改变如今的互联网局势,“AIGC”“人工智能”“搜索引擎”等话题迅速成为当下热点。众多互联网企业加速布局AI产业,可以

从Chat-GPT看爆火技术概念及医疗领域科技与应用场景

作者:京东健康陈刚一、前言最近OpenAI在官网上宣告了多模态大模型GPT-4的诞生,它可能是迄今为止最好的多模态模型。主要更新内容如下:1.逻辑分析能力更加全面、「考试」能力大幅提升2.拥有了识图能力,可以进行更多元的交流3.回答更有条理,理解更加准确4.创作力大幅提升,可以进行更全面的创作双击编辑块引用内容近日、风靡全球的ChatGPT刷新了很多人对人机交互的认知,具有极高的灵活性和适应性,可以很容易的应用到各种不同的产业,引起了行业的诸多变革。ChatGPT的出现正在迅速改变如今的互联网局势,“AIGC”“人工智能”“搜索引擎”等话题迅速成为当下热点。众多互联网企业加速布局AI产业,可以

GPT 吞噬一切!我们还需要编程语言吗?

本文由GPT-4所创作,配图由StableDoodle及ChatGPT们生成。编者按AGI的未来,究竟属于Rust还是Mojo?或者我们还需要编程语言吗?今天,LLVM之父、苹果的编程语言Swift之父、新编程语言Mojo之父ChrisLattner转了一篇题为「RustorMojoforthefutureofAI?」的文章,文章标题很吸睛,于是我综合使用了ChatGPT(GPT-3.5)、微软的BingAI、终于支持中文的GoogleBard和GPT-4轮番上阵来以这篇文章做素材写文章。结果非常明显,最终比较靠谱能采用的依然是GPT-4。但也有几点显著的不同:首先,让翻译,ChatGPT(G

击败Llama 2,抗衡GPT-3.5,Stability AI新模型登顶开源大模型排行榜

「我就午休了30分钟,我们的领域又变了?」在看到最新的开源大模型排行榜后,一位AI领域的创业者发出了灵魂追问。图片排行榜链接:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard上图红框中的「新秀」是来自StabilityAI和CarperAIlab的两个大模型:FreeWilly1和FreeWilly2。刚刚,它们超越了Meta三天前发布的Llama-2-70b-hf,成功登顶HuggingFace的OpenLLM排行榜榜首。更引人注目的是,FreeWilly2在很多基准上还击败了ChatGPT(GPT-3.5),成

斯坦福大学实锤GPT-4变笨了!OpenAI最新回应:确实存在“智力下降”

图片大模型天花板GPT-4,它是不是……变笨了?之前有不少用户提出质疑,并晒出了不少证据。对此,OpenAI7月14日澄清:“我们没有把GPT4弄笨。相反的,我们的每个新版本,都让GPT4比以前更聪明了。”图片PeterWelinder是OpenAI的产品产品VP但为了验证OpenAI的说法,斯坦福大学和加利福尼亚大学伯克利分校的三位研究员调查了3月至6月期间ChatGPT性能的变化。图片论文地址:https://arxiv.org/abs/2307.09009评估的对象包括GPT-3.5和GPT-4两个大模型,并在四个任务上进行测试:数学问题、回答敏感/危险问题、代码生成以及视觉推理。调查结

AI智能体联手GPT-4淘汰人类导演!模仿斯坦福西部世界拍出《南方公园》

AIAgent,又给我们带来了亿点点震撼——AI智能体直接晋升导演,拍出了一集《南方公园》!没错,编剧、动画、导演、语音、编辑……剧集制作的全流程,都是由AI完成。初创公司Fable新发布的节目统筹智能体(Showrunner),如同一声惊雷炸响。项目的灵感,就来自于此前斯坦福爆火的西部世界虚拟小镇论文,其中25个AI智能体居住在包含学校、医院、家庭的沙盒虚拟城镇中。而在这次的《南方公园》中,同样是一群AI角色通过复杂的社交互动来推动自己的日常生活,每个人都有自己独特的背景故事、个性和动机。图片论文地址:https://fablestudio.github.io/showrunner-agen

GPT-5只会更笨!斯坦福莱斯研究警告,AI训AI超过5次,模型反噬,性能大减

用AI生成的数据训练AI,不会有魔法,只会被反噬。近日,莱斯大学和斯坦福团队发现,将AI生成的内容喂给模型,只会导致性能下降。研究人员对此给出一种解释,叫做「模型自噬障碍」(MAD)。图片论文地址:https://arxiv.org/abs/2307.01850研究发现在使用AI数据,经过第5次迭代训练后,模型就会患上MAD。在合成数据上训练AI模型会逐渐放大伪影换句话说,如果不能给模型提供「新鲜的数据」,即由人类标注的数据,其输出质量将会受到严重影响。拒绝模型「内耗」目前,MAD尚未确认会影响所有AI模型,不过研究人员已经对自编码器、高斯混合模型、大语言模型进行了验证。作者写道,「世界正在奔

GPT-4计算能力差怎么破?把它当小学生,保证结果跟计算器一样准

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。大语言模型的数学能力到底怎么破?一位数学本科生发现:实际上,咱们只需像一年级小学生一样教它们“掰着手指头算”,就能让它立马变身数学小能手。图片比如像“34756918247632+7934619867453210082”这样的大数加法,任你丢给哪个大模型,即使强如GPT-4,都算不明白。但如果你按照他说的做,保证结果跟用计算器摁出来的一模一样。具体怎么操作?像小学生一样教GPT-4我们就以上面的加法题为例,要想让GPT-4算对,需要给它举两个例子。但只需非常简单的那种就行,重点是把计算过程给它“掰开了揉碎了”讲出来。第