gPt_草庐IT

微软仅凭「提示工程」让GPT-4成医学专家！超过一众高度微调模型，专业测试准确率首次超90%

微软最新研究再次证明了提示工程的威力——无需额外微调，无需专家策划，仅凭提示，GPT-4就能化身“专家”。使用他们提出的最新提示策略Medprompt，在医疗专业领域，GPT-4在MultiMedQA九个测试集中取得最优结果。在MedQA数据集(美国医师执照考试题)上，Medprompt让GPT-4的准确率首次超过90%，超越BioGPT和Med-PaLM等一众微调方法。研究人员还表示Medprompt方法是通用的，不仅适用于医学，还可以推广到电气工程、机器学习、法律等专业中。这项研究在X（原Twitter）一经分享，就引发众多网友关注。沃顿商学院教授EthanMollick、Artifici

计算机视觉GPT时刻！UC伯克利三巨头祭出首个纯CV大模型，推理惊现AGI火花

计算机视觉的GPT时刻，来了！最近，来自UC伯克利的计算机视觉「三巨头」联手推出了第一个无自然语言的纯视觉大模型（LargeVisionModels），并且第一次证明了纯视觉模型本身也是可扩展的（scalability）。除此之外，研究人员还利用超过420Btoken的数据集让模型可以通过上下文学习来理解并执行下游任务，并且统一了图片/视频、有监督/无监督、合成/真实、2D/3D/4D等几乎所有的数据形式。论文地址：https://arxiv.org/abs/2312.00785值得一提的是，让LVM做非语言类智商测试（Raven'sProgressiveMatrices）中常见的非语言推理问

NExT-GPT: Any-to-Any Multimodal LLM论文笔记

论文https://arxiv.org/pdf/2309.05519.pdf代码https://github.com/NExT-GPT/NExT-GPT/tree/main1.Motivation现有的多模态大模型大都只是支持输入端的多模态（Text、Image、Video、Audio等），但是输出端都是Text。也有一些现有的输入输出都是多模态的工作，如CoDi、Visual-ChatGPT、HuggingGPT等，这一类工作又存在下述问题因此，本文提出一种端到端训练的，支持任意模态输入输出MM-LLM（MultimodalLargeLanguageModel）——NExT-GPT。2.Ov

一、AI创作系统FireAI创作系统是一款基于OpenAI的ChatGPT进行开发的AI智能问答系统和Midjourney绘画系统。该系统支持OpenAI-GPT全模型和国内AI全模型的对接。经过整体测试，FireAI系统源码表现非常完美，可以说是国内目前最优秀的ChatGPT对接OpenAI软件系统之一。接下来，我将为您提供一个详细的图文教程，教您如何搭建和部署AI创作ChatGPT系统。本系统使用Nestjs+Vue+Typescript框架技术，并将AI能力持续集成到系统中。同时，该系统支持OpenAIDALL-E3文生图，并且已经支持最新的GPT-4多模态模型。此外，系统还支持国内AI

GPT-4没通过图灵测试！60年前老AI击败了ChatGPT，但人类胜率也仅有63%

长久以来，「图灵测试」成为了判断计算机是否具有「智能」的核心命题。上世纪60年代，曾由麻省理工团队开发了史上第一个基于规则的聊天机器人ELIZA，在这场测试中失败了。时间快进到现在，「地表最强」ChatGPT不仅能作图、写代码，还能胜任多种复杂任务，无「LLM」能敌。然而，ChatGPT却在最近一次测试中，败给了这个有近60年历史的聊天机器人ELIZA。来自UCSD的2位研究人员在一篇题为「GPT-4可以通过图灵测试吗」的研究中，证明了这一发现。论文中，研究人员将GPT-4、GPT-3.5、ELIZA、还有人类参与者作为研究对象，看看哪个能最成功地诱使人类参与者认为它是人类。论文地址：http

能耗比达到GPT-4 10倍！黄学东亲自解密Zoom AI的成功之道，AI伴侣直接替你开会

近日，AI大佬，现任ZoomCTO的黄学东，在自家的官网上发表了一篇博客。其中隆重介绍了自己加入Zoom六个月之后创新的成果——ZoomAICompanion，以及驱动ZoomAICompanion的Zoom联邦（federatedapproach）AI。在Zoom之前，黄学东曾担任微软AzureAI首席技术官，他不仅是微软首位全球华人技术院士，也是微软最高级别的华人科学家。黄学东在微软任职了超过30年，在他的牵线搭桥下，微软于1998年在北京建起第一个亚洲研究院。在2017年和2020年，黄学东分别当选ACM和IEEE会士，并于2023年同时当选美国国家工程院院士和美国艺术与科学院院士。黄学

GPT4有那么可怕吗？

一封联合信　　3月22号也就是一个月前，马斯克，对你没听错，就是前几天发射火箭失败爆炸的那个，他联合几千名科学家用一封公开信请愿暂停一切大型AI实验半年以上，这六个月的时间是用来做一份监督和规范AI发展的协议，避免AI的发展走向极端，超出人类的控制。　　现在这封公开信已经有超过3万人参与实名请愿。请愿名单里面不仅有图灵奖得主，马斯克，还有各大科技公司总裁和名校教授，这份名单汇聚了当今世界上一流的大脑，而则恐怕也是这个世纪以来这些大脑最团结一致的一次。这封信我非常推荐大家去读一读，就当锻炼英语阅读了。　　第一段直接就告诉我们，当下AI的野蛮生长完全不可控，目前没有人，甚至他们的创造者都无法理解，

一、AI创作系统SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT？小编这里写一个详细图文教程吧！本系统使用Nestjs+Vue+Typescript框架技术，持续集成AI能力到本系统。支持OpenAIDALL-E3文生图，支持最新GPT-4多模态模型。持GPT-4图片对话能力（上传图片并识图理解对话）,支持DALL-E3文生图。

【极客技术】真假GPT-4？微调 Llama 2 以替代 GPT-3.5/4 已然可行！

近日小编在使用最新版GPT-4-Turbo模型（主要特点是支持128k输入和知识库截止日期是2023年4月）时，发现不同商家提供的模型回复出现不一致的情况，尤其是模型均承认自己知识库达到2023年4月，但当我们细问时，FakeGPT4-Turbo（暂且这样称呼）出现了明显胡编乱造的情况，如下图所示：（其中一个是官方API直连一个是FakeGPT4-Turbo，你能区分出来吗？文末找答案~）思来想去，和同行讨论良久，不清楚是什么模型（最开始怀疑是官方GPT4-Turbo的幺蛾子，毕竟OpenAI最近漏洞百出...后来经过测试，官方模型没有发现明显问题，于是开始怀疑是XXX模型的微调版），遂开展相

用GPT-4V和人类演示训练机器人：眼睛学会了，手也能跟上

如何将语言/视觉输入转换为机器人动作？训练自定义模型的方法已经过时，基于最近大语言模型（LLM）和视觉语言模型（VLM）的技术进展，通过prompt工程使用ChatGPT或GPT-4等通用模型才是时下热门的方法。这种方法绕过了海量数据的收集和对模型的训练过程，展示出了强大的灵活性，而且对不同机器人硬件更具适应性，并增强了系统对研究和工业应用的可重用性。特别是最近出现了通用视觉大模型（VLM），如GPT-4V，将这些视觉系统集成到任务规划中，为开发基于多模态人类指令的任务规划器提供了可能性。在近期微软的一篇论文中，研究者利用GPT-4V和GPT-4（图1）分别作为最新的VLM和LLM的范例，提出

gPt