草庐IT

gpt-llm-trainer

全部标签

LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?

在人工智能领域,很少有像YannLeCun这样的学者,在65岁的年龄还能高度活跃于社交媒体。一直以来,YannLeCun都是以「直言不讳的批评者」形象活跃于人工智能领域。他始终支持开源,并带领Meta的团队推出了占据如今开源大模型领域半壁江山的Llama2;他对很多人深感恐慌的人工智能末日论不以为然,坚信AGI的到来一定是件好事……近日,LeCun又一次来到LexFridman的播客,展开了一场接近三个小时的对谈,内容涉及开源的重要性、LLM的局限性、为什么人工智能末日论者是错误的,以及通向AGI的道路等话题。观看页面:https://youtu.be/5t1vTLU7s40?feature=

不用GPT4,如何让你的AI助理更加智能

小伙伴们新年好啊,颓废的2023年总算是过去了,过去这一年因为自己的状态不太好,一直也没怎么更新,2024年是时候重新拾起行囊再出发啦!前言去年年底我写过一篇《大模型小助手,Mac工程师如何拥有自己的人工智能》,在那篇文章里我介绍了如何利用自己手头的计算资源(Mac电脑)快速拥有一个人工智能助手,然而大多数人手头的算力是很孱弱的,以至于大家千方百计搭桥建梯想要拿到OpenAI这艘大船的船票。这无可厚非,但我们知道,在我们这个伟大的国家,科技一定是要讲究自主研发的,不然谈何遥遥领先。因此在去年8月,随着《生成式人工智能服务管理暂行办法》的正式实施,中国自人己的生成式人工智能之路,终于从政策上给出

用通俗易懂的方式讲解大模型:使用 LangChain 封装自定义的 LLM,太棒了

Langchain默认使用OpenAI的LLM(大语言模型)来进行文本推理工作,但主要的问题就是数据的安全性,跟OpenAILLM交互的数据都会上传到OpenAI的服务器。企业内部如果想要使用LangChain来构建应用,那最好是让LangChain使用企业内部的LLM,这样才能保证数据不泄露。LangChain提供了集成多种LLM的能力,包括自定义的LLM,今天我们就来介绍一下如何使用LangChain来集成自定义的LLM以及其中的实现原理。开源大模型虽然现在的商业大模型(OpenAI和Anthropic)功能十分强大,但开源大模型愈来愈有迎头赶上的趋势,比如最近刚发布的Falcon-180

超越GPT4!Cluade 3重磅发布!国外最新大模型!

体验Claude3,官网地址:claude.ai省流2024/3/4日,Anthropic公司发布了新一代的Claude3模型家族,这些模型在多种认知任务上设定了新的行业标准。以下是Claude3模型家族的主要特点和亮点:模型家族构成:包括三个模型,按能力递增排序为Claude3Haiku、Claude3Sonnet和Claude3Opus。用户可以根据特定应用选择智能、速度和成本的最佳平衡。Opus和Sonnet现在可以在claude.ai和ClaudeAPI中使用,后者现已在159个国家/地区正式发布。Haiku即将推出。性能提升:Opus模型在多个AI系统评估基准上超越同行,包括本科水平

Java-langchain:在Java环境中构建强大的基于LLM的应用程序

Java-langchain:一个Java8+的LangChain实现。在(企业)Java环境中构建强大的基于LLM的应用程序。这里持续连载详细的Java入门的LLM学习课程。课程分四个部分:面向开发者的提示工程(promptdevelopment)搭建基于ChatGPT的问答系统(chagptapi)使用LangChain开发应用程序(langchain)使用LangChain访问个人数据(开发中)Java快速转换到大模型开发:配套课程的所有代码已经发布在:https://github.com/Starcloud-Cloud/java-langchain课程合作请留言

Kong 宣布新开源人工智能网关,支持多种 LLM、无代码 AI 插件、高级提示工程等更多功能

KongCTO2024年2月15日宣布Kong在KongGateway3.6中发布了六个新的开源AI插件,这些插件可以将每个KongGateway部署都转变为AIGateway。这些新插件今天就可以使用,而且完全免费和开源,供所有人使用。欢迎联系我们的中国合作伙伴咨询详情consultant@gingxing.com。这六个新插件分别是AI代理、AI请求/响应转换器、AI提示卫士、AI提示模板和AI提示装饰器(AIProxy,AIRequest/ResponseTransformer,AIPromptGuard,AIPromptTemplate,andAIPromptDecorator)。只需

创建内部大型语言模型(LLM)前必须思考的五个关键问题

译者|晶颜审校|重楼业务领导者一直深感压力,他们需要找到将生成式人工智能(GenAI)纳入其战略的最佳方式,以便为其组织和利益相关者带来最佳收益。根据Gartner的调查,38%的业务领导者指出,客户体验和留存率是他们投资GenAI的主要目的,这对其业务的未来至关重要。然而,尽管这看起来很诱人,但在制定人工智能战略之前,考虑LLM是否适合您的业务同样至关重要。虽然市场上的LLM选项很多且易于访问,但有效使用现成的LLM却存在诸多挑战。这些问题包括缺乏个性化的客户体验,外包嵌入模型的成本增加,以及由于与外部共享数据而引发的隐私问题。训练内部AI模型可以直接解决这些问题,同时还可以激发团队内部的创

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

本周四,美国AI创业公司InflectionAI正式发布新一代大语言模型Inflection-2.5。据介绍,Inflection-2.5将强大的LLM能力与Inflection标志性的「同理心微调」结合在一起,兼具高情商与高智商,可联网获取事实信息,其性能可与GPT-4、Gemini等领先大模型相媲美。Inflection-2.5现已向所有Pi用户开放,在PC端、iOS和安卓App上均是免费可用。ps.机器之心也简单测试了下,觉得确实还只是「逼近」(不如)GPT-4,感兴趣的读者可以自行体验下。链接:https://pi.ai/talk值得注意的是,Inflection-2.5实现了接近GP

刚刚,OpenAI劲敌重磅发布Inflection-2.5!性能媲美GPT-4但计算量仅为40%,高情商应用Pi日活已破百万

真的卷疯了!就在刚刚,OpenAI劲敌Inflection发布了新模型——Inflection-2.5,仅用40%计算量,实现与GPT-4相媲美性能。「并驾齐驱」(neckandneck)与此同时,与ChatGPT对打的「最具人性化」聊天工具Pi,也得到了新升级模型的加持。现在,Pi已经达到了百万日活,不仅拥有世界一流的智商,还具有独特的亲和力和好奇心。在评估模型能力时,Inflection发现基准MT-Bench有太多不正确答案,并公开了一个全新的PhysicsGRE基准供所有人试用。若说实现真正的AGI,一定是高情商和强推理能力融为一体,Pi才是这个领域典范。不到一周的时间,先是Anthr

40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果

大模型竞赛,又杀出一匹黑马——Inflection-2.5,由DeepMind联创MustafaSuleyman的大模型初创公司打造。只用40%的计算资源训练,表现就超过了GPT-4的九成,尤其擅长代码和数学。而早期的Inflection模型,训练时只消耗了4%的计算资源,就达到了GPT-4表现的72%。以Inflection模型为基础,该公司还推出了网页端对话机器人Pi,主打“高情商”和“个性化”,还支持中文。自诞生以来,Pi的最高日活达到了100万,累计产生了40亿条消息,平均对话时长来到了33分钟。而随着这次基础模型的升级,Pi也迎来了它的新版本。图片那么,Inflection,或者说P