gpt-llm-trainer

解密Prompt系列21. LLM Agent之再谈RAG的召回信息密度和质量

话接上文的召回多样性优化，多路索引的召回方案可以提供更多的潜在候选内容。但候选越多，如何对这些内容进行筛选和排序就变得更加重要。这一章我们唠唠召回的信息密度和质量。同样参考经典搜索和推荐框架，这一章对应排序+重排环节，考虑排序中粗排和精排的区分主要是针对低延时的工程优化，这里不再进一步区分，统一算作排序模块。让我们先对比下重排和排序模块在经典框架和RAG中的异同排序模块经典框架：pointwise建模，局部单一item价值最大化，这里的价值可以是搜索推荐中的内容点击率，或者广告中的ecpm，价值由后面使用的用户来决定RAG：基本和经典框架相同，不过价值是大模型使用上文多大程度可以回答问题,价值

技术科普与解读：ChatGPT 大模型硬核解读！（一）家族历史从GPT-1到ChatGPT

多模态，指的是融合文本、图像、视频或音频等多种模态作为输入或输出。GPT-4是严格意义上的多模态模型，可以支持图像和文字两类信息的同时输入，输出为文本。从学术界的分析来看，无论是知识/能力获取还是与现实物理世界的交互，多模态感知都是实现通用人工智能的必要条件。没有多模态，AI大概难以充分“理解”这个世界。之前的ChatGPT或GPT-3.5就像AI蒙上双眼在那里“盲答”，而到了多模态的GPT-4，就是AI一边看一边思考。在GPT-4中，多模态输入的图像和文本都基于Transformer作为通用模块/接口，图形感知模块与语言模块对接进行进一步融合计算。通过在多模态语料库上预训练模型，训练数据包括

【分享】那些免魔法的chatGPT，GPT最佳实践

ChatGPT问世，犹如平地惊雷般，在技术圈中引起了广泛讨论。作为全球最大的开发者社区，GitHub平台也在近期诞生了多个ChatGPT相关的开源项目，其数量之多，可谓是见所未见，闻所未闻。说是ChatGPT以其一己之力，霸榜了大半个GitHubTrending也毫不为过。它究竟有何魅力，竟让诸多开发者如此激动不已呢？别急，且听我娓娓道来。 ChatGPT是由OpenAI于近期推出的一款智能聊天机器人应用，通过人机交互、线上一对一交流的方式，完成需要大量人工才能处理的工作。本篇博文是最近研究gpt过程中，总结的几个最佳项目，同时有在线的免魔法的ChatGPT可以

一、AI创作系统SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAIGPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT？小编这里写一个详细图文教程吧！SparkAi程序使用Nestjs和Vue3框架技术，持续集成AI能力到AIGC系统。1.1程序核心功能支持OpenAIGPT全模型+国内AI全模型（已上线！）AI提问：程序已支持GPT3.5，GPT4.0提问、OpenAIGPT全模型

LLM、ChatGPT与多模态必读论文150篇

为了写本ChatGPT笔记，我和10来位博士、业界大佬，在过去半年翻了大量中英文资料/paper，读完ChatGPT相关技术的150篇论文，当然还在不断深入。由此而感慨：读的论文越多，你会发现大部分人对ChatGPT的技术解读都是不够准确或全面的，毕竟很多人没有那个工作需要或研究需要，去深入了解各种细节因为半年内150篇这个任务，让自己有史以来一篇一篇一行一行读，之前看的比较散、不系统，抠的也不细比如回顾“Attentionisallyouneed”这篇后，对优化博客内的Transformer笔记便有了很多心得。考虑到为避免上篇文章篇幅太长而影响完读率，故把这些论文的清单抽取出来独立成本文技

微软 Azure OpenAI 服务现已支持 GPT-4 Turbo with Vision

12月17日消息，AzureOpenAI服务提供对OpenAI强大语言模型的RESTAPI访问，这些模型包括GPT-4、GPT-3.5-Turbo和嵌入模型系列。微软宣布进一步强化 AzureOpenAI服务的能力，并为客户提供了最新的GPT-4TurbowithVision公开预览版。这个先进的多模态AI模型保留了GPT-4Turbo所有的强大功能，同时引入了处理和分析图像的能力。这为利用GPT-4处理更多任务提供了机会，包括无障碍辅助功能改进、可视化数据解释和分析以及可视化问答（VQA)。此外，微软还为AzureOpenAI客户提供了更多GPT-4TurbowithVision预览版功能，

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的3D模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，这个任务所需的能力名为跨模态推理，也是当今多模态大模型研究热潮中一个重要的研究主题。近日，宾夕法尼亚大学、Salesforce研究院和斯坦福大学的一个研究团队给出了一个解决方案X-InstructBLIP，能以较低的成本让语言模型掌握跨模态推理。人类天生就会利用多种感官来解读周围环境并和制定决策。通过让人工智能体具备跨模态推理能力，我们可以促进系统的开

字节GPT账户突遭冻结，OpenAI：正在调查不当行为

字节跳动，陷入大模型舆论风波。据TheVerge报道：字节跳动一直在秘密使用OpenAI的技术，来开发自家大语言模型（LLM）。而在此消息被披露不久，TheVerge进一步称OpenAI已经暂停了字节跳动的账户。具体而言，OpenAI发言人NikoFelix发布的声明如下：虽然字节跳动使用我们API的量很少，但我们已经暂停了他们的账户，同时我们会进一步调查。如果我们发现他们的使用不符合规则，我们将要求他们进行必要的更改或终止他们的帐户。这里提到的“规则”是指在OpenAI的服务条款中有一项明确的规定，那就是OpenAI提供的模型能力，不允许用来被“开发任何与之产品和服务形成竞争的AI模型”。据

Mistral携微软引爆「小语言模型」潮！Mistral中杯代码能力完胜GPT-4，成本暴降2/3

最近，「小语言模型」忽然成为热点。本周一，刚刚完成4.15亿美元融资的法国AI初创公司Mistral，发布了Mixtral8x7B模型。这个开源模型尽管尺寸不大，小到足以在一台内存100GB以上的电脑上运行，然而在某些基准测试中却能和GPT-3.5打平，因此迅速在开发者中赢得了一片称赞。之所以叫Mixtral8x7B，是因为它结合了为处理特定任务而训练的各种较小模型，从而提高了运行效率。这种「稀疏专家混合」模型并不容易实现，据说OpenAI在今年早些时候因为无法让MoE模型正常运行，而不得不放弃了模型的开发。紧接着，就在第二天，微软又发布了全新版本的Phi-2小模型。跟Mistral的70亿参

AI首次攻克难倒陶哲轩数学难题，DeepMind里程碑算法登Nature！LLM搜代码自我进化

上限集问题，是困扰数学家们多年的开放性问题。著名数学家陶哲轩，就曾将上限集问题描述为自己最喜欢的开放性问题。陶哲轩博客而大语言模型，竟然在这个问题上做出了新发现。今天，GoogleDeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联手提出全新方法——FunSearch，竟首次利用LLM发现数学科学中的开放问题！AI通过搜索计算机代码编写的「函数」，因此得名FunSearch。论文地址：https://www.nature.com/articles/s41586-023-06924-6简单来说，FunSearch将预训练的LLM与自动「评估器」配对使用。前者的目标是以计算机代码的形式提