ChatGLM-LLaMA-chinese-insturct

从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库（完结篇）

相关文章：从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库（一）https://blog.csdn.net/hya168/article/details/131460230从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库（二）https://blog.csdn.net/hya168/article/details/135870440五、配置、启动langchain-chatchat5.1配置文件修改生成默认配置文件cd/data/webui/l

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationModelsforProbabilisticTimeSeriesForecasting》中，模型作为单变量概率预测的通用基础模型提出。它是由来自不同机构的大型团队开发的，这些机构包括MorganStanl

清华系2B模型杀出，性能吊打LLaMA-13B

2月1日，面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型MiniCPM，主体语言模型MiniCPM-2B仅有24亿（2.4B）的非词嵌入参数量。在综合性榜单上与Mistral-7B相近，在中文、数学、代码能力表现更优，整体性能超越Llama2-13B、MPT-30B、Falcon-40B等模型。具体开源模型包括：基于MiniCPM-2B的指令微调与人类偏好对齐的MiniCPM-2B-SFT/DPO。基于MiniCPM-2B的多模态模型MiniCPM-V，能力超越基于Phi-2的同参数级别多模态模型。MiniCPM-2B-SFT/DPO的Int4量化版MiniCPM-2B-SF

chatglm2-2b+sdxl1.0+langchain打造私有AIGC（一）

一、背景及目标在ChatGPT爆火之后，我对AI技术也开始关注，一是出于好奇，而是出于危机。想必对于应用开发人员来说从“面面向对象编程”转成“面向AI编程”也是极好的。最初的时候我也是抱着试一试的心态，开始魔法上网使用chatgpt，然后尝试调用openai的开放接口，搭建了一个自己的chat网站，后来由于免费的token用完了，以及openai对中国的不开放态度，遂放弃。在找遍了国内所有的知名厂商的语言大模型接口之后，突然发现一个神奇的网站，https://huggingface.co（开源模型发布平台，类似于github，当然也是需要魔法上网才能实现自由访问的）。在huggingface上

离线AI聊天清华大模型(ChatGLM3)本地搭建指南

随着人工智能技术的飞速发展，聊天机器人成为了一个热门的研究领域。清华大学研发的ChatGLM3模型，作为其中的佼佼者，为开发者提供了强大的自然语言处理能力。本文将指导您如何在本地搭建ChatGLM3模型，实现离线AI聊天功能。一、前置准备在开始搭建之前，您需要准备以下物品：一台性能良好的计算机，建议配置至少8GB内存和2GB显存的显卡。安装Python3.8或更高版本。安装必要的Python库，如torch、transformers等。下载ChatGLM3模型文件。二、安装依赖在搭建过程中，您需要使用到一些Python库。您可以通过以下命令安装这些库：pip install torch tra

超简单，不用GPU，3步教你轻松在笔记本上部署聊天大模型 LLaMA

大家好啊，我是董董灿。今天带大家在自己的电脑(笔记本)上部署一个类似于chatGPT的AI聊天大模型。部署完之后，你就拥有了一个私人AI聊天机器人，无需联网，随时进行实时对话。0.简单说下背景大模型我们都不陌生了，但是以chatGPT为代表的大模型是闭源的，他们的源代码不开放，我们只能用他们的商业化产品。好在Meta(也就是原来的FaceBook) 开源了他们家的大模型LLaMa。之所以叫“大”模型，是因为它的参数量巨大。以LLaMa举例子，它开源了LLaMa-7B，LLaMa-33B等模型，后面的数字就代表着参数数量。7B，就意味着参数有70亿，但是很多人微调后，发现它的效果却一点也不输拥有

关于LLaMA Tokenizer的一些坑...

使用LLaMATokenizer对jsonl文件进行分词，并将分词结果保存到txt文件中，分词代码如下：importjsonlinesimportsentencepieceasspmfromtqdmimporttqdmjsonl_file='/path/to/jsonl_file'txt_file='/path/to/txt_file'tokenizer=spm.SentencePieceProcessor('./tokenizer.model')w=open(txt_file,mode='w',encoding='utf-8')withjsonlines.open(jsonl_file,mo

ChatGLM Java SDK：智谱 AI 通用语言模型 Zhipu ChatGLM Java SDK

智谱清言AI通用大语言模型ChatGLMJavaSDK-Github此项目是由Java的JDK11的长期版本开发，设备环境需要JDK>=11🚩当前ChatGLMJavaSDK最新为0.1.1Beta版本。JavaMavenDependency(BlueChatGLM)调用top.pulselinkbluechatglm0.1.1-BetaJavaGradle(BlueChatGLM)调用implementationgroup:'top.pulselink',name:'bluechatglm',version:'0.1.1-Beta'Javasbt(BlueChatGLM)调用libraryD

每日一看大模型新闻（2023.12.13）趣味项目CLoT:训练LLM更幽默地回答问题；用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习；2.7B能打Llama 2 70B，微软祭出

1.产品发布1.12.7B能打Llama270B，微软祭出「小语言模型」发布时间：2023-12-132.7B能打Llama270B，微软祭出「小语言模型」！96块A10014天训出Phi-2，碾压谷歌Gemininano主要内容：11月份以来，大型语言模型技术领域发生了许多重要事件。OpenAI推出了GPTs，颠覆了先前的GPT模型，并通过引入董事会吸引了大量关注。谷歌也在年底前匆忙发布了超大规模Gemini模型，甚至涉及了"视频造假"。微软则正式发布了Phi-2小语言模型，拥有2.7B参数，几乎超越所有13B以下的大型模型。Phi-2表现出色，性能可媲美比自己大25倍的模型。微软强调了训练

Meta开源Code Llama 70B,缩小与GPT-4之间的技术鸿沟

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/。加入请求下载的名单： https://bit.ly/3Oil6bQMeta最近更新了它的代码生成AI模型，CodeLlama70B，这可是迄今为止“最大也是表现最好的模型”呢。这个CodeLlama工具自去年八月推出以来，就已经免费开放给研究和商业用途了。根据MetaAI博客上的