浅谈ChatGPT

lemonLib 2023-09-01 原文

ChatGPT概述

ChatGPT是一种自然语言处理模型，ChatGPT全称Chat Generative Pre-trained Transformer，由OpenAI开发。它使用了基于Transformer的神经网络架构，可以理解和生成自然语言文本。ChatGPT是当前最强大和最先进的预训练语言模型之一，可以生成具有逻辑和语法正确性的连贯文本。它在自然语言处理的各个领域，例如对话生成、文本分类、摘要生成和机器翻译等方面都取得了非常优秀的成绩。ChatGPT的成功表明，预训练语言模型已经成为自然语言处理领域的主流技术之一

ChatGPT原理

ChatGPT从领域上是属于自然语言处理（Natural Language Processing），简称NLP
NLP的主要目标是使计算机能够理解、分析、操作人类语言，从而实现更加智能化的自然语言交互

自然语言处理

历年发展

自然语言处理技术的发展历程经历了从规则到统计再到深度学习的三个阶段：

规则型方法阶段（1950年代至1980年代初）：该阶段主要采用人工规则来描述语言结构和语义，并通过编写一系列规则来实现自然语言处理任务。这种方法的局限性在于需要大量的人工参与，难以处理复杂的语言现象。
统计型方法阶段（1980年代中期至1990年代中期）：该阶段主要采用统计模型来处理自然语言，例如基于马尔可夫模型和隐马尔可夫模型的自然语言处理技术。这种方法依赖于大规模语料库的统计分析，可以处理一定程度上的语言不确定性，但在语义分析和生成等方面仍存在较大局限性。
深度学习方法阶段（2010年代至今）：该阶段主要采用深度学习模型来处理自然语言，例如基于循环神经网络（RNN）和长短时记忆网络（LSTM）的模型，以及后来的Transformer模型。深度学习模型具有较强的表达能力和泛化能力，可以处理复杂的语言结构和语义关系，广泛应用于自然语言理解、机器翻译、文本分类、问答系统等任务中。

自然语言处理开始时是利用传统的技术来解决问题，例如基于规则的方法、词典匹配等。但是这些传统方法需要大量手工编写规则和模式来处理自然语言，难以适应自然语言的多样性和复杂性。相比之下，人工智能技术具有自主学习和适应数据的能力，能够更加灵活和高效地处理自然语言。因此，在解决自然语言处理问题时，人工智能技术已经成为主流和先进的方法。

NLP的复杂性体现在以下几个方面：

多义性：自然语言中的词汇经常有多个意义，需要根据上下文确定其意义。
含糊性：自然语言中的表达往往不够准确，可能存在歧义，需要通过语境来确定其含义。
语言多样性：不同语言之间存在差异，同一语言的不同方言或口音也存在差异。
长距离依赖关系：句子中的某些词可能影响句子中很远的其他词，需要考虑整个句子的语义。
知识不完备：自然语言处理需要大量的先验知识和语言资源，而这些知识和资源往往是不完备的。
这些复杂性使得自然语言处理任务具有挑战性，需要使用先进的技术和算法来解决。

NLP主要内容包括以下：

语音识别：将人的语音转换成可被计算机理解的文本形式。
语言理解：理解人类语言的含义，包括语法、词汇、语义和上下文。
机器翻译：将一种语言的文本自动转换成另一种语言的文本。
信息检索：在大量文本数据中查找相关信息。
文本分类：将文本数据分成不同的类别。
命名实体识别：从文本数据中识别出具有特定名称的实体，例如人名、地名、公司名等。
信息抽取：从文本数据中抽取出有用的信息，例如时间、地点、事件等。
情感分析：分析文本数据中的情感倾向，例如正面、负面或中立等。
文本生成：自动产生新的文本数据，例如文章、诗歌等。

其中ChatGPT在语言理解、机器翻译、文本分类、信息抽取、文本生成方面表现相当优秀

目前NLP的主流解决技术方案是人工智能，人工智能的技术要素包括数据、算法、算力、模型。他们的关系为通过数据、算法、算力求模型，通俗地理解为如同人类一样用数据找到规律。人工智能区别于传统编程开发，传统编程开发是用已知规律求数据

ChatGPT模型训练

ChatGPT是一个模型，是通过数据、算法、算力求得的一个模型，其中数据、算法、算力具体内容为：

数据：ChatGPT使用了大量的自然语言文本数据进行预训练，包括维基百科、BookCorpus等。
算法：ChatGPT使用了Transformer算法，这是一种基于自注意力机制的神经网络模型，能够有效地处理自然语言文本数据
算力：为了训练和使用ChatGPT模型，需要大量的计算资源，包括GPU和分布式计算框架等。具体来说，OpenAI在训练13亿参数的GPT-3模型时使用了数千个GPU和TPU

其原理主要包括以下几个方面：

Transformer结构：ChatGPT使用了Transformer结构作为其基本架构，通过自注意力机制实现了对输入序列的编码和对输出序列的解码。
预训练：ChatGPT使用了大规模语料库进行了预训练，从而学习到了大量的语言知识，包括词汇、语法和语义等。
微调：ChatGPT在预训练的基础上，通过针对具体任务进行微调，从而实现了在特定任务上的优秀表现。
无监督学习：ChatGPT通过无监督学习的方式进行训练，即在不需要人工标注数据的情况下，通过最大化语言模型的似然函数来训练模型，从而实现了对语言知识的自动学习。

那么ChatGPT模型是如何训练的呢

ChatGPT模型的主要训练流程可以概括为以下几个步骤：

数据准备：准备大规模的文本数据作为训练数据集
模型设计：采用Transformer架构，构建多层的编码器-解码器结构，并采用自注意力机制实现对文本的建模
模型初始化：使用随机初始化的参数，构建初始的模型
模型训练：采用大规模的文本数据集对模型进行训练，以最小化损失函数为目标，让模型逐步学习输入文本的规律
模型评估：对训练好的模型进行评估，通常采用困惑度（perplexity）等指标来衡量模型的性能
模型微调：通过对模型参数进行微调，进一步提高模型的性能
模型部署：将训练好的模型部署到应用场景中，实现自然语言生成、问答等功能

训练模型

首先以监督学习方式训练能够写答案的生成模型，然后利用人工排序训练奖励模型，用于对生成模型的输出打分，最后用奖励模型预测结果且通过 PPO 算法优化 SFT 模型得PPO-ptx模型

阶段1：利用人类的标注数据（demonstration data）去对 GPT3 进行监督训练。
1）先设计了一个prompt dataset，里面有大量提示样本，给出了各种各样的任务描述；
2）其次，标注团队对 prompt dataset 进行标注(本质就是人工回答问题)；
3）用标注后的数据集微调 GPT3（可允许过拟合），微调后模型称为 SFT 模型（Supervised fine-tuning，SFT），具备了最基本的文本生成能力。

阶段2：通过 RLHF 思路训练奖励模型 RM
1）微调后的 SFT 模型去回答 prompt dataset 问题，通过收集 4 个不同 SFT 输出而获取 4 个回答；
2）接着人工对 SFT 模型生成的 4 个回答的好坏进行标注且排序；
3）排序结果用来训练奖励模型RM (Reward Model)，即学习排序结果从而理解人类的偏好。

阶段3：通过训练好的 RM 模型预测结果且通过 PPO 算法优化 SFT 模型的策略。
1）让 SFT 模型去回答 prompt dataset 问题，得到策略的输出，即生成的回答；
2）此时不再让人工评估好坏，而是让阶段 2 RM 模型去给 SFT 模型的预测结果进行打分排序；
3）使用 PPO 算法对 SFT 模型进行反馈更新，更新后的模型称为 PPO-ptx。

为什么ChatGPT在语言理解、机器翻译、文本分类、信息抽取、文本生成方面表现相当优秀？

其中重要的一个原因是预训练，相当于人类的通识教育

预训练的文本数据集包括维基百科、书籍、期刊、Reddit链接、Common Crawl和其他数据集，
主要语言为英文，中文只有5%，ChatGPT-3预训练数据量达45TB，参数量1750亿，对应成本也非常高，GPT-3 训练一次的费用是 460 万美元，总训练成本达 1200 万美元

注：参数量指的是模型中需要学习的可调整参数的数量，也就是神经网络中各层之间的连接权重和偏置项的数量之和。在深度学习中，参数量通常是衡量模型规模和容量的重要指标，一般来说参数量越多，模型的表达能力也就越强

ChatGPT应用场景

ChatGPT的优势和限制

ChatGPT的优势包括：

高度的自然语言处理能力：ChatGPT使用了深度学习的方法，可以对自然语言进行高度理解和处理，从而在回答问题和生成文本方面具有很高的准确性和流畅性
大规模预训练模型：ChatGPT使用了大规模预训练模型，能够学习到大量的自然语言数据，从而提高了模型的表现和效果
可扩展性和可定制性：ChatGPT的架构和预训练模型可以轻松地进行扩展和定制，以适应不同的自然语言处理任务和应用场景

ChatGPT的限制包括：

需要大量的数据和计算资源：由于ChatGPT使用了大规模的预训练模型，因此需要大量的数据和计算资源进行训练和调优
对话质量受限于数据质量：ChatGPT的对话质量受限于使用的数据集质量，如果数据集中存在噪声或错误，可能会对模型的表现和效果产生负面影响
存在一定的误差率：尽管ChatGPT的表现很优秀，但由于自然语言处理的复杂性，它仍然存在一定的误差率，需要进行不断的优化和改进

实践案例

官网例子
https://platform.openai.com/examples

官网提供了多种编程语言的SDK接入
https://platform.openai.com/docs/libraries

常见问题

FAQ

ChatGPT需要人工标注吗

作为一种大规模预训练语言模型，ChatGPT的训练需要依赖大量的无监督文本数据。在模型预训练完成后，如果要将其应用于某个具体任务，比如问答系统、机器翻译等，通常需要用到一些有标注的数据集进行微调。这些标注数据可以通过人工标注获得，也可以通过其他方法生成，如利用规则、自动标注等。因此，ChatGPT在预训练阶段不需要人工标注，但在应用阶段需要借助标注数据进行微调和优化。

ChatGPT训练之后还有什么成本吗

训练一个大型的语言模型像ChatGPT需要大量的计算资源和时间。但是一旦训练完成，部署和使用的成本就相对较低了。部署方面，可以选择在云端或者本地部署，云端部署可以更加灵活和便捷，而本地部署则可以提高一定的安全性和隐私性。

在使用过程中，ChatGPT仍然需要一定的计算资源来运行和生成文本，特别是当输入的序列长度和生成文本的长度增加时，所需的计算资源也会相应增加。此外，如果要对ChatGPT进行微调，需要准备大量的数据和进行反复的实验，这也需要一定的成本。

官方的FAQ

使用 ChatGPT 需要付费吗？

ChatGPT 的研究预览是免费的。

ChatGPT 是如何工作的？

ChatGPT 是基于 GPT-3.5 进行微调的语言模型，其目的是生成文本。通过使用强化学习与人类反馈（RLHF）的方法，ChatGPT 被优化为对话模型。该方法利用人类演示和偏好比较来指导模型朝着所需的行为方向发展。

为什么人工智能似乎如此真实和逼真？

这些模型是在大量来自人类撰写的互联网数据上进行训练的，包括对话，因此它提供的回复可能听起来像人类一样。重要的是要记住，这是系统设计的直接结果（即最大化输出与模型训练数据集之间的相似性），这样的输出有时可能是不准确的、不真实的，或者具有误导性。

我能相信人工智能告诉我的真相吗？

ChatGPT 未连接到互联网，偶尔可能会产生错误的答案。它对于2021年之后的世界和事件的了解有限，并且有时可能会提供有害的指令或有偏见的内容。

我们建议检查模型的响应是否准确。如果您发现回答不正确，请使用“反对”按钮提供反馈。

谁可以查看我的对话？

作为我们致力于安全和负责任的人工智能的一部分，我们会审核对话，以改善我们的系统，并确保内容符合我们的政策和安全要求。

您会使用我的对话来进行培训吗？

是的。我们的人工智能培训师可能会审核您的对话，以改善我们的系统。

您能删除我的数据吗？

是的，请按照数据删除流程操作。

您能删除特定的提示吗？

不可以，我们无法从您的历史记录中删除特定的提示。请不要在对话中分享任何敏感信息。

我可以查看我的对话记录吗？我如何保存我进行过的对话？

是的，您现在可以查看并继续您过去的对话。

翻译自官方常见问题
https://help.openai.com/en/articles/6783457-chatgpt-general-faq

参考链接

https://openai.com/blog/chatgpt

为什么ChatGPT仿如十万个为什么回答机?

https://www.zhihu.com/question/570431477

https://mdnice.com/writing/367eff477f6644a5b4c50301a443018e

ChatGPT是怎样被训练出来的？

https://www.bilibili.com/video/BV1e24y1s7k8/?spm_id_from=333.788&vd_source=c90e27f6e0935bab786c15cc6e330f63

https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247554744&idx=2&sn=3b93ca4720cd86fb13978d40a2c691c6&chksm=ebb72e6cdcc0a77a56a7ab0e1b315baf7801e418af0d1f88c0446dd25e93c8b50a6cdc471cb0&scene=27

https://zhuanlan.zhihu.com/p/609795142

有关浅谈ChatGPT的更多相关文章

亚特兰蒂斯的回声（中文版): chatGPT 的杰作 - 2
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅，深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器，揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下，阿丽亚开始了一段危险的旅程，以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒，她被睿智勇敢的QueenNeria的幻象所指引，她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明，并了解到邪恶的巫师马拉卡勋爵试图利用其古
智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2
2022年底，OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发，他展现的惊人能力将人工智能的研究和应用热度推向高潮，网上也充斥着和ChatGPT的各种聊天，他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复：人命关天的坑：写歌，留给词作者的机会不多了。。。回答人类怎么样面对人工智能：什么是ChatGPT？借用网上的一段介绍，ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型，一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动
【ChatGPT】ChatGPT 的 N 种用法 - 2
目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型，由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写，意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器（Trans
「想体验ChatGPT中文聊天？」那快进来，你用不上算我输 - 2
♥️作者：白日参商🤵‍♂️个人主页：白日参商主页♥️坚持分析平时学习到的项目以及学习到的软件开发知识，和大家一起努力呀！！！🎈🎈加油！加油！加油！加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+！「想体验ChatGPT中文聊天？」那快进来，你用不上算我输项目场景：项目条件一、那就开始吧1、安装ChatGPT-Desktop2、OpenAPI设置二、使用实例恭喜你！！！配置成功了！！！API和URL都是博主免费提供给大家的！！！恭喜你！！！配置成功了！！！API和URL都是博主免费提供给大家的！！！🎈🎈加油！加油！加油！加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+！项目场景：近几个月可以说ChatGPT是火得一
半个月狂飙1000亿，ChatGPT概念股凭什么？ - 2
ChatGPT掀起了AI股历史上最疯狂的一轮市值狂飙。自春节后至今，ChatGPT概念股开始了暴走模式，短短半月时间，海天瑞声、开普云等ChatGPT概念股市值累计增加了近1400亿。如此的爆炸效应，得益于ChatGPT所展现出商业化落地的巨大潜力。要知道，在此之前，无论是十年AI投入超千亿的百度，还是困在硬件化里的AI四小龙，都在重复着AI商业化难落地的故事。ChatGPT的出现，让AI从生产力的赋能者直接成为一种创造生产力的工具。随着订阅模式的推出，ChatGPT已经成为第一个以AI技术为核心直接变现的消费者应用。本文持有以下核心观点：1、ChatGPT是AI技术迭代的受益者。过去受限技术
未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2
文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火，生成式AI，大模型的人工智能被越来越多的人注意到，同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年，中国，印度和希腊哲学家都提出了一些推理的研究理论，比如亚里士多德（Aristotle）进行了演绎推理三段论的完整分析，欧几里得（Euclid）所著Elements是一种形式推理的模型，MuḥammadibnMūsāal-Khwārizmī,发明了代数学，即我们
山石发声｜风暴眼中的ChatGPT，看NLPer怎么说？ - 2
当前科技领域最有热度的话题，无疑是OpenAI新提出的大规模对话语言模型ChatGPT，一经发布上线，短短五天就吸引了百万用户，仅一个多月的时间月活已然破亿，并且热度一直在持续发酵，各行各业的从业人员、企业机构都开始体验关注甚至自研“类ChatGPT”模型。这里，笔者从一位NLP从业人员的角度谈一谈对ChatGPT的一些看法和思考。1、ChatGPT诞生之路1.1BERT2018年，谷歌提出BERT（BidirectionalEncoderRepresentationfromTransformer）模型，一时之间疯狂屠榜，在各种自然语言处理领域建模任务中取得了最佳的成绩，NLP自此进入了大规模
ChatGPT教程之深入了解魔术背后的技术 - 2
解开谜团：深入探索ChatGPT的技术奇迹。ChatGpt无处不在，无论是在播客、博客、YouTube还是社交媒体上。当我注意到这项新技术如此受欢迎时，我决定试一试，我被震惊了！有很多关于ChatGpt及其魔力的博客，但在这篇博客中，我将深入探讨其内部技术及其工作原理！ChatGpt简介根据OpenAI，ChatGpt被描述为：“我们训练了一个名为ChatGpt的模型，它以对话方式进行交互。对话格式使ChatGpt可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型，它经过训练可以按照提示中的说明进行操作并提供详细的响应。”OpenA
火爆的ChatGPT快速学成，要看哪些书？ - 2
以前我们经常打趣说：***，你out了！当然了，玩笑成分居多。但是如果作为一名技术人员，现在还没有听说过ChatGPT，那么你可能真的“out”了。比尔·盖茨说，ChatGPT的重要性堪比互联网的发明，甚至它“将改变我们的世界”。ChatGPT得到科技界大佬的如此推崇，那么，ChatGPT到底是什么？ChatGPT是2022年11月底，美国OpenAI公司推出的一款人工智能聊天机器人。两个月后，ChatGPT的月活用户已经突破1亿，成为有史以来增长速度最快的消费者应用程序。ChatGPT功能极其强大，它能够通过学习和理解人类的语言进行对话，还能根据上下文进行互动，实现像人类一样的聊天交流。除了
ChatGPT陷伦理风波 “纯净版”机器人在赶来的路上 - 2
近期，AI安全问题闹得沸沸扬扬，多国“禁令”剑指ChatGPT。自然语言大模型采用人类反馈的增强学习机制，也被担心会因人类的偏见“教坏”AI。4月6日，OpenAI官方发声称，从现实世界的使用中学习是创建越来越安全的人工智能系统的“关键组成部分”，该公司也同时承认，这需要社会有足够时间来适应和调整。至于这个时间是多久，OpenAI也没给出答案。大模型背后的“算法黑箱”无法破解，开发它的人也搞不清机器作答的逻辑。十字路口在前，一些自然语言大模型的开发者换了思路，给类似GPT的模型立起规矩，让对话机器人“嘴上能有个把门的”，并“投喂”符合人类利益的训练数据，以便它们输出“更干净”的答案。这些研发