草庐IT

Docker系列 基于OpenAI API自建ChatGPT

huangwb8 2023-12-23 原文

转自我的博客文章https://blognas.hwb0307.com/linux/docker/4201,内容更新仅在个人博客可见。欢迎关注!

前言

我用帐号/密码使用chatGPT已经有一段时间。但是,我有几个私交较密的朋友,他们并不具备使用chatGPT的条件;但又想体验一下这个神奇的工具。因此,最近我专门去了解自建ChatGPT有关的项目。在这里总结一下我自建chatGPT的经验。大家有什么好项目也可以在评论区推荐下!

我的自建chatGPT(基于gpt-3.5-turbo)大致如下:

尽管该方案支持多用户和聊天数据保存(基于MongoDB),但也只是一个比较简陋的Demo,暂时还没有一些比较精细的功能。不过咱们也只是自己用一下,不是什么商业化项目,应该无所谓!后续有更好的开源免费项目,我也会陆续介绍。关于安全性,我只能说我暂时没有发现这个方案有主观恶意行为。API并没有异常扣费。

值得注意的是,只要你的API支持,这个方案也支持GPT-4,它是由OpenAI公司在2023年3月14日发布的一个比gpt-3.5更强大的语言模型。想进一步了解GPT-4的小伙伴可以看“跟李沐学AI”的视频:GPT-4论文精读

准备工作

你需要使用非中国大陆和香港的IP访问openai.com,具体比较复杂。如果你不知道我在说什么,看到这里你就可以停了

你需要准备一个可用的OpenAI API。具体方案如下:

申请虚拟信用卡

首先,我们要有一张合适的虚拟信用卡。之前很多人介绍depay。但是,目前depay的身份验证通道是维护状态;并且需要使用USDT支付,这对很多人是一个很高的门槛。

(缺失内容请访问原文: https://blognas.hwb0307.com/linux/docker/4201)

获得OpenAI API

你可以通过“Account API Keys - OpenAI API”新建一个API。这个过程太简单了,没啥好说的,直接点Create new secret key即可:

这个API Key只展示一次,你应该记录一下。如果忘记了,新建一个再删除旧的即可,然后记住新的key即可。

你可以在“Account - OpenAI API”中查看消费情况:

建议限制一下高额消费提醒:

你可以在“Pricing”中查看服务单价(每1000 token)。token大致就是单词片段,这个概念主要来自transformer模型,大家简单了解一下就好。总之,gpt-3.5的API价格还是挺亲民的,个人用户目前用它即可;gpt-4的价格就比较高了,适合企业级用户:

测试环境

我的自建chatGPT布署在博客的VPS上:

uname -a # Linux racknerd-XXXXX 5.4.0-28-generic #32-Ubuntu SMP Wed Apr 22 17:40:10 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux

docker --version # Docker version 23.0.3, build 3e7cbfd

docker-compose --version # Docker Compose version v2.4.1

自建ChatGPT

不了解docker的小伙伴请先看:《Docker系列 配置Docker全局环境》;《Docker系列 了解Docker Compose的配置文件》。

完成准备工作后,我们通过docker自建ChatGPT。我目前使用的项目是: Kerwin1202/chatgpt-web,它提供了使用MongoDB托管后台数据的接口。该项目衍生于Chanzhaoyu/chatgpt-web: 用 Express 和 Vue3 搭建的 ChatGPT 演示网页——仅提供了一个ChatGPT前端的Demo,比较原始。

文件夹和端口

首先,我们新建工作目录:

work=/docker/kerwin_chatgpt
mkdir -p $work; cd $work

如果你也使用了ufw,应该开放一下端口:

sudo ufw allow 1004/tcp comment 'kerwin_chatgpt' && sudo ufw reload
sudo ufw allow 1005/tcp comment 'kerwin_chatgpt GUI' && sudo ufw reload

如果你的VPS后台还有防火墙,也要相应开放。

yml文件

这里有很多帐户和密码,大家多关注:

  • OPENAI_API_KEY:OpenAI后台的API key。
  • SMTP系列:这是给注册用户发送邮件时用的。
  • AUTH_SECRET_KEY:源项目这个是登陆密钥。这里暂时不知道有什么用;注册用户似乎不需要这个。
  • MongoDB:数据库名chatgpt,用户名user01,密码password01
  • Mongo-Express:用户名user02,密码password02。这是登陆MongoDB GUI时用的。如果不设置,任何知道数据库网址的人都可以访问数据库!

新建docker-compose.yml文件:

vi $work/docker-compose.yml

填入下面的内容。如果你用过mongomongo-express,可以改为自己正在使用的tag,这样比较节省镜像空间。有按需修改提示的也要按自己的实际情况修改:

version: '3'

services:
  app:
    # 在https://hub.docker.com/r/kerwin1202/chatgpt-web/tags 里获得tag。或者写latest
    image: kerwin1202/chatgpt-web:latest
    restart: unless-stopped
    ports:
      - 1004:3002
    depends_on:
      - database
    environment:
      TZ: Asia/Shanghai
      # 从OpenAI后台里获得
      OPENAI_API_KEY: sk-XXX # 按需修改
      # 访问jwt加密参数,可选 不为空则允许登录 同时需要设置 MONGODB_URL
      AUTH_SECRET_KEY: 12345678abcdefg # 按需修改
      # 超时,单位毫秒,可选
      TIMEOUT_MS: 60000
      # 网站名
      SITE_TITLE: BenszChat # 按需修改。写个自己喜欢的名字就行
      # mongodb 的连接字符串
      MONGODB_URL: 'mongodb://user01:password01@database:27017' # 按需修改
      # 网站是否开启注册
      REGISTER_ENABLED: true # 完成注册后,这一项要改为false
      # 开启注册之后 网站注册允许的邮箱后缀 如果空 则允许任意后缀
      REGISTER_MAILS: '@qq.com,@gmail.com,@163.com' # 按需修改
      # 加密盐。算法: echo -n 'passwordsalt' | md5sum | cut -c 1-32
      PASSWORD_MD5_SALT: tNJ%M&D # 按需修改
      # 开启注册之后 超级管理员的邮箱
      ROOT_USER: hwb2012@qq.com # 按需修改
      # 开启注册之后网站域名 不含 / 。注册的时候发送验证邮箱使用
      SITE_DOMAIN: https://chatgpt.hwb0307.com # 按需修改
      # 开启注册之后 发送验证邮箱配置
      SMTP_HOST: smtp.qq.com
      SMTP_PORT: 465
      SMTP_TSL: true
      SMTP_USERNAME: hwb2012@qq.com # 按需修改
      SMTP_PASSWORD: xxxxxxxx # 按需修改
    links:
      - database

  database:
    image: mongo:3.6
    restart: unless-stopped
    expose:
      - '27017'
    volumes:
      - ./mongodb:/data/db
    environment:
      MONGO_INITDB_ROOT_USERNAME: user01
      MONGO_INITDB_ROOT_PASSWORD: password01
      MONGO_INITDB_DATABASE: chatgpt

  gui:
    image: mongo-express:1.0.0-alpha
    restart: unless-stopped
    ports:
      - "1005:8081"
    environment:
      # 选择主题。详见: http://codemirror.net/demo/theme.html
      ME_CONFIG_OPTIONS_EDITORTHEME: ambiance
      # 数据库信息
      ME_CONFIG_BASICAUTH_USERNAME: user02
      ME_CONFIG_BASICAUTH_PASSWORD: password02
      ME_CONFIG_MONGODB_URL: 'mongodb://user01:password01@database:27017'
      ME_CONFIG_MONGODB_ENABLE_ADMIN: true # 可能不是必要的
      ME_CONFIG_MONGODB_ADMINUSERNAME: user01 # 可能不是必要的
      ME_CONFIG_MONGODB_ADMINPASSWORD: password01 # 可能不是必要的

这个docker-compose.yml要自定义的东西还挺多的。如果大家使用时有什么疑问,可以在评论区留言!

最后直接上线即可:

cd $work && docker-compose up -d

其它docker相关操作和一般的docker应用是类似,这里就不细说了。

NPM设置

不了解Nginx Proxy Manager(NPM)用法的小伙伴,请看《Docker系列 两大神器NPM和ddns-go的安装》。

准备两个域名并在域名托管商(比如Cloudflare),比如chatgpt.hwb0307.comchatgptgui.hwb0307.com

  • chatgpt.hwb0307.com给chatGPT的前端使用,反代地址http://172.17.0.1:1004
  • chatgptgui.hwb0307.com给chatGPT的后端使用,反代地址http://172.17.0.1:1005

反代过程并不需要设置特别的参数。

前端基本界面如下:

后端数据库界面如下:

基本介绍

第一个用户默认是管理员用户,请使用docker-compose.yml文件里约定的管理员邮箱注册,并在邮箱里点击验证链接即可。其它用户也是类似的。目前,如果你的目标用户已经注册完毕,你可以在docker-compose中设置REGISTER_ENABLED: false,重启docker stack生效。当然,可能在网站配置里设置更合理。总之,这些配置和docker-compose.yml文件里定义的参数是相一致的。

所有的设置都可从左下角的设置按钮进入查看:

总览

总览界面基本上和数据库内容是一一对应的:

总览里还可以导入/导出聊天记录(以.json格式),也是挺不错的!

我这里简单展示其它选项的内容:

高级

设定角色。一般是默认的。

基本配置

这里展示了API的余额,不是用量。

网站配置

这里的注册登录功能最好不要点暗,否则容易出bug,导致所有用户无法登陆。数据库里直接修改似乎无法生效,感觉这是bug,或者是缓存问题:

这个方案应该是有效的。大家试试看!

点亮新用户表明你开放注册;点亮新用户审核表明该用户需要你审核才可以使用。如果你开放注册,一般建议这两者都要点亮。如果你不想开放注册,将新用户点暗即可。

邮箱配置

密码是SMTP专用密码,不是QQ邮箱密码。

提示词商店

它内置了一些提示词链接:

有个英文版的Prompts项目也挺不错: f/awesome-chatgpt-prompts: This repo includes ChatGPT prompt curation to use ChatGPT better.,大家可关注下。基本上涵盖了日常生活中比较常用的功能。但这个Prompts似乎是仅在浏览器里缓存的,更新后就没了,要重新搞。感觉不太合适。

不过,一般我都是比较喜欢自己写Prompts。这也是可玩性的一部分吧!以后有机会,我也总结一下大佬们一般是怎么写Prompts的。讲究还挺多 (ฅ´ω`ฅ)

非注册用户

由于我们使用了数据库托管,所以可以轻易地操作数据库以生成新用户。这里我简单展示如何新增一个用户。

首先,我们登陆MongoDB,进入chatGPT数据库的user collection:

这里我创建了一个测试用户test@qq.com。我们双击该记录查看具体信息,如下:

{
    _id: ObjectId('6434ececdf45624abb1d190a'),
    name: 'test@qq.com',
    email: 'test@qq.com',
    password: '36d78f8755a4d79de6b21034f7bbb207',
    status: 0,
    createTime: '4/11/2023, 1:23:24 PM',
    verifyTime: '4/11/2023, 1:24:23 PM'
}

其中_id就是代表用户ID,类似于身份证号,只要与现存帐号不一样即可。name是用户名,email是用户邮箱。status暂时不知道是什么。createTimeverifyTime代表创建和验证时间,差不多是间隔1分钟左右;没研究过这个时间间隔有没有要求,大家可以试试看。

这里的password其实是一段基于md5的哈希值。假设密码是a,盐值(即docker-compose文件里的PASSWORD_MD5_SALT参数的值)是tNJ%M&D,则password的取值为:

# Linux Shell命令。 密码+盐值组成新字符,空间不留任何空隙
echo -n 'atNJ%M&D' | md5sum | cut -c 1-32

输出结果为a3fedefc90692555644896f3c41c26eb,与我的记录是不同的。这是因为每个人的密码和盐值都是不同的,按需生成即可。

只要我们确定好这些参数,再左击New Document新增一条记录并保存,这样就可以在不开放注册的情况下添加用户

大家也可以尝试一下如何批量生成新用户喔!

小结

关于自建chatGPT的介绍暂时到这里。我没有介绍太多MongoDB的设置,因为我暂时也不太熟悉;而且,我怀疑由于前端项目的限制,数据库的能力并没有被充分发挥,现在应该也不是介绍后端的最好时机。该项目还有以下缺陷:

  • 不支持流量/付费控制
  • 不支持具体某个聊天记录的markdown输出
  • 重启docker stack后,尽管聊天内容还在,但无法依据前面的聊天内容继续聊天
  • 刷新网页后,要点一下某个聊天记录可以显示历史聊天内容(不知是不是和nginx设置有关)、
  • Prompts并不保存在数据库内

还有一个类似的衍生项目: gouguoyin/chatgpt-web,它的文档“展示”了许多功能,包括登录注册、管理后台、设置首次登录赠送免费提问次数、key轮询池、卡券套餐管理、对话管理、敏感词管理、自定义回复管理、提示词prompt管理、卡密套餐管理、卡密生成和核销等。但它似乎是一个付费和闭源的应用。只能说,感兴趣的小伙伴可以了解喽 (ฅ´ω`ฅ)

如果你可以利用OpenAI的帐户和密码免费使用chatGPT,推荐该项目:lencx/ChatGPT: 🔮 ChatGPT Desktop Application (Mac, Windows and Linux)。它的功能比较官方网站要完善一些,也支持Prompts导入、markdown/pdf/图片输出等:

以后有更多使用心得再来更新!

有关Docker系列 基于OpenAI API自建ChatGPT的更多相关文章

  1. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  2. ruby-on-rails - 使用一系列等级计算字母等级 - 2

    这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,

  3. 亚特兰蒂斯的回声(中文版): chatGPT 的杰作 - 2

    英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅,深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器,揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下,阿丽亚开始了一段危险的旅程,以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒,她被睿智勇敢的QueenNeria的幻象所指引,她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明,并了解到邪恶的巫师马拉卡勋爵试图利用其古

  4. 叮咚买菜基于 Apache Doris 统一 OLAP 引擎的应用实践 - 2

    导读:随着叮咚买菜业务的发展,不同的业务场景对数据分析提出了不同的需求,他们希望引入一款实时OLAP数据库,构建一个灵活的多维实时查询和分析的平台,统一数据的接入和查询方案,解决各业务线对数据高效实时查询和精细化运营的需求。经过调研选型,最终引入ApacheDoris作为最终的OLAP分析引擎,Doris作为核心的OLAP引擎支持复杂地分析操作、提供多维的数据视图,在叮咚买菜数十个业务场景中广泛应用。作者|叮咚买菜资深数据工程师韩青叮咚买菜创立于2017年5月,是一家专注美好食物的创业公司。叮咚买菜专注吃的事业,为满足更多人“想吃什么”而努力,通过美好食材的供应、美好滋味的开发以及美食品牌的孵

  5. 【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2

    在应用开发中,有时候我们需要获取系统的设备信息,用于数据上报和行为分析。那在鸿蒙系统中,我们应该怎么去获取设备的系统信息呢,比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况,一种是设备信息的获取,一种是系统信息的获取。1.1、获取设备信息获取设备信息,鸿蒙的SDK包为我们提供了DeviceInfo类,通过该类的一些静态方法,可以获取设备信息,DeviceInfo类的包路径为:ohos.system.DeviceInfo.具体的方法如下:ModifierandTypeMethodDescriptionstatic StringgetAbiList​()Obt

  6. 基于C#实现简易绘图工具【100010177】 - 2

    C#实现简易绘图工具一.引言实验目的:通过制作窗体应用程序(C#画图软件),熟悉基本的窗体设计过程以及控件设计,事件处理等,熟悉使用C#的winform窗体进行绘图的基本步骤,对于面向对象编程有更加深刻的体会.Tutorial任务设计一个具有基本功能的画图软件**·包括简单的新建文件,保存,重新绘图等功能**·实现一些基本图形的绘制,包括铅笔和基本形状等,学习橡皮工具的创建**·设计一个合理舒适的UI界面**注明:你可能需要先了解一些关于winform窗体应用程序绘图的基本知识,以及关于GDI+类和结构的知识二.实验环境Windows系统下的visualstudio2017C#窗体应用程序三.

  7. Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting - 2

    1.错误信息:Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexceededwhileawaitingheaders)或者:Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:TLShandshaketimeout2.报错原因:docker使用的镜像网址默认为国外,下载容易超时,需要修改成国内镜像地址(首先阿里

  8. kvm虚拟机安装centos7基于ubuntu20.04系统 - 2

    需求:要创建虚拟机,就需要给他提供一个虚拟的磁盘,我们就在/opt目录下创建一个10G大小的raw格式的虚拟磁盘CentOS-7-x86_64.raw命令格式:qemu-imgcreate-f磁盘格式磁盘名称磁盘大小qemu-imgcreate-f磁盘格式-o?1.创建磁盘qemu-imgcreate-fraw/opt/CentOS-7-x86_64.raw10G执行效果#ls/opt/CentOS-7-x86_64.raw2.安装虚拟机使用virt-install命令,基于我们提供的系统镜像和虚拟磁盘来创建一个虚拟机,另外在创建虚拟机之前,提前打开vnc客户端,在创建虚拟机的时候,通过vnc

  9. 阿里云RDS——产品系列概述 - 2

    基础版云数据库RDS的产品系列包括基础版、高可用版、集群版、三节点企业版,本文介绍基础版实例的相关信息。RDS基础版实例也称为单机版实例,只有单个数据库节点,计算与存储分离,性价比超高。说明RDS基础版实例只有一个数据库节点,没有备节点作为热备份,因此当该节点意外宕机或者执行重启实例、变更配置、版本升级等任务时,会出现较长时间的不可用。如果业务对数据库的可用性要求较高,不建议使用基础版实例,可选择其他系列(如高可用版),部分基础版实例也支持升级为高可用版。基础版与高可用版的对比拓扑图如下所示。优势 性能由于不提供备节点,主节点不会因为实时的数据库复制而产生额外的性能开销,因此基础版的性能相对于

  10. ruby-on-rails - (Ruby,Rails) 基于角色的身份验证和用户管理...? - 2

    我正在寻找用于Rails的优质管理插件。似乎大多数现有的插件/gem(例如“restful_authentication”、“acts_as_authenticated”)都围绕着self注册等展开。但是,我正在寻找一种功能齐全的基于管理/管理角色的解决方案——但不是简单地附加到另一个非基于角色的解决方案。如果我找不到,我想我会自己动手......只是不想重新发明轮子。 最佳答案 RyanBates最近做了两个关于授权的railscast(注意身份验证和授权之间的区别;身份验证检查用户是否如她所说的那样,授权检查用户是否有权访问资源

随机推荐