草庐IT

keras-rl

全部标签

ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

写在最前面,为了彻底写清楚ChatGPT背后的所有关键细节,从1月初写到3月底仍未完工,除了本文之外,过程中涉及到多篇文章(RL论文项目CV多模态),再加上之前写的Transformer、RL数学基础等多篇笔记,成了一个大系列:Transform通俗笔记RL所需的微积分/概率统计基础RL所需的最优化基础RL极简入门100篇ChatGPT相关技术的论文类ChatGPT项目的部署与微调:从LLaMA到Alpaca、Vicuna、BELLE、ChatLLaMA和ColossalChat、从ChatGLM-6b到ChatDoctorAI绘画与CV多模态原理解析:从ViT/Swintransformer

ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

写在最前面,为了彻底写清楚ChatGPT背后的所有关键细节,从1月初写到3月底仍未完工,除了本文之外,过程中涉及到多篇文章(RL论文项目CV多模态),再加上之前写的Transformer、RL数学基础等多篇笔记,成了一个大系列:Transform通俗笔记RL所需的微积分/概率统计基础RL所需的最优化基础RL极简入门100篇ChatGPT相关技术的论文类ChatGPT项目的部署与微调:从LLaMA到Alpaca、Vicuna、BELLE、ChatLLaMA和ColossalChat、从ChatGLM-6b到ChatDoctorAI绘画与CV多模态原理解析:从ViT/Swintransformer

CUDA 11.7 版本下安装Tensorflow-gpu以及Keras (Windows以及Ubuntu)

​记录:在复现论文代码时碰到使用keras环境,于是在自己windows系统的台式机(RTX3080;CUDA11.7)上进行了安装,但是发现台式机的显存无法支持程序的运行。于是将一摸一样的环境配置到更大现存的Ubuntu服务器(CUDA11.7)上,但配置环境出错,一直无法调用GPU。经过一天的摸索,从网上其他博客中找到答案,虽然不懂其中的道理,但先记录下来。1.待配置环境的版本Python:3.8.0CUDA:11.3.1cuDNN:8.2.1Tensorflow-gpu:2.7.0Keras:2.7.02.Windows下使用conda和pip安装Tensorflow-gpu以及Kera

CUDA 11.7 版本下安装Tensorflow-gpu以及Keras (Windows以及Ubuntu)

​记录:在复现论文代码时碰到使用keras环境,于是在自己windows系统的台式机(RTX3080;CUDA11.7)上进行了安装,但是发现台式机的显存无法支持程序的运行。于是将一摸一样的环境配置到更大现存的Ubuntu服务器(CUDA11.7)上,但配置环境出错,一直无法调用GPU。经过一天的摸索,从网上其他博客中找到答案,虽然不懂其中的道理,但先记录下来。1.待配置环境的版本Python:3.8.0CUDA:11.3.1cuDNN:8.2.1Tensorflow-gpu:2.7.0Keras:2.7.02.Windows下使用conda和pip安装Tensorflow-gpu以及Kera

图像分割技术及经典实例分割网络Mask R-CNN(含基于Keras Python源码定义)

图像分割技术及经典实例分割网络MaskR-CNN(含Python源码定义)文章目录图像分割技术及经典实例分割网络MaskR-CNN(含Python源码定义)1.图像分割技术概述2.FCN与语义分割2.1FCN简介2.2反卷积2.2FCN与语义分割的关系3.MaskR-CNN3.1实例分割的难点3.2FPN(特征金字塔)3.2MaskR-CNN3.3RoiAlign3.4分割掩膜4.工程实践1.图像分割技术概述图像分割技术是可以浅显的理解为精细化的目标检测过程,由于之前的目标检测算法只能使用标定框框定规则区域,从而进行分类,标出目标的大题区域,但是,在譬如自动驾驶领域,仅仅只有一个规则的区域去框

图像分割技术及经典实例分割网络Mask R-CNN(含基于Keras Python源码定义)

图像分割技术及经典实例分割网络MaskR-CNN(含Python源码定义)文章目录图像分割技术及经典实例分割网络MaskR-CNN(含Python源码定义)1.图像分割技术概述2.FCN与语义分割2.1FCN简介2.2反卷积2.2FCN与语义分割的关系3.MaskR-CNN3.1实例分割的难点3.2FPN(特征金字塔)3.2MaskR-CNN3.3RoiAlign3.4分割掩膜4.工程实践1.图像分割技术概述图像分割技术是可以浅显的理解为精细化的目标检测过程,由于之前的目标检测算法只能使用标定框框定规则区域,从而进行分类,标出目标的大题区域,但是,在譬如自动驾驶领域,仅仅只有一个规则的区域去框

基础的强化学习(RL)算法及代码详细demo

文章目录一、Sarsa(悬崖问题)1.1CliffWalking-v0环境介绍1.2Sarsa算法流程1.3具体代码1.4演示效果二、Q-Learning(悬崖问题)2.1CliffWalking-v0环境介绍2.2Q-Learning算法流程2.3具体代码2.4演示效果三、PG策略梯度(倒立摆)3.1CartPole-v1环境介绍3.2PG算法流程(REINFORCE)3.3具体代码3.4演示效果四、PPO(飞船降落)4.1LunarLander-v2环境介绍4.2PPO-Clip算法流程4.3具体代码4.4演示效果五、DQN(打砖块)5.1Breakout-v0环境介绍5.2DQN算法流程

基础的强化学习(RL)算法及代码详细demo

文章目录一、Sarsa(悬崖问题)1.1CliffWalking-v0环境介绍1.2Sarsa算法流程1.3具体代码1.4演示效果二、Q-Learning(悬崖问题)2.1CliffWalking-v0环境介绍2.2Q-Learning算法流程2.3具体代码2.4演示效果三、PG策略梯度(倒立摆)3.1CartPole-v1环境介绍3.2PG算法流程(REINFORCE)3.3具体代码3.4演示效果四、PPO(飞船降落)4.1LunarLander-v2环境介绍4.2PPO-Clip算法流程4.3具体代码4.4演示效果五、DQN(打砖块)5.1Breakout-v0环境介绍5.2DQN算法流程

windows10下安装python3.7.1,cuda10.0和cudnn7.6.4,tensorflowgpu1.15,keras2.3.1

确定自己安装python,tensorflow,kears的版本。(默认读者已安装Anaconda,并熟悉基本操作)根据tensorflow确定cuda的版本,继而确定cudnn。 一:安装cuda10.0 查看自己显卡版本,我的2060,是11.2。向下兼容,下载10.0.网址:ArchiveofPreviousCUDAReleases下载到自己新建文件夹里(C盘除外)。安装:自定义安装,不勾选vs。尽量将组件中的NVDIAGeForceExperience选项勾掉。在组件CUDA中将VisualStudioIntergration取消掉这个组件是专为VS配置的,但是现在使用的代码编译器基本

windows10下安装python3.7.1,cuda10.0和cudnn7.6.4,tensorflowgpu1.15,keras2.3.1

确定自己安装python,tensorflow,kears的版本。(默认读者已安装Anaconda,并熟悉基本操作)根据tensorflow确定cuda的版本,继而确定cudnn。 一:安装cuda10.0 查看自己显卡版本,我的2060,是11.2。向下兼容,下载10.0.网址:ArchiveofPreviousCUDAReleases下载到自己新建文件夹里(C盘除外)。安装:自定义安装,不勾选vs。尽量将组件中的NVDIAGeForceExperience选项勾掉。在组件CUDA中将VisualStudioIntergration取消掉这个组件是专为VS配置的,但是现在使用的代码编译器基本