文章目录前言一、构建自己的gym训练环境1.__init__2.seed3.step4.reset5.render6.closer二、将训练环境添加到库中1.注册2.放入库中3.测试前言本文主要对搭建自己的gym训练环境做一个详细介绍gym主页gym官方入门文档一、构建自己的gym训练环境环境中主要有六个模块,下面将主要以官方的MountainCarEnv为例对每个模块进行说明。1.__init__主要作用是初始化一些参数如在MountainCarEnv中,对car的位置大小重量做了定义,对推力大小,动作空间,观测空间做了定义。def__init__(self,goal_velocity=0)
题意: 现在有一条河,河中有n个石头,你需要从河的一端到河的另一端。现在你有一次机会在任意位置放置一个石头,请问石头放在哪里可以使过河的最长路径最短。请输出放置的石头坐标。思路: n的规模是\(1e3\),所以可以做到\(n^2\)的算法,我们把起点和终点也当做一块石头,基于贪心的思想,可以知道使最长路径最短的放法一定是在两个石子的中间点放。先预处理出起点到各个点的最短路和终点反跑到各个点的最短路,然后\(n^2\)枚举两个石头间距并将其缩短一半,更新答案。#includeusingnamespacestd;#definerep(i,a,n)for(inti=a;iPII;constint
题意: 现在有一条河,河中有n个石头,你需要从河的一端到河的另一端。现在你有一次机会在任意位置放置一个石头,请问石头放在哪里可以使过河的最长路径最短。请输出放置的石头坐标。思路: n的规模是\(1e3\),所以可以做到\(n^2\)的算法,我们把起点和终点也当做一块石头,基于贪心的思想,可以知道使最长路径最短的放法一定是在两个石子的中间点放。先预处理出起点到各个点的最短路和终点反跑到各个点的最短路,然后\(n^2\)枚举两个石头间距并将其缩短一半,更新答案。#includeusingnamespacestd;#definerep(i,a,n)for(inti=a;iPII;constint