草庐IT

MountainCar

全部标签

DRL深度强化学习代码实战1——MountainCar-v0小车成功登顶

如果你是刚刚接触DRL的同学,那么本文的内容就是引你入胜的第一个小实验。DRL的学习离不开理论知识,但更不能缺少实践!废话不多说我们直接开始。0、实验环境和包版本①PyCharm2022Pro②gym0.25.2③python3.8.16④numpy1.23.51、初步了解Gym关于gym(以及其他的库/包),了解它的最好方法我认为是直接看官方文档,因为官方的文档和说明永远是最权威最前沿的,你看再多的类似于这篇文章的学习分享,也都是二手内容,要知道这些Python库是在不断更新升级的,但是这些文章可能不会更新得那么快。在此我强烈建议当你慢慢熟悉这些环境、知识、框架的时候,可以试着通过阅读、查看

python - 为什么 episode 在 200 个时间步之后完成(Gym 环境 MountainCar)?

当在Python中使用来自OpenAI-gym的MountainCar-v0环境时,done的值将在200个时间步后为真。这是为什么?由于未达到目标状态,因此不应完成该剧集。importgymenv=gym.make('MountainCar-v0')env.reset()for_inrange(300):env.render()res=env.step(env.action_space.sample())print(_)print(res[2])我想运行step方法直到汽车到达标志,然后中断for循环。这可能吗?类似这样的东西:n_episodes=10done=Falseforii