MountainCar_草庐IT

DRL深度强化学习代码实战1——MountainCar-v0小车成功登顶

如果你是刚刚接触DRL的同学，那么本文的内容就是引你入胜的第一个小实验。DRL的学习离不开理论知识，但更不能缺少实践！废话不多说我们直接开始。0、实验环境和包版本①PyCharm2022Pro②gym0.25.2③python3.8.16④numpy1.23.51、初步了解Gym关于gym（以及其他的库/包），了解它的最好方法我认为是直接看官方文档，因为官方的文档和说明永远是最权威最前沿的，你看再多的类似于这篇文章的学习分享，也都是二手内容，要知道这些Python库是在不断更新升级的，但是这些文章可能不会更新得那么快。在此我强烈建议当你慢慢熟悉这些环境、知识、框架的时候，可以试着通过阅读、查看

python - 为什么 episode 在 200 个时间步之后完成(Gym 环境 MountainCar)？

当在Python中使用来自OpenAI-gym的MountainCar-v0环境时，done的值将在200个时间步后为真。这是为什么？由于未达到目标状态，因此不应完成该剧集。importgymenv=gym.make('MountainCar-v0')env.reset()for_inrange(300):env.render()res=env.step(env.action_space.sample())print(_)print(res[2])我想运行step方法直到汽车到达标志，然后中断for循环。这可能吗？类似这样的东西:n_episodes=10done=Falseforii