ray.rllib.env.env_runner.环境运行器#

class ray.rllib.env.env_runner.EnvRunner(*, config: AlgorithmConfig, **kwargs)[源代码]#

基类:FaultAwareApply

分布式RL风格环境数据收集的基类。

EnvRunner API 的核心功能可以概括为: - 通过将 AlgorithmConfig 对象传递给构造函数进行配置。通常,EnvRunner 的子类会构建它们自己的环境(可能是向量化的)副本和 RLModules/Policies,并使用后者来逐步通过环境以收集训练数据。 - EnvRunner 的客户端可以使用 sample() 方法从环境中收集用于训练的数据。 - EnvRunner 通过基于此类创建 n 个远程 Ray 执行者来提供并行性。使用 ray.remote([resources])(EnvRunner) 方法创建相应的 Ray 远程类。然后使用 Ray 的 [ctor].remote(...) 语法实例化 n 个执行者。 - EnvRunner 的客户端可以获取有关运行各个执行者的服务器/节点的信息。

PublicAPI (alpha): 此API处于alpha阶段,可能在稳定之前发生变化。

方法

__init__

初始化一个 EnvRunner 实例。

apply

使用此 Actor 实例调用给定的函数。

assert_healthy

检查 self.__init__() 是否已正确完成。

get_spaces

返回一个字典,将 ModuleIDs 映射到观察空间和动作空间的 2-元组。

make_env

为此 EnvRunner 创建 RL 环境并将其分配给 self.env

ping

Ping 操作者。

sample

返回从该 EnvRunner 中采样的经验(任何形式)。

stop

释放此 EnvRunner 使用的所有资源。