ray.rllib.env.env_runner.环境运行器#
- class ray.rllib.env.env_runner.EnvRunner(*, config: AlgorithmConfig, **kwargs)[源代码]#
基类:
FaultAwareApply
分布式RL风格环境数据收集的基类。
EnvRunner API 的核心功能可以概括为: - 通过将 AlgorithmConfig 对象传递给构造函数进行配置。通常,EnvRunner 的子类会构建它们自己的环境(可能是向量化的)副本和 RLModules/Policies,并使用后者来逐步通过环境以收集训练数据。 - EnvRunner 的客户端可以使用
sample()
方法从环境中收集用于训练的数据。 - EnvRunner 通过基于此类创建 n 个远程 Ray 执行者来提供并行性。使用ray.remote([resources])(EnvRunner)
方法创建相应的 Ray 远程类。然后使用 Ray 的[ctor].remote(...)
语法实例化 n 个执行者。 - EnvRunner 的客户端可以获取有关运行各个执行者的服务器/节点的信息。PublicAPI (alpha): 此API处于alpha阶段,可能在稳定之前发生变化。
方法
初始化一个 EnvRunner 实例。
使用此 Actor 实例调用给定的函数。
检查 self.__init__() 是否已正确完成。
返回一个字典,将 ModuleIDs 映射到观察空间和动作空间的 2-元组。
为此 EnvRunner 创建 RL 环境并将其分配给
self.env
。Ping 操作者。
返回从该 EnvRunner 中采样的经验(任何形式)。
释放此 EnvRunner 使用的所有资源。