ray.rllib.policy.sample_batch.MultiAgentBatch.__init__#

MultiAgentBatch.__init__(policy_batches: Dict[str, SampleBatch], env_steps: int)[源代码]#

初始化一个 MultiAgentBatch 实例。

参数:
  • policy_batches – 字典映射策略ID到经验的SampleBatches。

  • env_steps – 此批次包含的环境步骤数。这将会少于此批次中所有策略包含的转换总数。