Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.policy.sample_batch.MultiAgentBatch.init#

MultiAgentBatch.__init__(policy_batches: Dict[str, SampleBatch], env_steps: int)[源代码]#

初始化一个 MultiAgentBatch 实例。

参数:

policy_batches – 字典映射策略ID到经验的SampleBatches。
env_steps – 此批次包含的环境步骤数。这将会少于此批次中所有策略包含的转换总数。