ray.rllib.policy.sample_batch.MultiAgentBatch.__init__# MultiAgentBatch.__init__(policy_batches: Dict[str, SampleBatch], env_steps: int)[源代码]# 初始化一个 MultiAgentBatch 实例。 参数: policy_batches – 字典映射策略ID到经验的SampleBatches。 env_steps – 此批次包含的环境步骤数。这将会少于此批次中所有策略包含的转换总数。