ray.rllib.policy.sample_batch.MultiAgentBatch.wrap_as_needed#

static MultiAgentBatch.wrap_as_needed(policy_batches: Dict[str, SampleBatch], env_steps: int) → SampleBatch | MultiAgentBatch[源代码]#

根据给定的策略返回 SampleBatch 或 MultiAgentBatch。如果 policy_batches 为空（即 {}），则返回一个空的 MultiAgentBatch。

参数:

返回:

单一默认策略的 SampleBatch 或一个 MultiAgentBatch（多于一个策略）。