ray.rllib.policy.sample_batch.MultiAgentBatch.env_steps# MultiAgentBatch.env_steps() → int[源代码]# 环境步数(每个环境步数至少有1个代理步数)。 返回: 此批次中包含的环境步骤数。