ray.rllib.policy.sample_batch.MultiAgentBatch.agent_steps# MultiAgentBatch.agent_steps() → int[源代码]# 代理步骤的数量(每个环境步骤至少有1个代理步骤)。 返回: 此批次中代理步骤的总数。