ray.rllib.algorithms.algorithm.Algorithm.training_iteration#

property Algorithm.training_iteration#

当前训练迭代次数(与 self.iteration 相同)。

这个值在每次调用 train() 时会自动递增,并自动插入到训练结果字典中。