ray.rllib.models.distributions.Distribution.to_deterministic#

Distribution.to_deterministic() Distribution[源代码]#

返回此分布的确定性等价物。

具体来说,分类分布的确定性等价物是一个确定性分布,它选择具有最大logit值的动作。通常,确定性替换的选择是由既定惯例决定的。