ray.rllib.models.distributions.Distribution.to_deterministic#
- Distribution.to_deterministic() Distribution [源代码]#
返回此分布的确定性等价物。
具体来说,分类分布的确定性等价物是一个确定性分布,它选择具有最大logit值的动作。通常,确定性替换的选择是由既定惯例决定的。
站点导航
返回此分布的确定性等价物。
具体来说,分类分布的确定性等价物是一个确定性分布,它选择具有最大logit值的动作。通常,确定性替换的选择是由既定惯例决定的。