ray.rllib.utils.exploration.random.Random#
- class ray.rllib.utils.exploration.random.Random(action_space: gymnasium.spaces.Space, *, model: ModelV2, framework: str | None, **kwargs)[源代码]#
基类:
Exploration
一个随机动作选择器(当 explore=False 时为确定性/贪婪)。
如果 explore=True,则从
self.action_space
中随机返回动作(通过 Space.sample())。如果 explore=False,则返回贪婪/最大似然动作。方法
初始化一个随机探索对象。
在调用 policy.compute_actions() 之前的准备工作钩子。
可以将优化器添加到策略自身的
optimizers
中。返回当前的探索状态。
在剧集结束时处理必要的探索逻辑。
在剧集开始时处理必要的探索逻辑。
处理已完成剧情节点的后处理。
将 Exploration 对象的状态设置为给定的值。