ray.rllib.utils.exploration.exploration.Exploration.设置状态#

Exploration.set_state(state: object, sess: tf.Session | None = None) None[源代码]#

将 Exploration 对象的状态设置为给定的值。

请注意,一些探索组件是无状态的,即使它们随着时间的推移会衰减某些值(例如 EpsilonGreedy)。然而,这种衰减仅依赖于策略的当前全局时间步长,因此我们不需要跟踪它。

参数:
  • state – 设置此探索的状态。

  • sess – 一个可选的 tf Session 对象来使用。