Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.policy.policy.Policy.init#

Policy.__init__(observation_space: gymnasium.Space, action_space: gymnasium.Space, config: dict)[源代码]#

初始化一个策略实例。

参数:

observation_space – 策略的观察空间。
action_space – 策略的动作空间。
config – 一个完整的算法/策略配置字典。有关默认配置键和值，请参阅 rllib/algorithm/algorithm.py。