ray.rllib.policy.policy.Policy.get_权重#

Policy.get_weights() → dict[源代码]#

返回模型权重。

注意：此方法的返回值将位于 Policy.get_state() 返回值的 “weights” 键下。模型权重只是策略状态的一部分。其他状态信息包含：优化器变量、探索状态，以及全局状态变量，如采样时间步。