ray.rllib.policy.policy.Policy.get_权重#

Policy.get_weights() dict[源代码]#

返回模型权重。

注意:此方法的返回值将位于 Policy.get_state() 返回值的 “weights” 键下。模型权重只是策略状态的一部分。其他状态信息包含:优化器变量、探索状态,以及全局状态变量,如采样时间步。

返回:

模型权重的可序列化副本或视图。