ray.rllib.policy.Policy.get_权重# Policy.get_weights() → dict[源代码]# 返回模型权重。 注意:此方法的返回值将位于 Policy.get_state() 返回值的 “weights” 键下。模型权重只是策略状态的一部分。其他状态信息包含:优化器变量、探索状态,以及全局状态变量,如采样时间步。 返回: 模型权重的可序列化副本或视图。