ray.rllib.policy.policy.Policy.set_weights#

Policy.set_weights(weights: dict) None[源代码]#

设置此策略模型的权重。

注意:模型权重仅是策略状态的一部分。其他状态信息包括:优化器变量、探索状态,以及全局状态变量,如采样时间步。

参数:

weights – 模型权重的可序列化副本或视图。