ray.rllib.policy.policy.Policy.set_weights# Policy.set_weights(weights: dict) → None[源代码]# 设置此策略模型的权重。 注意:模型权重仅是策略状态的一部分。其他状态信息包括:优化器变量、探索状态,以及全局状态变量,如采样时间步。 参数: weights – 模型权重的可序列化副本或视图。