ray.rllib.evaluation.rollout_worker.RolloutWorker.set_weights#

RolloutWorker.set_weights(weights: Dict[str, dict], global_vars: Dict | None = None, weights_seq_no: int | None = None) None[源代码]#

设置此工作者的每个策略的模型权重。

参数:
  • weights – 字典映射策略ID到要使用的新权重。

  • global_vars – 一个可选的全局变量字典,用于设置此工作器。如果为 None,则不更新 global_vars。

  • weights_seq_no – 如果需要,可以向此方法传递权重的版本序列号。如果不是 None,将存储此序列号(在 self.weights_seq_no 中),并且在未来的调用中 - 如果序列号相对于上次调用没有变化 - 将忽略调用以节省性能。

from ray.rllib.evaluation.rollout_worker import RolloutWorker
# Create a RolloutWorker.
worker = ...
weights = worker.get_weights()
# Set `global_vars` (timestep) as well.
worker.set_weights(weights, {"timestep": 42})