ray.rllib.utils.exploration.random.Random.get_探索优化器#

Random.get_exploration_optimizer(optimizers: List[torch.optim.Optimizer | tf.keras.optimizers.Optimizer]) List[torch.optim.Optimizer | tf.keras.optimizers.Optimizer]#

可以将优化器添加到策略自身的 optimizers 中。

优化器的数量(策略的加上探索的优化器)必须与策略的损失函数和探索组件的损失项产生的损失项数量相匹配。

参数:

optimizers – 策略的局部优化器列表。

返回:

更新后的本地优化器列表,用于不同的损失项。