ray.rllib.models.tf.tf_modelv2.TFModelV2#

class ray.rllib.models.tf.tf_modelv2.TFModelV2(obs_space: gymnasium.spaces.Space, action_space: gymnasium.spaces.Space, num_outputs: int, model_config: dict, name: str)[源代码]#

基类:ModelV2

ModelV2 的 TF 版本,应包含一个 tf keras 模型。

请注意,除非你在子类中实现 forward(),否则这个类本身不是一个有效的模型。

方法

__init__

初始化一个 TFModelV2 实例。

context

返回当前 TF 图的上下文管理器。

custom_loss

覆盖以自定义用于优化此模型的损失函数。

forward

使用给定的输入张量和状态调用模型。

get_initial_state

获取模型的初始递归状态值。

is_time_major

如果为 True,调用此 ModelV2 的数据必须为时间优先格式。

last_output

返回从调用模型返回的最后一个输出。

metrics

覆盖以从您的模型返回自定义指标。

register_variables

将给定的变量列表注册到此模型中。

update_ops

返回此模型的更新操作列表。

value_function

返回最近一次前向传递的值函数输出。