ray.rllib.models.torch.torch_modelv2.TorchModelV2#
- class ray.rllib.models.torch.torch_modelv2.TorchModelV2(obs_space: gymnasium.spaces.Space, action_space: gymnasium.spaces.Space, num_outputs: int, model_config: dict, name: str)[源代码]#
基类:
ModelV2
ModelV2 的 Torch 版本。
请注意,除非你从 nn.Module 继承并在子类中实现 forward(),否则这个类本身不是一个有效的模型。
方法
初始化一个 TorchModelV2。
返回当前前向传递的上下文管理器。
覆盖以自定义用于优化此模型的损失函数。
使用给定的输入张量和状态调用模型。
获取模型的初始递归状态值。
如果为 True,调用此 ModelV2 的数据必须为时间优先格式。
返回从调用模型返回的最后一个输出。
覆盖以从您的模型返回自定义指标。
返回最近一次前向传递的值函数输出。