包装器列表¶
Gymnasium 提供了许多常用的包装器,如下所列。更多信息可以在包装器类型的页面中找到。
名称 |
描述 |
---|---|
实现了Atari环境常用的预处理技术(不包括帧堆叠)。 |
|
当达到终止或截断状态时,包装环境会自动重置。 |
|
将 |
|
将环境的奖励值裁剪在上下限之间。 |
|
向从环境中返回的观察结果添加延迟。 |
|
将观测数组的 dtype 修改为指定的 dtype。 |
|
通过一组键或索引过滤字典或元组观察空间。 |
|
将环境的观察空间展平,并对 |
|
以滚动方式堆叠过去 |
|
将由 |
|
允许在支持“rgb_array”渲染的环境中进行类似人类的渲染。 |
|
|
将基于 Jax 的环境封装起来,以便可以使用 NumPy 数组与之交互。 |
|
将基于 Jax 的环境封装起来,以便可以使用 PyTorch 张量与之交互。 |
跳过第 N 帧(观察)并返回最后两次观察之间的最大值。 |
|
将观测值标准化,使其以均值为中心,并具有单位方差。 |
|
将即时奖励归一化,使得其指数移动平均值具有固定方差。 |
|
|
将基于 NumPy 的环境封装,使其可以通过 PyTorch 张量进行交互。 |
如果在 |
|
一个被动环境检查器包装器,围绕 |
|
这个包装器将跟踪累积奖励和情节长度。 |
|
使用环境的渲染函数记录环境片段的视频。 |
|
收集环境的渲染帧,例如 |
|
在环境的观察中包含渲染的观察结果。 |
|
将环境的 |
|
将环境的 |
|
将基于数组的观测值重塑为指定形状。 |
|
使用 OpenCV 将图像观察结果调整为指定形状。 |
|
为同一 |
|
在观察中增加一个情节内所采取的时间步数。 |
|
通过在超过最大时间步数时截断环境,限制环境的步数。 |
|
在将修改后的值传递给环境 |
|
对从环境的 |
|
将一个函数应用于从环境的 |
仅向量包装器¶
名称 |
描述 |
---|---|
将向量化环境的infos从 |
|
为向量环境向量化单一代理转换动作包装器。 |
|
为向量环境向量化单一代理转换观察包装器。 |
|
向量化单一代理转换奖励包装器以用于向量环境。 |