亚特兰蒂斯

../../_images/atlantis.gif

这个环境是 Atari 环境 的一部分。请先阅读该页面以获取一般信息。

动作空间

离散(4)

观察空间

Box(0, 255, (210, 160, 3), uint8)

导入

gymnasium.make("ALE/Atlantis-v5")

有关具有不同观察和动作空间的更多亚特兰蒂斯变体,请参阅变体部分。

描述

你的任务是保卫沉没的城市亚特兰蒂斯。你的敌人缓慢地向城市逼近,你必须在他们到达攻击距离之前摧毁他们。为此,你控制着三个防御哨所。如果你的敌人成功摧毁了亚特兰蒂斯的七个设施,你就输了。你可以在击退一波敌人并获得足够的分数后重建设施。

如需更详细的文档,请参阅 AtariAge页面

动作

亚特兰蒂斯具有 Discrete(4) 的动作空间,下表列出了每个动作的含义。要启用可以在 Atari 2600 上执行的所有 18 种可能的动作,请在初始化期间指定 full_action_space=True,或者通过将 full_action_space=True 传递给 gymnasium.make

意义

意义

意义

0

NOOP

1

FIRE

2

RIGHTFIRE

3

LEFTFIRE

观察

Atari 环境有三种可能的观察类型:"rgb""grayscale""ram"

  • obs_type="rgb" -> observation_space=Box(0, 255, (210, 160, 3), np.uint8)

  • obs_type="ram" -> observation_space=Box(0, 255, (128,), np.uint8)

  • obs_type="grayscale" -> Box(0, 255, (210, 160), np.uint8),这是“rgb”类型的灰度版本

请参阅变体部分,了解每个环境ID默认使用的观察类型。

奖励

你通过摧毁敌人、在攻击波中保护设施来得分。如果你能用外围防御哨所之一摧毁敌人,你会得到更多分数。欲了解更多详细文档,请参阅 AtariAge 页面

变体

亚特兰蒂斯有以下几种环境ID变体,它们在观察、帧跳过次数和重复动作概率方面有所不同。

环境-ID

obs_type=

frameskip=

repeat_action_probability=

亚特兰蒂斯-v0

"rgb"

(2, 5)

0.25

亚特兰蒂斯-ram-v0

"ram"

(2, 5)

0.25

Atlantis-ramDeterministic-v0

"ram"

4

0.25

Atlantis-ramNoFrameskip-v0

"ram"

1

0.25

AtlantisDeterministic-v0

"rgb"

4

0.25

AtlantisNoFrameskip-v0

"rgb"

1

0.25

亚特兰蒂斯-v4

"rgb"

(2, 5)

0.0

亚特兰蒂斯-ram-v4

"ram"

(2, 5)

0.0

亚特兰蒂斯-ram确定性-v4

"ram"

4

0.0

Atlantis-ramNoFrameskip-v4

"ram"

1

0.0

AtlantisDeterministic-v4

"rgb"

4

0.0

AtlantisNoFrameskip-v4

"rgb"

1

0.0

ALE/Atlantis-v5

"rgb"

4

0.25

ALE/Atlantis-ram-v5

"ram"

4

0.25

ALE/Atlantis2-v5

"rgb"

4

0.25

ALE/Atlantis2-ram-v5

"ram"

4

0.25

难度和模式

可以通过关键字参数 difficultymode 指定环境的多种风格。风格是游戏模式和难度设置的组合。下表列出了可能的难度和模式值以及默认值。

可用模式

默认模式

可用难度

默认难度

[0, 1, 2, 3]

0

[0]

0

版本历史

关于版本和配置之间复杂差异的详细讨论,可以在关于Atari环境的通用文章中找到。

  • v5: 粘性功能被重新加入,随机跳帧功能被移除。环境现在位于“ALE”命名空间中。

  • v4: 动作的粘性已被移除

  • v0: 初始版本发布