蜈蚣

../../_images/centipede.gif

这个环境是 Atari 环境 的一部分。请先阅读该页面以获取一般信息。

动作空间

离散(18)

观察空间

Box(0, 255, (210, 160, 3), uint8)

导入

gymnasium.make("ALE/Centipede-v5")

更多具有不同观察和动作空间的蜈蚣变体,请参阅变体部分。

描述

你是一个精灵,必须使用你的魔法棒来抵御蜘蛛、跳蚤和蜈蚣。你的目标是保护魔法森林中的蘑菇。如果你被蜘蛛、跳蚤或蜈蚣咬到,你将会暂时瘫痪并失去一根魔法棒。一旦你失去所有魔法棒,游戏结束。你可以通过获得足够多的分数来获得额外的魔法棒。

如需更详细的文档,请参阅 AtariAge 页面

动作

蜈蚣的动作空间为 Discrete(18),下表列出了每个动作的含义。由于蜈蚣使用了所有动作,因此如果在 gymnasium.make 中传递 full_action_space=True,则不会修改环境的行为空间。

意义

意义

意义

0

NOOP

1

FIRE

2

UP

3

RIGHT

4

LEFT

5

DOWN

6

UPRIGHT

7

UPLEFT

8

DOWNRIGHT

9

DOWNLEFT

10

UPFIRE

11

RIGHTFIRE

12

LEFTFIRE

13

DOWNFIRE

14

UPRIGHTFIRE

15

UPLEFTFIRE

16

DOWNRIGHTFIRE

17

DOWNLEFTFIRE

观察

Atari 环境有三种可能的观察类型:"rgb""grayscale""ram"

  • obs_type="rgb" -> observation_space=Box(0, 255, (210, 160, 3), np.uint8)

  • obs_type="ram" -> observation_space=Box(0, 255, (128,), np.uint8)

  • obs_type="grayscale" -> Box(0, 255, (210, 160), np.uint8),这是“rgb”类型的灰度版本

请参阅变体部分,了解每个环境ID默认使用的观察类型。

奖励

你通过击中蜈蚣、蝎子、跳蚤和蜘蛛来得分。每轮结束后(即在你失去一根魔杖后),未被摧毁的蘑菇会额外加分。详细的文档可以在 AtariAge 页面 找到。

变体

蜈蚣有以下环境ID的变体,它们在观察、帧跳过次数和重复动作概率方面有以下差异。

环境-ID

obs_type=

frameskip=

repeat_action_probability=

Centipede-v0

"rgb"

(2, 5)

0.25

Centipede-ram-v0

"ram"

(2, 5)

0.25

蜈蚣-ram确定性-v0

"ram"

4

0.25

蜈蚣-无帧跳过-v0

"ram"

1

0.25

CentipedeDeterministic-v0

"rgb"

4

0.25

CentipedeNoFrameskip-v0

"rgb"

1

0.25

蜈蚣-v4

"rgb"

(2, 5)

0.0

蜈蚣-ram-v4

"ram"

(2, 5)

0.0

蜈蚣-ram确定性-v4

"ram"

4

0.0

Centipede-ramNoFrameskip-v4

"ram"

1

0.0

蜈蚣确定性-v4

"rgb"

4

0.0

CentipedeNoFrameskip-v4

"rgb"

1

0.0

ALE/Centipede-v5

"rgb"

4

0.25

ALE/Centipede-ram-v5

"ram"

4

0.25

难度和模式

可以通过关键字参数 difficultymode 指定环境的多种风格。风格是游戏模式和难度设置的组合。下表列出了可能的难度和模式值以及默认值。

可用模式

默认模式

可用难度

默认难度

[22, 86]

22

[0]

0

版本历史

关于版本和配置之间复杂差异的详细讨论,可以在关于Atari环境的通用文章中找到。

  • v5: 粘性功能被重新加入,随机跳帧功能被移除。环境现在位于“ALE”命名空间中。

  • v4: 动作的粘性已被移除

  • v0: 初始版本发布