ray.util.state.common.WorkerState#

class ray.util.state.common.WorkerState(worker_id: str, is_alive: bool, worker_type: Literal['WORKER', 'DRIVER', 'SPILL_WORKER', 'RESTORE_WORKER'], exit_type: Literal['SYSTEM_ERROR', 'INTENDED_SYSTEM_EXIT', 'USER_ERROR', 'INTENDED_USER_EXIT', 'NODE_OUT_OF_MEMORY'] | None, node_id: str, ip: str, pid: int, exit_detail: str | None = None, worker_launch_time_ms: int | None = None, worker_launched_time_ms: int | None = None, start_time_ms: int | None = None, end_time_ms: int | None = None, debugger_port: int | None = None, num_paused_threads: int | None = None)[源代码]#

基类:StateSchema

工作状态

以下列可以用于 --filter 选项。

pid

退出类型

worker_id

num_paused_threads

is_alive

worker_type

debugger_port

ip

节点ID

以下列仅在使用 get API 时可用,

--detail 通过 CLI 指定,或者 detail=True 传递给 Python API。

end_time_ms

start_time_ms

pid

退出类型

worker_id

worker_launch_time_ms

num_paused_threads

is_alive

worker_type

debugger_port

ip

worker_launched_time_ms

节点ID

退出详情

worker_id: str#

工人的ID。

is_alive: bool#

工作线程是否存活。

worker_type: Literal['WORKER', 'DRIVER', 'SPILL_WORKER', 'RESTORE_WORKER']#

驱动程序(调用 ray.init 的 Python 脚本)。 - SPILL_WORKER:溢出对象的工作线程。 - RESTORE_WORKER:恢复对象的工作线程。

类型:
  • 驱动程序

exit_type: Literal['SYSTEM_ERROR', 'INTENDED_SYSTEM_EXIT', 'USER_ERROR', 'INTENDED_USER_EXIT', 'NODE_OUT_OF_MEMORY'] | None#

如果工作进程已死亡,则工作进程的退出类型。

  • SYSTEM_ERROR: 工作进程因系统级故障退出(例如,工作进程崩溃)。

  • INTENDED_SYSTEM_EXIT: 预期的系统级退出。例如,工作进程因长时间空闲而被终止。

  • USER_ERROR: 由于用户错误,工作进程退出。例如,从角色初始化中抛出的异常。

  • INTENDED_USER_EXIT: 用户预期的退出(例如,用户以退出码0退出工作进程或由Ray API发起的退出,如ray.kill)。

node_id: str#

工作节点的ID。

ip: str#

工作节点的IP地址。

pid: int#

工作者的进程ID。

exit_detail: str | None = None#

如果工作进程已终止,则显示工作进程的退出详情。

worker_launch_time_ms: int | None = None#

工作线程首次启动的时间。如果该值不存在,则为-1。工作线程的生命周期如下。worker_launch_time_ms(进程启动请求)。-> worker_launched_time_ms(进程启动)。-> start_time_ms(工作线程准备就绪)。-> end_time_ms(工作线程被销毁)。

worker_launched_time_ms: int | None = None#

如果该值不存在,时间工作者成功启动 -1。

start_time_ms: int | None = None#

工作线程启动并初始化的时间。如果该值不存在,则为0。

end_time_ms: int | None = None#

工作线程退出的时间。如果工作线程意外死亡,时间戳可能会延迟。如果该值不存在,则为0。