版本 1.7
ClearML 代理 1.7.0
新功能
- 添加
agent.docker_args_extra_precedes_task
和agent.protected_docker_extra_args
配置设置,以防止agent.extra_docker_args
和任务的 docker 参数同时使用相同的开关 - 添加
agent.resource_monitoring.disk_use_path
配置选项,以允许监控不同于包含主文件夹的卷 - 将默认的
agent.enable_git_ask_pass
更改为true
- 添加示例并支持预构建容器,包括带有覆盖的服务模式支持
CLEARML_AGENT_FORCE_CODE_DIR
和CLEARML_AGENT_FORCE_EXEC_SCRIPT
- 在运行服务任务时添加
CLEARML_AGENT_SERVICE_TASK=1
环境变量 - 添加
CLEARML_AGENT_TEMP_STDOUT_FILE_DIR
以允许指定用于存储代理日志文件和临时日志文件的临时目录(守护进程和执行) - 更新GPU统计信息和pynvml支持
- 使用
CLEARML_AGENT_GIT_CLONE_VERBOSE
环境变量增加git克隆的详细程度 - k8s glue
- 在移动到
k8s_scheduler
队列之前中止时添加状态原因 - 在清理挂起的pod时,验证任务是否仍然中止并且pod是否仍然挂起,然后再删除pod
- 在k8s pod执行中设置工作ID
- 在移动到
错误修复
- 修复
agent.package_manager.poetry_install_extra_args
在所有 Poetry 命令中使用,而不仅仅是在install
中使用 (ClearML Agent GitHub 问题 #173) - 修复如果进程返回代码是SIGKILL(-9或137)并且调用了中止回调,不要标记为失败而是标记为中止
- 修复
agent.git_host
设置会导致 git@domain 的 URL 无法被 SSH URL 替换,因为 furl 无法解析它们以获取主机 - 修复了一个环境变量,该变量应设置为数值0(即最终为
"0"
或"0.0"
),但被设置为空字符串 - 修复
agent.package_manager.extra_index_url
在配置打印输出中未进行清理的URL - 修复深度复制会话时的递归问题
- k8s glue
- 修复在应用过程中更改时可能被污染的k8s glue配置
- 修复如果容器不包含参数字段时的
KeyError