版本 1.1
ClearML 代理 1.1.2
错误修复
- 修复
six
与新版本pathlib2
2.3.7及以上版本的冲突。
ClearML 代理 1.1.1
功能与错误修复
- 添加支持,使用
agent.truncate_task_output_files
配置设置,在向服务器报告后截断任务日志文件 - 修复 PyJWT 的弹性支持
- 修复
--stop
检查默认队列标签 (ClearML Agent GitHub 问题 #80) - 修复队列标签
default
不存在且未指定--queue
的问题(尝试使用名为"default"
的队列) - 修复 Python 3.5 兼容性问题
- 修复PyTorch对PY2.7的支持
ClearML 代理 1.1.0
Breaking Changes
ClearML 代理将不再默认尝试使用演示服务器(通过设置 CLEARML_NO_DEFAULT_SERVER=0
环境变量来更改此行为)
ClearML k8s 胶水默认的 pod 标签已更改为 CLEARML=agent
(而不是 TRAINS=agent
)
功能
- 将poetry缓存添加到docker映射中 (ClearML Agent GitHub 问题 #74)
- 允许重写SSH URL(参见此处),参考ClearML Agent GitHub PR #72(ClearML Agent GitHub 问题 #42)
- 添加Docker环境参数日志屏蔽支持,可使用
agent.hide_docker_command_env_vars
配置值进行自定义(参见此处)(ClearML Agent GitHub 问题 #67) - 添加支持使用
agent.docker_container_name_format
配置选项来命名docker容器,以设置名称格式(默认禁用)(ClearML问题 #412) - k8s glue
- 从pod名称中移除队列名称,将队列名称和ID添加到pod标签中 (ClearML Agent GitHub 问题 #64)
- 更新任务
status_message
以处理无响应或挂起的pod - 支持
agent.docker_force_pull
配置选项用于调度的pod - 添加docker示例,用于在k8s集群中作为pod运行k8s glue
- 添加
agent.ignore_requested_python_version
配置选项以忽略任何请求的 Python 版本(默认值为 false,参见 这里) - 添加
agent.docker_internal_mounts
配置选项以控制容器的内部挂载(非根容器,参见 这里) - 在已安装包部分添加对
-r requirements.txt
的支持 - 添加对
CLEARML_AGENT_INITIAL_CONNECT_RETRY_OVERRIDE
环境变量的支持,以覆盖初始服务器连接行为(默认为true,允许布尔值或指定连接重试次数的显式数字) - 添加对
CLEARML_AGENT_DISABLE_SSH_MOUNT
环境变量的支持,允许禁用自动将.ssh
挂载到docker中 - 添加对
CLEARML_AGENT_SKIP_PIP_VENV_INSTALL
环境变量的支持,以在执行时跳过Python虚拟环境的安装,并允许提供自定义的venv二进制文件 - 添加对
CLEARML_AGENT_VENV_CACHE_PATH
环境变量的支持,以允许覆盖venv缓存文件夹配置 - 添加对
CLEARML_AGENT_EXTRA_DOCKER_ARGS
环境变量的支持,以允许覆盖额外的docker参数配置 - 添加对使用shlex包含bash样式字符串列表的环境变量的支持
- 在使用环境变量中的ClearML密钥/秘密时添加打印输出
- Increase the worker's keep-alive timeout to 10 minutes instead of 1 minute
- 更新文档
错误修复
- 修复自动挂载
SSH_AUTH_SOCK
到 docker 的问题 (ClearML Agent GitHub 问题 #45) - 修复包管理器配置文档 (ClearML Agent GitHub 问题 #78)
- 修复了对docker参数中空格的支持(ClearML GitHub issue #358)
- 修复使用预先存在的conda虚拟环境的独立脚本
- 修复不支持PyYAML v5.4, v5.4.1版本的问题
- 修复解析以
git+git@
开头的VCS链接(注意git+git://
已经支持) - 修复带有
git+git://
链接或git+ssh://
转换的Python包 - 修复
--services-mode
,如果执行代理在开始运行时失败并返回错误代码0 - 修复了动态GPU的
--stop
功能 - 修复对Unicode独立脚本的支持,将默认的
ascii
编码更改为UTF-8
- 修复了venv缓存无法使用HTTP凭据从git重新安装包的问题
- 修复当
PYTHONIOENCODING
环境变量已定义时被覆盖的问题 - k8s glue
- 修复支持多个k8s glue实例的pod限制
- 修复任务容器处理失败解析docker镜像的问题
- 修复使用默认镜像/参数时未设置任务容器的问题
- 修复未指定镜像时使用任务容器镜像参数的问题
- 修复未提供模板时不支持任务容器参数的问题
- 修复
agent.extra_docker_bash_script
未正确应用的问题 - 修复重新排队任务时任务运行时属性被移除的问题
- 修复无法将任务推送到队列时未抛出错误的问题