版本 1.0
ClearML 代理 1.0.0
功能
- 添加conda和pip环境的调试打印(使用
--debug
) - 添加对 PyJWT v2 的支持
- 更改默认的conda通道顺序,以便拉取正确的
pytorch
包 - 改进k8s glue支持
- 支持k8s glue容器环境变量合并
- 使用
max_pods_limit
参数为k8s glue添加pod数量限制(在k8s glue示例中使用--max-pods
开关) - 在模板中添加k8s glue默认的
restartPolicy=Never
以防止pod重启
- 为动态GPU添加
--stop
开关支持 - 验证在docker模式下运行时
docker
命令是否存在 - 在动态模式下添加对
sig_term
终止docker的支持 - Add a stop message when the task process terminates
- 添加
agent.docker_install_opencv_libs
配置选项以启用自动安装 opencv 库,以加快 docker 启动速度(默认值:true
,参见 这里) - 添加对新容器基础设置脚本功能的支持
- 提升virtualenv依赖版本(支持
v>=16,<21
) - 添加对动态GPU机会调度的支持(每个队列的最小/最大GPU数)
- 弃用配置中的
venv_update
(已被更健壮的venvs_cache
取代) - Add Python 3.9 to the support table
错误修复
- 修复代理可以返回非零错误代码,导致 pod 无限重启 (clearml-agent GitHub Issue 56)
- 修复 poetry 支持 (clearml-agent GitHub Issue 57)
- 修复从驱动程序获取的cuda版本不返回次要版本的问题
- 修复在使用缓存时替换回本地路径的需求
- 修复k8s glue
- 修复损坏的k8s glue docker参数解析
- 修复空环境变量在合并模板时阻止覆盖的问题
- 修复虚拟环境缓存因错误的符号链接而崩溃的问题
- 修复未提供docker参数的问题