Skip to main content

版本 1.0

ClearML 代理 1.0.0

功能

  • 添加conda和pip环境的调试打印(使用--debug
  • 添加对 PyJWT v2 的支持
  • 更改默认的conda通道顺序,以便拉取正确的pytorch
  • 改进k8s glue支持
    • 支持k8s glue容器环境变量合并
    • 使用max_pods_limit参数为k8s glue添加pod数量限制(在k8s glue示例中使用--max-pods开关)
    • 在模板中添加k8s glue默认的restartPolicy=Never以防止pod重启
  • 为动态GPU添加--stop开关支持
  • 验证在docker模式下运行时docker命令是否存在
  • 在动态模式下添加对sig_term终止docker的支持
  • Add a stop message when the task process terminates
  • 添加 agent.docker_install_opencv_libs 配置选项以启用自动安装 opencv 库,以加快 docker 启动速度(默认值:true,参见 这里
  • 添加对新容器基础设置脚本功能的支持
  • 提升virtualenv依赖版本(支持v>=16,<21
  • 添加对动态GPU机会调度的支持(每个队列的最小/最大GPU数)
  • 弃用配置中的 venv_update(已被更健壮的 venvs_cache 取代)
  • Add Python 3.9 to the support table

错误修复

  • 修复代理可以返回非零错误代码,导致 pod 无限重启 (clearml-agent GitHub Issue 56)
  • 修复 poetry 支持 (clearml-agent GitHub Issue 57)
  • 修复从驱动程序获取的cuda版本不返回次要版本的问题
  • 修复在使用缓存时替换回本地路径的需求
  • 修复k8s glue
    • 修复损坏的k8s glue docker参数解析
    • 修复空环境变量在合并模板时阻止覆盖的问题
  • 修复虚拟环境缓存因错误的符号链接而崩溃的问题
  • 修复未提供docker参数的问题