Skip to main content

版本 1.4

ClearML 代理 1.4.1

新功能和改进

  • 如果venv缓存被禁用,则添加警告
  • 添加 agent.disable_ssh_mount 配置选项(与 CLEARML_AGENT_DISABLE_SSH_MOUNT 环境变量相同)

错误修复

  • 修复用于监控子代理的docker命令
  • 修复 --gpus all 在工作机器上不报告 GPU 统计信息的问题

ClearML 代理 1.4.0

新功能和改进

  • 添加对MIG设备的支持(使用0:1表示GPU 0的切片1,或使用0.1)
  • 添加 agent.enable_git_ask_pass 以改进将用户/密码传递给 git 命令
  • 添加docker ssh_ro_folder(默认/.ssh)并更改docker ssh_folder(默认:~/.ssh
  • 允许覆盖pytorch查找页面(请参阅agent.package_manager配置设置下的torch_pagetorch_nightly_pagetorch_url_template_prefix
  • 添加对中止回调注册的支持
  • K8s 胶水
    • 添加 CLEARML_K8S_GLUE_START_AGENT_SCRIPT_PATH 环境变量以允许自定义代理启动脚本位置
    • 添加调试环境变量 CLEARML_AGENT_DEBUG_INFO
    • 添加 CLEARML_AGENT_CHILD_AGENTS_COUNT_CMD 环境变量以允许覆盖 k8s 中的子代理计数命令
    • 重构模板处理 错误修复
  • 修复对Python 3.10+的支持
  • 修复配置文件中缺少use_credentials_chain的示例
  • 修复 Git PAT 消息
  • 修复clearml.conf中的主文件夹为~(而不是/root
  • 修复了docker模式使用~/.clearml/venvs-builds作为默认值,以便更容易使用用户模式容器
  • 修复包 @ file:// 带有引号(URL 风格)的链接不应被忽略
  • 修复名称未作为正则表达式转义的问题(所有服务的“get_all”都使用正则表达式来匹配名称)
  • 修复如果容器更改了内部文件,第二个 .ssh 临时挂载失败的问题
  • 修复GCP负载均衡器不转发GET请求体的问题(允许将默认请求操作更改为PUT/POST/GET。请参阅 api.http.default_methodCLEARML_API_DEFAULT_REQ_METHOD
  • K8s 胶水
    • 修复解析 k8s 挂起队列可能导致创建具有 UUID 名称的队列
    • 修复模板命名空间应覆盖默认命名空间
    • 修复初始 bash 脚本中的 extra_bash_init_cmd 位置
    • 修复调试模式
  • 修复了文档 (ClearML Agent PR #117)