Skip to main content

版本 1.7

ClearML 代理 1.7.0

新功能

  • 添加 agent.docker_args_extra_precedes_taskagent.protected_docker_extra_args 配置设置,以防止 agent.extra_docker_args 和任务的 docker 参数同时使用相同的开关
  • 添加agent.resource_monitoring.disk_use_path配置选项,以允许监控不同于包含主文件夹的卷
  • 将默认的 agent.enable_git_ask_pass 更改为 true
  • 添加示例并支持预构建容器,包括带有覆盖的服务模式支持 CLEARML_AGENT_FORCE_CODE_DIRCLEARML_AGENT_FORCE_EXEC_SCRIPT
  • 在运行服务任务时添加CLEARML_AGENT_SERVICE_TASK=1环境变量
  • 添加 CLEARML_AGENT_TEMP_STDOUT_FILE_DIR 以允许指定用于存储代理日志文件和临时日志文件的临时目录(守护进程和执行)
  • 更新GPU统计信息和pynvml支持
  • 使用CLEARML_AGENT_GIT_CLONE_VERBOSE环境变量增加git克隆的详细程度
  • k8s glue
    • 在移动到k8s_scheduler队列之前中止时添加状态原因
    • 在清理挂起的pod时,验证任务是否仍然中止并且pod是否仍然挂起,然后再删除pod
    • 在k8s pod执行中设置工作ID

错误修复

  • 修复 agent.package_manager.poetry_install_extra_args 在所有 Poetry 命令中使用,而不仅仅是在 install 中使用 (ClearML Agent GitHub 问题 #173)
  • 修复如果进程返回代码是SIGKILL(-9或137)并且调用了中止回调,不要标记为失败而是标记为中止
  • 修复 agent.git_host 设置会导致 git@domain 的 URL 无法被 SSH URL 替换,因为 furl 无法解析它们以获取主机
  • 修复了一个环境变量,该变量应设置为数值0(即最终为"0""0.0"),但被设置为空字符串
  • 修复 agent.package_manager.extra_index_url 在配置打印输出中未进行清理的URL
  • 修复深度复制会话时的递归问题
  • k8s glue
    • 修复在应用过程中更改时可能被污染的k8s glue配置
    • 修复如果容器不包含参数字段时的KeyError