版本 1.8
ClearML 代理 1.8.1
新功能
- 添加选项以设置守护进程轮询间隔 (ClearML Agent GitHub PR #197)
- 添加 Python 3.12 支持
错误修复
- 修复在缓存无效的git条目时进行git拉取的问题。在出错时,重新克隆整个仓库(通过启用
agent.vcs_cache.clone_on_pull_fail: true
来实现) - 修复如果安装到基础conda或现有conda环境中,conda环境不应被缓存的问题
- 修复缓存的仓库在拉取时未传递用户/令牌的问题
- 修复在禁用VCS缓存时不要将VCS挂载点添加到容器中
ClearML 代理 1.8.0
新功能
- 添加
CLEARML_AGENT_FORCE_POETRY
环境变量,以允许即使在使用pip需求管理器时也能强制使用poetry - 添加
CLEARML_AGENT_FORCE_TASK_INIT
环境变量,以允许在未指定存储库且代码运行在预安装的 docker 中的情况下,对脚本进行运行时修补。 - 改进虚拟环境缓存处理:
- 添加
FileLock
只读模式,默认是写模式(即独占锁,保留行为) - 添加虚拟环境缓存现在在将文件夹从虚拟环境缓存复制到目标文件夹时使用只读锁。这使得可以进行多次读取,单次写入操作
- 如果不需要删除旧条目,则不锁定缓存文件夹
- 添加
agent.venvs_cache.lock_timeout
来控制虚拟环境缓存文件夹的锁定超时(以秒为单位,默认30)
- 添加
- 为
truncate()
调用添加保护 - 将配置清理设置移动到默认配置文件中
- 在拉取任务之前添加队列ID报告
- 改进MIGs的GPU监控
错误修复
- 在Poetry初始化中使用正确的Python版本 (ClearML Agent GitHub PR #179)
- 修复
K8sIntegration
和k8s_glue_example.py
中的队列处理 (ClearML Agent GitHub PR #183) - 修复在
find_python_executable_for_version
中的FileNotFoundException
崩溃问题(ClearML Agent GitHub 问题 #164) - 修复任务执行完成后删除临时控制台管道日志文件的问题(对于长时间运行的服务代理来说,避免在主机上收集临时文件非常重要)
- 修复
agent.enable_git_ask_pass
在配置转储中不显示的问题 - 修复如果
agent.package_manager.pip_version
中没有值,pip
会被返回为pip版本的问题 - 通过移除
distutil
导入来修复Python 3.12的支持 - 修复在使用共享文件夹时文件锁定的
IOError
- 修复了应用于
PytorchRequirement
实例的torch解析器设置未被使用的问题 - 修复在docker启动bash脚本中未忽略以
#
开头的注释行 - 修复动态GPU有时会错过初始打印的问题