云SaaS¶
先决条件
概述¶
LangGraph的云SaaS是一个用于部署LangGraph API的托管服务,无论其定义或依赖关系如何。该服务提供了检查点和存储的托管实现,使您能够专注于为您的用例构建合适的认知架构。通过处理可扩展和安全的基础设施,LangGraph云为您快速将LangGraph API部署到生产环境提供了最佳路径。
部署¶
**部署**是一个LangGraph API的实例。一个部署可以有多个修订版本。创建部署时,所有必要的基础设施(例如数据库、容器、秘密存储)都会自动配置。有关更多详细信息,请参阅下面的架构图。
请参阅如何创建新的部署指南。
资源分配¶
| 部署类型 | CPU | 内存 | 扩展 |
|---|---|---|---|
| 开发 | 1 CPU | 1 GB | 最多1个容器 |
| 生产 | 1 CPU | 2 GB | 最多10个容器 |
自动缩放¶
生产类型的部署会自动扩展到10个容器。扩展是基于单个容器的当前请求负载。具体来说,自动缩放实现会调整部署,使每个容器大约处理10个并发请求。例如...
- 如果部署处理20个并发请求,部署将从1个容器扩展到2个容器(20请求 / 2容器 = 每个容器10请求)。
- 如果2个容器的部署正在处理10个请求,部署将从2个容器缩减到1个容器(10请求 / 1容器 = 每个容器10请求)。
每个容器每10个并发请求是目标阈值。然而,每个容器10个并发请求并不是硬性限制。如果有突发请求,当前请求的数量可以超过10。
缩减操作会延迟30分钟才会采取任何行动。换句话说,如果自动缩放实施决定缩减一个部署,它会先等待30分钟,然后再缩减。30分钟后,将重新计算并发指标,并且如果并发指标满足目标阈值,部署将缩减。否则,部署将保持扩展状态。这个“冷却”期确保部署不会频繁地上下波动。
在未来,自动缩放实现可能会发展以适应其他指标,例如后台运行队列大小。
修订版本¶
修订版本是一个部署的迭代。当创建一个新部署时,会自动创建一个初始修订版本。要部署新的代码更改或更新环境变量配置,必须创建一个新的修订版本。当创建修订版本时,会自动构建一个新的容器镜像。
请参阅如何创建新修订版本指南。
异步部署¶
部署和修订版本的基础设施是异步配置和部署的。它们不会在提交后立即部署。目前,部署可能需要几分钟时间。
- 当创建新的部署时,会为该部署创建一个新的数据库。数据库创建是一次性步骤。此步骤使部署的初始修订版本的时间变得更长。
- 当为一个部署创建后续修订版本时,没有数据库创建步骤。与初始修订版本的部署时间相比,后续修订版本的部署时间显著更快。
- 每个修订版本的部署过程都包含一个构建步骤,这可能需要几分钟的时间。
对于开发类型部署,数据库创建所需时间比生产类型部署更长。
架构¶
可能会更改
云SaaS部署架构未来可能会发生变化。
云SaaS部署的高层次图。
