Skip to content

云SaaS

概述

LangGraph的云SaaS是一个用于部署LangGraph API的托管服务,无论其定义或依赖关系如何。该服务提供了检查点和存储的托管实现,使您能够专注于为您的用例构建合适的认知架构。通过处理可扩展和安全的基础设施,LangGraph云为您快速将LangGraph API部署到生产环境提供了最佳路径。

部署

**部署**是一个LangGraph API的实例。一个部署可以有多个修订版本。创建部署时,所有必要的基础设施(例如数据库、容器、秘密存储)都会自动配置。有关更多详细信息,请参阅下面的架构图

请参阅如何创建新的部署指南

资源分配

部署类型 CPU 内存 扩展
开发 1 CPU 1 GB 最多1个容器
生产 1 CPU 2 GB 最多10个容器

自动缩放

生产类型的部署会自动扩展到10个容器。扩展是基于单个容器的当前请求负载。具体来说,自动缩放实现会调整部署,使每个容器大约处理10个并发请求。例如...

  • 如果部署处理20个并发请求,部署将从1个容器扩展到2个容器(20请求 / 2容器 = 每个容器10请求)。
  • 如果2个容器的部署正在处理10个请求,部署将从2个容器缩减到1个容器(10请求 / 1容器 = 每个容器10请求)。

每个容器每10个并发请求是目标阈值。然而,每个容器10个并发请求并不是硬性限制。如果有突发请求,当前请求的数量可以超过10。

缩减操作会延迟30分钟才会采取任何行动。换句话说,如果自动缩放实施决定缩减一个部署,它会先等待30分钟,然后再缩减。30分钟后,将重新计算并发指标,并且如果并发指标满足目标阈值,部署将缩减。否则,部署将保持扩展状态。这个“冷却”期确保部署不会频繁地上下波动。

在未来,自动缩放实现可能会发展以适应其他指标,例如后台运行队列大小。

修订版本

修订版本是一个部署的迭代。当创建一个新部署时,会自动创建一个初始修订版本。要部署新的代码更改或更新环境变量配置,必须创建一个新的修订版本。当创建修订版本时,会自动构建一个新的容器镜像。

请参阅如何创建新修订版本指南

异步部署

部署修订版本的基础设施是异步配置和部署的。它们不会在提交后立即部署。目前,部署可能需要几分钟时间。

  • 当创建新的部署时,会为该部署创建一个新的数据库。数据库创建是一次性步骤。此步骤使部署的初始修订版本的时间变得更长。
  • 当为一个部署创建后续修订版本时,没有数据库创建步骤。与初始修订版本的部署时间相比,后续修订版本的部署时间显著更快。
  • 每个修订版本的部署过程都包含一个构建步骤,这可能需要几分钟的时间。

对于开发类型部署,数据库创建所需时间比生产类型部署更长。

架构

可能会更改

云SaaS部署架构未来可能会发生变化。

云SaaS部署的高层次图。

diagram

相关

优云智算