Skip to main content
Open on GitHub

模型速率限制

您已达到模型提供商在给定时间段内允许的最大请求数量,并且暂时被阻止。 通常,此错误是暂时的,您的限制将在一定时间后重置。

故障排除

以下可能有助于解决此错误:

  • 联系您的模型提供商并要求提高速率限制。
  • 如果您的许多传入请求是相同的,请利用模型响应缓存
  • 如果您的应用程序允许,将请求分散到不同的提供商。
  • 使用rate_limiter来控制对模型的请求速率。

这个页面有帮助吗?