vLLM 的基准测试套件

vLLM 的基准测试套件#

vLLM 包含两组基准测试:

  • 性能基准: 在高频率下(当vLLM的拉取请求(简称PR)被合并时)基准测试vLLM在各种工作负载下的性能。查看 vLLM性能仪表盘 获取最新的性能结果。

  • 夜间基准测试: 在 vLLM 有重大更新时(例如,升级到新版本),比较 vLLM 与其他替代方案(tgi、trt-llm 和 lmdeploy)的性能。最新结果可在 vLLM GitHub README 中查看。

触发基准测试#

性能基准测试和夜间基准测试可以通过向 vLLM 提交 PR 来触发,并在 PR 上标记 perf-benchmarksnightly-benchmarks

备注

请参考 vLLM 性能基准描述vLLM 夜间基准描述 以获取关于基准环境、工作负载和指标的详细描述。