Mistral Large

Mistral Large

Mistral AI发布了Mistral,这是他们最先进的大型语言模型(LLM),具有强大的多语言、推理、数学和代码生成能力。Mistral Large通过名为la Plataforme的Mistral平台和Microsoft Azure提供。它还可以在他们的新聊天应用le Chat(在新标签页中打开)中进行测试。

下面是一个图表,展示了Mistral Large与其他强大的LLM(如GPT-4和Gemini Pro)的比较。在MMLU基准测试中,它以81.2%的得分仅次于GPT-4,排名第二。

"Mistral Large Performance"

Mistral 大型能力

Mistral Large 的能力和优势包括:

  • 32K tokens 上下文窗口
  • 具备多语言能力(精通英语、法语、西班牙语、德语和意大利语)
  • 在推理、知识、数学和编码基准测试方面具有强大的能力
  • 原生支持函数调用和JSON格式
  • 还发布了一个名为Mistral Small的低延迟模型
  • 允许开发者通过其精确的指令遵循来设计审核策略

推理与知识

下表展示了Mistral Large在常见推理和知识基准测试中的表现。它在很大程度上落后于GPT-4,但与Claude 2和Gemini Pro 1.0等其他LLM相比,它是更优秀的模型。

"Mistral Large Performance"

数学与代码生成

下表展示了Mistral Large在常见数学和编码基准测试中的表现。Mistral Large在Math和GSM8K基准测试中表现出色,但在编码基准测试中,它明显被Gemini Pro和GPT-4等模型超越。

"Mistral Large Performance"

多语言支持

下表展示了Mistral Large在多语言推理基准测试中的表现。Mistral Large在所有语言(包括法语、德语、西班牙语和意大利语)中的表现均优于Mixtral 8x7B和Llama 2 70B。

"Mistral Large Performance"

Mistral 小型

除了发布Mistral Large之外,还宣布了一个更小且优化的模型,名为Mistral Small。Mistral Small针对低延迟工作负载进行了优化,性能优于Mixtral 8x7B。Mistral AI报告称,该模型在RAG支持、函数调用和JSON格式方面具有强大的能力。

Mistral 端点和模型选择

这里 (在新标签页中打开)是Mistral AI提供的所有端点的列表。

Mistral AI 还发布了一份全面的指南 (在新标签页中打开),关于在考虑性能和成本权衡时如何选择更好的模型。

图表来源: https://mistral.ai/news/mistral-large/ (在新标签页中打开)