Mistral Large

Mistral AI发布了Mistral，这是他们最先进的大型语言模型（LLM），具有强大的多语言、推理、数学和代码生成能力。Mistral Large通过名为la Plataforme的Mistral平台和Microsoft Azure提供。它还可以在他们的新聊天应用le Chat（在新标签页中打开）中进行测试。

下面是一个图表，展示了Mistral Large与其他强大的LLM（如GPT-4和Gemini Pro）的比较。在MMLU基准测试中，它以81.2%的得分仅次于GPT-4，排名第二。

"Mistral Large Performance"

Mistral 大型能力

Mistral Large 的能力和优势包括：

32K tokens 上下文窗口
具备多语言能力（精通英语、法语、西班牙语、德语和意大利语）
在推理、知识、数学和编码基准测试方面具有强大的能力
原生支持函数调用和JSON格式
还发布了一个名为Mistral Small的低延迟模型
允许开发者通过其精确的指令遵循来设计审核策略

推理与知识

下表展示了Mistral Large在常见推理和知识基准测试中的表现。它在很大程度上落后于GPT-4，但与Claude 2和Gemini Pro 1.0等其他LLM相比，它是更优秀的模型。

"Mistral Large Performance"

数学与代码生成

下表展示了Mistral Large在常见数学和编码基准测试中的表现。Mistral Large在Math和GSM8K基准测试中表现出色，但在编码基准测试中，它明显被Gemini Pro和GPT-4等模型超越。

"Mistral Large Performance"

多语言支持

下表展示了Mistral Large在多语言推理基准测试中的表现。Mistral Large在所有语言（包括法语、德语、西班牙语和意大利语）中的表现均优于Mixtral 8x7B和Llama 2 70B。

"Mistral Large Performance"

Mistral 小型

除了发布Mistral Large之外，还宣布了一个更小且优化的模型，名为Mistral Small。Mistral Small针对低延迟工作负载进行了优化，性能优于Mixtral 8x7B。Mistral AI报告称，该模型在RAG支持、函数调用和JSON格式方面具有强大的能力。

Mistral 端点和模型选择

这里 (在新标签页中打开)是Mistral AI提供的所有端点的列表。

Mistral AI 还发布了一份全面的指南 (在新标签页中打开)，关于在考虑性能和成本权衡时如何选择更好的模型。

图表来源: https://mistral.ai/news/mistral-large/ (在新标签页中打开)

Mistral 7B Mixtral