Mistral Large
Mistral AI发布了Mistral,这是他们最先进的大型语言模型(LLM),具有强大的多语言、推理、数学和代码生成能力。Mistral Large通过名为la Plataforme的Mistral平台和Microsoft Azure提供。它还可以在他们的新聊天应用le Chat(在新标签页中打开)中进行测试。
下面是一个图表,展示了Mistral Large与其他强大的LLM(如GPT-4和Gemini Pro)的比较。在MMLU基准测试中,它以81.2%的得分仅次于GPT-4,排名第二。
Mistral 大型能力
Mistral Large 的能力和优势包括:
- 32K tokens 上下文窗口
- 具备多语言能力(精通英语、法语、西班牙语、德语和意大利语)
- 在推理、知识、数学和编码基准测试方面具有强大的能力
- 原生支持函数调用和JSON格式
- 还发布了一个名为Mistral Small的低延迟模型
- 允许开发者通过其精确的指令遵循来设计审核策略
推理与知识
下表展示了Mistral Large在常见推理和知识基准测试中的表现。它在很大程度上落后于GPT-4,但与Claude 2和Gemini Pro 1.0等其他LLM相比,它是更优秀的模型。
数学与代码生成
下表展示了Mistral Large在常见数学和编码基准测试中的表现。Mistral Large在Math和GSM8K基准测试中表现出色,但在编码基准测试中,它明显被Gemini Pro和GPT-4等模型超越。
多语言支持
下表展示了Mistral Large在多语言推理基准测试中的表现。Mistral Large在所有语言(包括法语、德语、西班牙语和意大利语)中的表现均优于Mixtral 8x7B和Llama 2 70B。
Mistral 小型
除了发布Mistral Large之外,还宣布了一个更小且优化的模型,名为Mistral Small。Mistral Small针对低延迟工作负载进行了优化,性能优于Mixtral 8x7B。Mistral AI报告称,该模型在RAG支持、函数调用和JSON格式方面具有强大的能力。
Mistral 端点和模型选择
这里 (在新标签页中打开)是Mistral AI提供的所有端点的列表。
Mistral AI 还发布了一份全面的指南 (在新标签页中打开),关于在考虑性能和成本权衡时如何选择更好的模型。