Mistral Large
Mistral AI发布了他们最先进的大型语言模型(LLM)Mistral Large,具有强大的多语言、推理、数学和代码生成能力。Mistral Large可通过Mistral平台La Plataforme和Microsoft Azure获得。同时,它也可以在他们的新聊天应用Le Chat中进行测试。
下面的图表显示了Mistral Large与其他强大的LLM(如GPT-4和Gemini Pro)的比较。在MMLU基准测试中,Mistral Large以81.2%的得分排名第二,仅次于GPT-4。
Mistral Large的能力
Mistral Large的能力和优势包括:
- 32K令牌上下文窗口
- 具有本地多语言能力(擅长英语、法语、西班牙语、德语和意大利语)
- 在推理、知识、数学和编码基准方面具有强大能力
- 原生支持函数调用和JSON格式
- 还发布了低延迟模型Mistral Small
- 允许开发人员设计具有精确指令遵循的调节策略
推理和知识
下表显示了Mistral Large在常见推理和知识基准测试中的表现。它在很大程度上落后于GPT-4,但与Claude 2和Gemini Pro 1.0等其他LLM模型相比,它是更优秀的模型。
数学与代码生成
下表显示了Mistral Large在常见数学和编码基准测试中的表现。Mistral Large在数学和GSM8K基准测试中表现出色,但在编码基准测试中明显被Gemini Pro和GPT-4等模型超越。
多语言能力
下表展示了Mistral Large在多语言推理基准测试中的表现。Mistral Large在所有语言(包括法语、德语、西班牙语和意大利语)中均优于Mixtral 8x7B和Llama 2 70B。
Mistral Small
除了发布Mistral Large外,Mistral AI还宣布推出了一款更小、经过优化的模型,名为Mistral Small。Mistral Small针对低延迟工作负载进行了优化,并在性能上优于Mixtral 8x7B。Mistral AI报告称,该模型在RAG启用、函数调用和JSON格式方面具有强大能力。
Mistral端点和模型选择
这里是Mistral AI提供的所有端点列表。
Mistral AI还发布了一份关于在考虑性能和成本权衡时进行更好模型选择的全面指 南。