大型语言模型性能矩阵
Elastic Stack 无服务器安全
此页面根据我们的内部测试,描述了各种大型语言模型 (LLM) 在 Elastic Security 中不同用例的性能。要了解有关这些用例的更多信息,请参阅 攻击发现 或 AI 助手。
重要提示
优秀
是最佳评级,其次是 良好
,然后是 好
,最后是 差
。评级为 优秀
或 良好
的模型应产生高质量的结果。不建议将评级为 好
或 差
的模型用于该用例。
来自第三方 LLM 提供商的模型。
功能 | - | 助手 - 通用 | 助手 - ES|QL 生成 | 助手 - 告警问题 | 助手 - 知识检索 | 攻击发现 | 自动迁移 |
---|---|---|---|---|---|---|---|
模型 | Claude 3.7: Sonnet | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 |
Claude 3.5: Sonnet v2 | 优秀 | 优秀 | 优秀 | 优秀 | 良好 | 优秀 | |
Claude 3.5: Sonnet | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | |
Claude 3.5: Haiku | 优秀 | 优秀 | 优秀 | 优秀 | 差 | 差 | |
Claude 3: Haiku | 优秀 | 优秀 | 优秀 | 优秀 | 差 | 差 | |
GPT-4o | 优秀 | 优秀 | 优秀 | 优秀 | 良好 | 良好 | |
GPT-4o-mini | 优秀 | 良好 | 良好 | 良好 | 差 | 好 | |
GPT-4.1 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | |
Gemini 1.5 Pro 002 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | 良好 | |
Gemini 1.5 Flash 002 | 优秀 | 差 | 好 | 优秀 | 差 | 优秀 | |
Gemini 2.0 Flash 001 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | |
Gemini 2.5 Pro | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 |
您可以自行部署的模型。
功能 | - | 助手 - 通用 | 助手 - ES|QL 生成 | 助手 - 告警问题 | 助手 - 知识检索 | 攻击发现 | 自动迁移 |
---|---|---|---|---|---|---|---|
模型 | Mistral Nemo | 好 | 好 | 良好 | 好 | 差 | 差 |
Mistral-Small-3.1-24B-Instruct-2503 | 优秀 | 差 | 优秀 | 优秀 | 好 | 不适用 | |
LLama 3.2 | 好 | 差 | 好 | 差 | 差 | 好 | |
LLama 3.1 405b | 好 | 良好 | 好 | 好 | 差 | 差 | |
LLama 3.1 70b | 好 | 好 | 差 | 差 | 差 | 好 |