正在加载

大型语言模型性能矩阵

Elastic Stack 无服务器安全

此页面根据我们的内部测试,描述了各种大型语言模型 (LLM) 在 Elastic Security 中不同用例的性能。要了解有关这些用例的更多信息,请参阅 攻击发现AI 助手

重要提示

优秀 是最佳评级,其次是 良好,然后是 ,最后是 。评级为 优秀良好 的模型应产生高质量的结果。不建议将评级为 的模型用于该用例。

来自第三方 LLM 提供商的模型。

功能 - 助手 - 通用 助手 - ES|QL 生成 助手 - 告警问题 助手 - 知识检索 攻击发现 自动迁移
模型 Claude 3.7: Sonnet 优秀 优秀 优秀 优秀 优秀 优秀
Claude 3.5: Sonnet v2 优秀 优秀 优秀 优秀 良好 优秀
Claude 3.5: Sonnet 优秀 优秀 优秀 优秀 优秀 优秀
Claude 3.5: Haiku 优秀 优秀 优秀 优秀
Claude 3: Haiku 优秀 优秀 优秀 优秀
GPT-4o 优秀 优秀 优秀 优秀 良好 良好
GPT-4o-mini 优秀 良好 良好 良好
GPT-4.1 优秀 优秀 优秀 优秀 优秀 优秀
Gemini 1.5 Pro 002 优秀 优秀 优秀 优秀 优秀 良好
Gemini 1.5 Flash 002 优秀 优秀 优秀
Gemini 2.0 Flash 001 优秀 优秀 优秀 优秀 优秀 优秀
Gemini 2.5 Pro 优秀 优秀 优秀 优秀 优秀 优秀

您可以自行部署的模型。

功能 - 助手 - 通用 助手 - ES|QL 生成 助手 - 告警问题 助手 - 知识检索 攻击发现 自动迁移
模型 Mistral Nemo 良好
Mistral-Small-3.1-24B-Instruct-2503 优秀 优秀 优秀 不适用
LLama 3.2
LLama 3.1 405b 良好
LLama 3.1 70b
© . All rights reserved.