大型语言模型性能矩阵
编辑大型语言模型性能矩阵
编辑此表基于我们的内部测试,描述了各种大型语言模型 (LLM) 在 Elastic Security 中不同用例的性能。要了解有关这些用例的更多信息,请参阅攻击发现 或 AI 助手。
功能 | 模型 | ||||||||
---|---|---|---|---|---|---|---|---|---|
Claude 3: Opus |
Claude 3.5: Sonnet v2 |
Claude 3.5: Sonnet |
Claude 3.5: Haiku |
Claude 3: Haiku |
GPT-4o |
GPT-4o-mini |
Gemini 1.5 Pro 002 |
Gemini 1.5 Flash 002 |
|
助手 - 通用 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
助手 - ES|QL 生成 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
良好 |
优秀 |
差 |
助手 - 警报问题 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
良好 |
优秀 |
好 |
助手 - 知识检索 |
好 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
良好 |
优秀 |
优秀 |
攻击发现 |
良好 |
良好 |
优秀 |
差 |
差 |
良好 |
差 |
优秀 |
差 |
优秀
是最佳评级,其次是良好
,然后是好
,最后是差
。