大型语言模型性能矩阵
编辑大型语言模型性能矩阵编辑
该表根据我们内部测试,描述了各种大型语言模型 (LLM) 在 Elastic Security 中不同用例下的性能。要详细了解这些用例,请参阅攻击发现 或 AI 助手。
功能 | 模型 | |||||
---|---|---|---|---|---|---|
Claude 3: Opus |
Claude 3: Sonnet |
Claude 3: Haiku |
GPT-4o |
GPT-4 Turbo |
GPT-4 32K |
|
助手 - 常规 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
优秀 |
助手 - ES|QL 生成 |
出色 |
出色 |
较差 |
优秀 |
较差 |
优秀 |
助手 - 警报问题 |
优秀 |
优秀 |
优秀 |
优秀 |
较差 |
良好(上下文受限) |
攻击发现 |
优秀 |
出色 |
较差 |
较差 |
良好 |
良好(上下文受限) |