大型语言模型性能矩阵

编辑

此表基于我们的内部测试,描述了各种大型语言模型 (LLM) 在 Elastic Security 中不同用例的性能。要了解有关这些用例的更多信息,请参阅攻击发现AI 助手

功能 模型

Claude 3: Opus

Claude 3.5: Sonnet v2

Claude 3.5: Sonnet

Claude 3.5: Haiku

Claude 3: Haiku

GPT-4o

GPT-4o-mini

Gemini 1.5 Pro 002

Gemini 1.5 Flash 002

助手 - 通用

优秀

优秀

优秀

优秀

优秀

优秀

优秀

优秀

优秀

助手 - ES|QL 生成

优秀

优秀

优秀

优秀

优秀

优秀

良好

优秀

助手 - 警报问题

优秀

优秀

优秀

优秀

优秀

优秀

良好

优秀

助手 - 知识检索

优秀

优秀

优秀

优秀

优秀

良好

优秀

优秀

攻击发现

良好

良好

优秀

良好

优秀

优秀是最佳评级,其次是良好,然后是,最后是