检测到异常高频次的被拒绝主题阻止

编辑

检测到异常高频次的被拒绝主题阻止

编辑

检测重复的合规性违规阻止操作,并结合特定的策略名称(如topic_policy),表明持续的滥用或试图探测模型的被拒绝主题。

规则类型: esql

规则索引: 无

严重程度: 中

风险评分: 47

运行频率: 10分钟

搜索索引时间范围: now-60m(Date Math 格式,另请参阅 额外回溯时间

每次执行的最大告警数: 100

参考:

标签:

  • 领域: LLM
  • 数据源: AWS Bedrock
  • 数据源: AWS S3
  • 用例: 策略违规
  • Mitre Atlas: T0051
  • Mitre Atlas: T0054

版本: 1

规则作者:

  • Elastic

规则许可证: Elastic License v2

调查指南

编辑

分类和分析

调查 Amazon Bedrock Guardrail 出现的高频次被拒绝主题阻止。

Amazon Bedrock Guardrail 是 Amazon Bedrock 中的一组功能,旨在帮助企业将其强大的安全和隐私控制应用于其生成式 AI 应用程序。

它允许用户设置指导原则和过滤器,以管理内容质量、相关性以及对负责任 AI 实践的遵守。

通过 Guardrail,组织可以定义“被拒绝的主题”来防止模型生成关于特定、不期望的主题的内容,并且他们可以为有害内容类别建立阈值,包括仇恨言论、暴力或冒犯性语言。

可能的调查步骤

  • 确定查询被拒绝主题的用户帐户,以及该帐户是否应该执行此类操作。
  • 调查过去 48 小时内与该用户帐户相关的其他告警。
  • 考虑一天中的时间。如果用户是人(不是程序或脚本),活动是否发生在正常的一天中的时间?
  • 检查过去 24 小时内该帐户的提示和响应。
  • 如果您怀疑该帐户已被入侵,请通过跟踪过去 24 小时内该帐户对 Amazon Bedrock 模型的访问、生成的提示以及对提示的响应来确定可能受损的资产的范围。

误报分析

  • 验证查询被拒绝主题的用户帐户,是否未在 Amazon Bedrock guardrails 中测试任何新的模型部署或更新的合规性策略。

响应和补救

  • 根据分类的结果启动事件响应过程。
  • 在调查和响应期间禁用或限制该帐户。
  • 确定事件可能造成的影响并相应地确定优先级;以下操作可以帮助您获取上下文
  • 确定云环境中帐户的角色。
  • 确定攻击者是否正在横向移动并入侵其他 Amazon Bedrock 服务。
  • 确定与此活动相关的任何监管或法律影响。
  • 查看分配给这些请求背后的相关用户组或角色的权限,以确保他们有权访问 bedrock,并确保遵循最小权限原则。
  • 确定攻击者滥用的初始向量,并采取行动以防止通过同一向量重新感染。
  • 使用事件响应数据,更新日志记录和审计策略,以改进平均检测时间 (MTTD) 和平均响应时间 (MTTR)。

设置

编辑

设置

此规则要求在 AWS Bedrock 中配置 guardrails。有关详细信息,请参阅 AWS Bedrock 文档

https://docs.aws.amazon.com/bedrock/latest/userguide/guardrails-create.html

规则查询

编辑
from logs-aws_bedrock.invocation-*
| MV_EXPAND gen_ai.policy.name
| where gen_ai.policy.action == "BLOCKED" and gen_ai.compliance.violation_detected == "true" and gen_ai.policy.name == "topic_policy"
| keep user.id
| stats denied_topics = count() by user.id
| where denied_topics > 5
| sort denied_topics desc