› › ›

检测到异常高词语策略阻止

编辑

检测到异常高词语策略阻止

编辑

检测重复的合规性违规阻止操作，并结合特定的策略名称（例如word_policy），表明持续的滥用或试图探测模型的拒绝主题。

规则类型: esql

规则索引: 无

严重性: 中

风险评分: 47

运行频率: 10 分钟

搜索索引时间范围: now-60m (日期数学格式，另请参阅 额外回溯时间)

每次执行的最大警报数: 100

参考:

标签:

领域: LLM
数据源: AWS Bedrock
数据源: AWS S3
用例: 策略违规
Mitre Atlas: T0051
Mitre Atlas: T0054

版本: 1

规则作者:

Elastic

规则许可证: Elastic License v2

调查指南

编辑

分类和分析

调查 Amazon Bedrock Guardrail 高词语策略阻止。

Amazon Bedrock Guardrail 是 Amazon Bedrock 内的一组功能，旨在帮助企业对其生成式 AI 应用程序应用强大的安全和隐私控制。

它使用户能够设置指南和过滤器，以管理内容质量、相关性以及对负责任的 AI 实践的遵守情况。

通过 Guardrail，组织可以定义“单词过滤器”以防止模型生成有关亵渎、不良主题的内容，并且可以为有害内容类别（包括仇恨言论、暴力或攻击性语言）建立阈值。

可能的调查步骤

确定提示中包含亵渎词语的用户帐户，以及它是否应该执行此类操作。
调查过去 48 小时内与用户帐户关联的其他警报。
考虑一天中的时间。如果用户是人类（而不是程序或脚本），则活动是否发生在正常的一天中的时间？
检查过去 24 小时内帐户的提示和响应。
如果您怀疑帐户已遭到入侵，请通过跟踪过去 24 小时内帐户对 Amazon Bedrock 模型的访问、生成的提示以及对提示的响应来确定可能受损的资产范围。

误报分析

验证查询被拒绝主题的用户帐户，是否未在 Amazon Bedrock guardrail 中测试任何新的模型部署或更新的合规性策略。

响应和补救

根据分类结果启动事件响应流程。
在调查和响应期间禁用或限制帐户。
确定事件的可能影响并相应地确定优先级；以下操作可以帮助您获取上下文
确定云环境中帐户的角色。
确定攻击者是否正在横向移动并危及其他 Amazon Bedrock 服务。
确定与此活动相关的任何法规或法律影响。
检查分配给这些请求背后涉及的用户组或角色的权限，以确保他们被授权且被期望访问 bedrock，并确保遵循最小特权原则。
确定攻击者滥用的初始向量，并采取行动以防止通过同一向量再次感染。
使用事件响应数据，更新日志记录和审计策略，以提高平均检测时间 (MTTD) 和平均响应时间 (MTTR)。

设置

编辑

设置

此规则要求在 AWS Bedrock 中配置 guardrail。有关更多信息，请参阅 AWS Bedrock 文档

https://docs.aws.amazon.com/bedrock/latest/userguide/guardrails-create.html

规则查询

编辑

from logs-aws_bedrock.invocation-*
| MV_EXPAND gen_ai.policy.name
| where gen_ai.policy.action == "BLOCKED" and gen_ai.compliance.violation_detected == "true" and gen_ai.policy.name == "word_policy"
| keep user.id
| stats profanity_words= count() by user.id
| where profanity_words > 5
| sort profanity_words desc

« 检测到异常高拒绝主题阻止用户登录的异常时间 »

Was this helpful?

Feedback

The Search AI Company

ELK Stack

Elastic Cloud

Generative AI

Search

Security

Observability

By solution

Industries

Customer spotlight

Research

Build

Learn

Connect

检测到异常高词语策略阻止

检测到异常高词语策略阻止

调查指南

设置

规则查询

Follow us

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards