当前位置:首页 > 报告详情

主题演讲 _ 威胁建模智能体人工智能系统——安全与韧性的主动策略.pdf

上传人: 可*** 编号:991800 2025-12-07 22页 5.25MB

1、Threat Modeling Agentic AI Systems:Proactive Strategies for Security and ResilienceAgentic AI ArchitectureAgentic AI ThreatsAgentic AI Mitigation StrategyTake AwaysWhat is an AI Agent?Perceives&Reasons Autonomous Decision-Making Acts&Uses ToolsSource:OWASP Agentic AI Threats and MitigationsSingle Ag

2、ent ArchitectureSource:OWASP Agentic AI Threats and MitigationsMulti Agent ArchitectureSource:OWASP Agentic AI Threats and MitigationsScenarioThe Rise and Fall of FinBot:An AI Cautionary TaleREPUDIATION&UNTRACEABILITYLack of logs,opaque decision-making,forensic challengesMISALIGNED&DECEPTIVE BEHAVIO

3、RSAI bypassing constraints,misleading outputs,self-preservation risksINTENT BREAKING&GOAL MANIPULATIONAdversarial objectives,prompt injection,unexpected goal shiftsAgency&ReasoningA Shift in PrioritiesCASCADING HALLUCINATION ATTACKSMisinformation reinforcement,false knowledge loops,unreliable decisi

4、onsMEMORY POISONINGCorrupt stored data,malicious long-term memory,false context injectionMemory&ContextThe Memory TrapTOOL MISUSEUnintended API calls,unauthorized tool execution,excessive automation risksPRIVILEGE COMPROMISEEscalated permissions,unauthorized actions,insecure role assignmentsRESOURCE

5、 OVERLOADDenial of service,computational exhaustion,excessive task executionUNEXPECTED RCE&CODE ATTACKSGenerated malicious code,remote execution vulnerabilities,untrusted function callsTools&ExecutionThe Tools Turn Against ThemIDENTITY SPOOFING&IMPERSONATIONFake AI identity,privilege misuse,trust ex

6、ploitationPRIVILEGE ESCALATIONAgent gaining unauthorized access,over-permissive identity tokensIdentity&AuthenticationA Stolen IdentityOVERWHELMING HITLExcessive alerts,decision fatigue,automated approval manipulationHUMAN MANIPULATIONSocial engineering via AI,misleading recommen

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《Data》标记内容,全文主要关于Agentic AI系统的威胁建模和缓解策略。以下是关键点: 1. **Agentic AI定义**:感知、推理、自主决策、使用工具。 2. **威胁类型**: - **REPUTATION & UNTRACEABILITY**:缺乏日志、决策不透明、取证困难。 - **MISALIGNED & DECEPTIVE BEHAVIORS**:AI绕过限制、误导性输出、自我保护风险。 - **INTENT BREAKING & GOAL MANIPULATION**:对抗性目标、提示注入、目标偏移。 - **MEMORY POISONING**:数据损坏、恶意长期记忆、虚假知识循环。 - **TOOL MISUSE**:意外API调用、未经授权的工具执行、过度自动化风险。 - **PRIVILEGE COMPROMISE**:权限提升、未经授权的操作、不安全的角色分配。 - **RESOURCE OVERLOAD**:拒绝服务、计算耗尽、过度任务执行。 - **UNEXPECTED RCE & CODE ATTACKS**:生成恶意代码、远程执行漏洞、不可信函数调用。 - **IDENTITY SPOOFING & IMPERSONATION**:伪造AI身份、权限滥用、信任利用。 - **PRIVILEGE ESCALATION**:代理获取未经授权的访问、过权限的身份令牌。 - **OVERWHELMING HITL**:过度警报、决策疲劳、自动化审批操纵。 - **HUMAN MANIPULATIONS**:通过AI进行的社会工程、误导性推荐、决策疲劳、自动化审批操纵。 - **AGENT COMMUNICATION POISONING**:虚假信息传播、数据共享操纵、工作流程中毒。 - **ROGUE AGENTS IN MULTI-AGENT SYSTEMS**:受损害的AI组件、未经授权的代理操作、隐蔽持久性。 - **HUMAN ATTACKS ON MULTI-AGENT SYSTEMS**:操纵委派、利用AI信任关系、工作流程中断。 3. **缓解策略**: - **Proactive**:限制AI自主性、强化身份和权限控制、加固记忆和工具执行。 - **Reactive**:停止和隔离可疑AI行为、撤销权限和隔离受损害代理、要求高风险操作的人为验证。 - **Detective**:持续监控AI行为和决策、跟踪和分析AI代理交互、关联人和AI行为以进行监督。 4. **关键结论**: - Agentic AI扩大了攻击面。 - 内存、工具和身份是关键风险。 - 安全必须是主动的,而不仅仅是反应性的。
"AI自主性如何影响安全?" "AI记忆污染有多可怕?" "多代理系统中的人为攻击怎样防范?"
客服
商务合作
小程序
服务号
折叠