1、AI时代下安全新范式:JoySafety+安全Agent新的安全风险提示注入2.0:从“聊天越狱”到“Agent劫持AI投毒:从“数据”到“恶意代码/MCP工具”给传统安全带来的挑战攻击手段更智能:攻击的门槛降低、规模变大,更持续风险面扩大:新型数据泄漏、内容安全响应时效:攻防节奏从“回合战”转向“实时战”JoySafety:AI的“守护者”,化解其原生风险安全Agent:传统安全的“创新者”,重塑防御体系全链守护AI内容安全风险业务安全风险信息安全风险第一道防线第二道防线第三道防线第四道防线训练数据安全大模型安全评测Prompt实时检测生成内容实时检测模型训练层数据投毒零容忍模型评测层31类
2、风险基线模型运营层实时风险识别全自动、一站式合规多种响应方式31大类+200+子类安全风险识别“流式输出检测+撤回”机制100+应用/亿级请求毫秒级响应降低攻击95%以上JSL安全大模型2.0:Model as Agent安全大模型更专业通用大模型垂域大模型通识数据专业知识通用任务特定任务公开模型私有模型定期、不可控训练实时数据、人工监督幻觉问题精准答案Agent基础模型安全数据安全场景入侵研判漏洞识别威胁情报安全策略优化MCP工具数据分级分类工具数据脱敏工具威胁情报安全扫描工具漏洞分析资产识别知识库安全制度安全SOP安全风险评估报告安全经验安全术语安全规则安全增强海量安全结构化数据安全开源数
3、据预训练研判日志漏洞代码片段微调训练人工标注DPO强化学习毒性过滤攻击利用过滤安全对齐行业数据开源数据京东业务数据京东安全数据实时更新数据JSL-CodeSafeter:代码漏洞检测与修复Agent漏洞检出阶段滞后代码提测甚至上线阶段才能检出漏洞安全左移,入库即安全在代码编写阶段实时拦截漏洞,杜绝“带病入库”平均修复周期长,预计为7天安全团队扫描 人工分析 提单给研发 研发排期修复修复周期缩短至30min漏洞实时发现 自动修复方案生成 研发10分钟内确认学习成本高安全专家需解释漏洞原理、提供修复方案;研发人员因安全知识不足常产生抵触“傻瓜式”修复指引直接列出修复前后代码,研发直接点击接受即可风
4、险发现阶段平均修复周期漏洞修复方式代码编写阶段进行代码安全扫描,实现“人防”到“技防”的跨越漏洞覆盖CWETOP25+识别准召90%覆盖用户1W+修复采纳30%+JSL-PenTester:渗透测试Agent 由AI算法驱动,能够自主执行测试流程 效率指数级提升:7x24小时不间断高度依赖安全专家(白帽黑客)的个人经验、知识和直觉 效率瓶颈明显 具备“全知”潜力和能力 永不遗忘且持续进化测试深度受限于工程师的知识盲区 知识更新依赖人工学习 可实现“持续性”安全验证 追求全覆盖对一个“时间点”的定点快照测试 样本覆盖有限 执行主体及效率知识广度与深度覆盖范围与持续性AI驱动人工驱动“多Agent
5、 协同-多工具集成自我反思迭代”实现全流程智能化漏洞覆盖OwaspTop 10效率从天降低至小时专家接入率-70%漏洞发现率+30%JSL-AlertTriager:入侵研判Agent维度传统SOC告警研判AI SOC智能研判Agent核心驱动人工流程与静态规则AI模型与自动化检测能力仅已知威胁(基于规则)已知+未知威胁(基于异常)响应速度慢(分钟/小时级,人工)快(毫秒/秒级,自动)人员角色告警操作工,疲劳度高战略调查员,价值提升误报率极高(常 90%)低(可降至10%以下)95%+风险召回50%MTTR10倍风险识别面95%+告警降噪JSL-ThreatIntelliger:威胁情报Age
6、nt响应处置线索收集情报分发情报研判情报验真亿级/天线索数量3minMTTR98%情报新鲜度80%+情报有效率AI时代下安全展望JoySafety作为“AI守护者”为大模型的安全运行和合规使用提供保障JSLSafeter传统安全的“创新者”,重塑信息安全防御体系JLBoost大模型的“助力器”,在大模型训练数据获取、幻觉方面提供支撑,提升大模型输出可靠性和可信度。开源共建:携手共创可信AI共享共创共建第一步:快速接入访问GitHub、huggingface 获取JoySafe