时间:2025-07-29 03:46 作者:夕阳无敌
蚂蚁集团大模型安全解决方案“蚁天鉴”升级,新增智能体安全评测工具
随着人工智能(AI)技术的不断进步,AI领域正从大模型时代迈向智能体时代。智能体不仅具备对话生成能力,还拥有自主规划、跨领域推理,甚至能做出超越人类理解的决策,AI已进入“行动”阶段。然而,智能体的越权、过度代理等问题也带来了安全挑战。
世界数字科学院(WDTA)最新发布《AI智能体运行安全测试标准》提出将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,分析智能体全链路风险。
据介绍,升级的“蚁天鉴”在Agent运行阶段,构建了一套智能安全扫描系统,通过一系列专用工具来检测Agent可能面临的安全风险,实现端到端扫描,确保工具与 Agent 的交互链路不被篡改或绕过,为复杂环境下的稳定运行提供可验证的安全基线。目前,“蚁天鉴”的风险研判Agent准确率可以达到96%以上,并可支持11个行业的智能体测试。
MCP安全扫描功能,则为行业内首个对外发布的MCP安全扫描工具,可自动化识别AI工具集成与数据交换链路中的安全漏洞及风险行为,覆盖工具投毒攻击、间接提示词注入、恶意代码注入等3大类共10项子类风险。
蚂蚁集团机器智能部总经理、安全实验室首席科学家王维强在WAIC论坛演讲
蚂蚁集团机器智能部总经理、安全实验室首席科学家王维强表示:“升级的‘蚁天鉴’基于‘以攻促防’的安全理念,通过构建‘对齐-扫描-防御’技术栈,形成全流程防护体系,从而为智能体提供风险扫描与实时防御能力,我们也将与行业共建,未来逐步开源开放安全工具。”
1、“科创强国,金融向善”——2025年GPLP犀牛财经峰会在京举办
2、多位博主实车实路复刻懂车帝消失的前车:华为ADS完美变道、刹停, 一次都没撞
3、华为云CloudMatrix 384超节点再出圈,昇腾AI云服务解锁超级算力