关于ZAKER 合作
蓝鲸财经 14小时前

乌镇峰会,360 首发《大模型安全白皮书》,拉起全链路安全防线

2025 年 11 月 8 日,在世界互联网大会乌镇峰会上,360 数字安全集团正式发布《大模型安全白皮书》(以下简称 " 白皮书 ")。该白皮书首次系统性阐释大模型运行时的五大关键风险,建设性地提出 " 外筑‘以模治模’动态屏障,内固‘平台原生’安全底座 " 的核心理念,并源于实战,提供了可落地的安全解决方案,为大模型应用拉起了全链路安全防线,助力推动人工智能行业向 " 安全、向善、可信、可控 " 方向稳健发展。

五大风险:大模型安全呈多维复杂态势,挑战成指数级

随着大模型技术加速渗透政务、金融、能源、医疗等重点行业,一个不容忽视的现实是—— AI 越智能,安全风险越致命。

白皮书以 2025 年国内外多起典型大模型安全事件为切入点,系统性归纳了威胁大模型安全的五大关键风险:

首先是基础设施安全风险,包括设备控制、供应链漏洞、拒绝服务攻击以及算力资源滥用等问题;其次是内容安全风险,涉及不符合核心价值观、虚假或违规内容、大模型幻觉,以及提示注入攻击等;第三类是数据与知识库安全风险,数据泄露、越权访问、隐私滥用和知识产权问题日益突出;第四是智能体安全风险,随着智能体自主性增强,插件调用、算力调度、数据流转等环节的安全边界更加模糊;最后是用户端安全风险,包括权限控制、API 调用监控、恶意脚本执行以及 MCP 执行安全等。

这些风险相互交织,形成传统安全方案难以应对的复杂威胁矩阵,严重威胁个人权益、企业发展乃至国家安全。

拉起防线:" 外挂式安全 + 平台原生安全 " 双轨安全体系

面对上述复杂挑战,白皮书基于实战经验,给出了 " 外挂式安全 + 平台原生安全 " 双轨治理策略 —— 前者像 AI 的 " 外部保镖 ",灵活应对实时风险;后者像 AI 的 " 内置铠甲 ",从根源筑牢安全基础,两者配合形成全链路防护网。

外挂式安全侧重模型外部防护,通过 " 以模治模 " 实现对算力主机、软件生态、输入输出内容及模型幻觉的主动监测与防御。

该方式具备两大优势:一是适配性强、部署成本低,可作为通用组件快速接入不同企业环境,避免重复开发;二是响应迅速,具备独立监测与拦截机制,可在毫秒级别识别并阻断实时威胁,如异常算力消耗或恶意内容。

平台原生安全则聚焦大模型数据、知识库、智能体及客户端等环节,将安全能力嵌入核心组件,强化配套组件安全与全流程合规管控。

360 提供的企业级知识库、智能体构建与运营平台、智能体客户端等产品,均基于这一理念开发,将安全深度植入平台底层,全面满足国家与行业合规要求,为智能体应用提供全链路保障。

简言之,外挂式安全如同" 建成后加装的防盗系统 ",平台原生安全则如" 建造时内置的防火结构 ",二者协同,从外至内构筑大模型的安全防线。通过这一体系,360 实现了主动发现、动态演进的安全检测能力,有效应对复杂多变的大模型安全威胁。

纵深防御:7 大能力守好大模型安全门

基于 " 外防风险、内固架构 " 的大模型安全核心理念,360 给出一份覆盖大模型安全全链路解决方案。该方案通过七大核心产品能力,共同组成 " 外挂式 " 与 " 平台原生 " 相结合的纵深防御体系。

其中," 外挂式 " 安全能力不侵入大模型原生架构,通过外部工具实现灵活、快速的动态防护。该体系下的四大产品——大模型卫士算力主机安全系统、检测系统、防护系统、幻觉检测与缓解系统——共同构建了外部屏障,重点应对大模型基础设施风险,如算力劫持、供应链投毒,以及大模型内容风险,如提示词注入、模型幻觉与违规内容,实现了从算力层到内容层的实时监测与主动防御。

" 平台原生安全 " 则如同为大模型应用注入了 " 安全基因 ",将防护能力深度内嵌于其核心组件之中。这一理念具体体现在三大平台产品上:企业级知识库从根本上守护数据与知识安全;智能体构建和运营平台确保智能体行为全程可控;智能体客户端则筑牢用户端入口的安全防线。三者协同,从底层架构解决了数据泄露、智能体行为失控及终端滥用等内生性安全挑战,为 AI 应用的稳定可靠运行奠定了内生性基础。

据悉,目前,360 已将这一能力落地政务、金融、制造等各行业,真正让大模型安全从 " 理论变成 " 能落地、能管用 " 的实战方案。

未来,还将联合产学研各界,共同推动安全标准建设与技术共享,携手共建安全、可信的 AI 生态。让 AI 世界更安全、更美好。