AI 安全包括用于保障 AI 应用开发安全、管控员工 AI 使用以及保护 AI 驱动应用和模型的所有资源。
阅读本文后,您将能够:
复制文章链接
人工智能(AI)安全是确保 AI 部署免受网络攻击并能正常运行的控制措施。正如网络安全普遍保护 IT 系统和数字数据一样,AI 安全保护整个 AI 生命周期——从构建模型、训练数据、开发接口,到部署下游应用。AI 安全技术、流程和实践具有以下功能:
随着 AI 使用激增,AI 的安全性也变得不可或缺。AI 应用正在快速普及:根据麦肯锡的数据,企业的生成式 AI 使用率从 2023 年的 33% 猛增至 2024 年的 71%。到 2025 年,多达 78% 的企业报告已在至少一项业务功能中使用 AI。
对于许多企业而言,AI 采用快速增长已经大幅超过了传统安全的承载能力。AI 导致企业的攻击面更加复杂。AI 系统由多个环环相扣的层级构成:数据流水线、模型训练、模型托管、通信协议、API、用户界面、插件、智能体,每一个都需要得到保护。
例如,若客服机器人遭到提示词注入或其他针对 AI 的攻击手段操控,就有可能泄露敏感的员工数据或商业机密。攻击者可通过向模型发送海量请求来滥用其能力,造成 AI 资源过度消耗,或导致拒绝服务。了解关键的 AI 安全风险和最佳实践,以及针对生成式和智能体式 AI 量身定制的安全方案,有助于企业预防此类攻击。
影子 AI 指在缺乏 IT 或安全部门监管的情况下,采用 AI 模型和工具的行为。影子 AI 有两种类型:
一项调查发现,85%的 IT 决策者表示,员工采用 AI 工具的速度超过了 IT 团队评估的速度。同一项调查发现,93%的员工在未经批准的情况下将信息输入到 AI 工具中。如果没有对员工所用工具的全面了解,专有代码或个人可识别信息 (PII)等公司敏感数据可能会被上传到未能达到所需安全级别的 AI 服务。
大型语言模型 (LLM) 被网络犯罪分子视为具有吸引力的攻击目标,因为这些模型使用非常广泛,且在某些情况下还会被嵌入到企业的基础设施中。OWASP 的 LLM 十大风险清单包含如下攻击:
大规模采用 AI 也会带来合规和法律方面的挑战。受到严格监管的行业(例如,金融和医疗)企业,如果不遵守数据隐私法规,将面临严厉的处罚。相关法规包括美国的 《健康保险可携性和责任法案》(HIPAA) 和欧盟的 《通用数据保护条例》(GDPR) 。AI 主要会通过以下几类方式对隐私信息构成安全风险:
安全态势是指系统缓解攻击方面的就绪状态。有效管理安全态势意味着采取积极主动和全面的方法来识别、评估和应对威胁与漏洞。
安全态势管理本质上很复杂,AI 进一步加剧了这种复杂性。由于 AI 系统涉及数据、模型、接口、API 以及往往采用异步通讯方式的智能体,AI 安全态势管理 (AI-SPM) 成为一项多维挑战。企业必须确保一致性、监测偏移风险、检测异常,以及将 AI 风险整合到企业风险框架。他们需要既能帮助促进 AI 采用,同时仍能维护企业网络和数据安全性以及隐私性的工具。
对于 IT 负责人而言,若想降低 AI 安全防护的复杂性,可寻找支持以下基础实践的解决方案:
保护生成式 AI 的使用,包括 LLM 和聊天工具,需要采取分层策略。企业需要识别正在使用的生成式 AI 工具、用户如何与这些工具交互,以及这些交互所输出结果的后续去向。
一些最佳实践包括:
| 生成式 AI 风险 | 安全最佳做法 |
|---|---|
| 影子 AI | 影子 AI 发现 |
| 提示词注入 | 模型防护机制 |
| 训练数据投毒 | 访问控制, 加密 |
| PII 泄露 | 数据丢失防护 (DLP) |
AI 智能体是由 AI 驱动的程序,它们可以自主做出决策、调用外部工具并串联执行多项任务。AI 智能体带来了自身的风险。智能体在会话期间可能遭到操纵,甚至被劫持用于执行非预期操作。
智能体式 AI 的主要风险包括:
遵循这些基本原则有助于保护 AI 智能体:
智能体 AI 安全的核心在于模型上下文协议 (MCP)的安全性。AI 智能体需要依赖 MCP 服务器才能访问外部数据库和工具,正如经典应用需要依赖外部 API 一样。如需进一步了解关于 MCP 和 MCP 安全。
AI 安全是指实施旨在阻止网络攻击并维护 AI 系统完整性的控制措施。其目标是保障 AI 全生命周期的安全——涵盖从初始模型开发和数据训练,到应用和界面的最终部署等各方面。
影子 AI 指在未经 IT 及安全团队正式监管审批的情况下员工私自使用 AI 工具、或开发人员私自接入模型的行为。这会导致可见性盲区,因为公司敏感数据或专有代码可能会被上传到未经批准且不符合安全标准的服务中。
攻击者利用多种方法攻击 LLM,例如使用提示词注入来覆盖内置指令,或使用数据投毒来破坏训练集并影响模型行为。他们还可能试图通过 API 查询窃取专有模型,或发起拒绝服务攻击以耗尽计算资源。
企业应该实施分层战略,包括识别所有 AI 流量以发现未经授权的工具。关键步骤包括使用数据丢失防护来阻止上传敏感信息、应用最小权限原则来实现访问控制、并使用防护措施来阻止有害或不当的提示词。
Cloudflare AI Security for Apps 帮助保护面向公众的应用,抵御模型窃取和提示词注入等主要威胁。其的服务还可以监控用户交互,以防止在提示词或模型输出中意外泄露私密数据。