AI 代理是一种由人工智能提供支持的计算机程序,可以代表人类用户自主执行复杂的任务。
阅读本文后,您将能够:
复制文章链接
AI 代理是一种由人工智能 (AI) 提供支持的计算机程序,即使没有明确的指令,它也可以自主执行任务来协助人类用户。不同于聊天机器人等其他基于 AI 的软件,AI 代理可以在基于特定提示的上下文之外运行。可以这么说,它们能够脱离训练数据并环顾整个世界来查找信息,然后根据这些信息自主采取行动,以实现更大的目标。
AI 代理可以做出决策,从过去的经验中学习,并相应地调整行动。它们甚至可以咨询其他 AI 代理来获取相关信息。人类负责为 AI 代理设定目标,而代理的职责是弄清楚如何实现这些目标。它们可以独立运行,或者只需极少的人工干预就能运行。
AI 代理可以为硬件提供支持(机器人技术)或仅在软件中运行。
AI 代理就是前文所述的软件程序:它们能够自主决策并处理任务。代理式 AI 是 AI 开发领域,它支持构建 AI 代理。(想一想生成式 AI 与个别大型语言模型(例如 Microsoft Copilot)之间的区别,或者想一想“烹饪”与具体菜肴之间的区别。)
生成式 AI (GenAI) 是指一种深度学习模型,它可以根据提示来生成内容。ChatGPT 等 LLM 都属于这类 AI。代理式 AI 则建立在 GenAI 基础之上。LLM 只能通过特定用户界面或 API 对提示做出回复,而 AI 代理则可以超越既定的上下文,甚至在没有提示的情况下也可以执行操作。
大公司的销售主管可能会这样提示大型语言模型 (LLM) 说:“请帮我写一封电子邮件,让我可以发送给我司的 10 个最大客户,邀请他/她们来参加晚宴。”但如果使用代理式 AI,该主管可能会提示 AI 代理说:“请邀请我司的 10 个最大客户来参加晚宴”。换句话说,LLM 可以生成文本,AI 代理则应该能够生成电子邮件文本、在 CRM 中找到排名前 10 的客户,以及发送个性化电子邮件来邀请客户参加活动(前提条件是它拥有足够的权限这样做)。
AI 代理基于 LLM 而构建。LLM 是一种经过大量样本数据训练的 AI 模型,能够理解人类创建的内容并生成自己的内容。LLM 甚至可以理解不确切的人类提示和请求。
由于 AI 代理基于 LLM 构建,因此,它们可以处理并解读从用户的对话请求到 Web 托管的视频内容等各种数据和内容。AI 代理可以解读来自多种媒体类型的内容,包括:代码、文本、音频、视频等等。然后,他们就可以利用从这些内容中了解到的内容来优化行动。
此外,AI 代理具备与世界互动的方式。在机器人技术中,这可能包括物理传感器和摄像头。对于纯软件 AI 代理,这可能有几种形式:
这些与 AI 代理环境之外的世界进行交互的方式,让 AI 代理能够采取行动。企业可以制定 AI 代理的防护措施,以帮助确保它们采取的行动正确无误,就像人类用户在 IT 环境中的权限可能受到限制一样。除了将策略编程写入 AI 代理之外,企业还可以采用人机交互方法,即:由人类验证 AI 代理提供的答案是否准确或批准代理的行动。
AI 代理也可以学习,利用过去行动的结果和人类用户的输入来完善其未来的行动。它们拥有“记忆”,不仅仅是指 RAM 的计算能力,还包括记住过去的交互和结果。通过一个称为“数据飞轮”的反馈循环进行这种学习:底层模型会利用代理的交互记录来改进未来的性能。
AI 代理主要有两种类型:
还有单一代理和多个代理系统。单一代理 AI 系统仅基于一种模型构建。而个多代理 AI 系统组合了多个代理的功能,这些代理可以通过相互协商来解决问题。
像传统聊天机器人一样,代理式 AI 聊天机器人能够与人们进行对话交互。不过,代理式 AI 聊天机器人可以脱离自身环境(离开聊天环境),代表交互对象采取行动。传统聊天机器人也许能够提供关于提交支持工单的说明。代理式 AI 聊天机器人则能够自行提交工单。
非代理式 AI 聊天机器人是被动响应,它们会根据训练数据来提供针对用户提示的答案。此类 AI 聊天机器人可能仍然由 LLM 提供支持,但与代表用户执行操作的代理式 AI 聊天机器人相比,它们更擅长为用户提供实用内容或指示。代理式 AI 聊天机器人能够在与用户交互的上下文之外执行操作,它们还可以从训练数据之外的各种来源进行学习。
Cloudflare 开发人员平台会提供构建和部署 AI 代理所需的所有工具,以便这些代理可以:
此外,Cloudflare 全球网络让开发人员可以构建 AI 代理,在世界任何地方运行代码并尽可能靠近最终用户。了解如何开始在 Cloudflare 上构建 AI 代理。
AI 智能体是一种由人工智能驱动的计算机程序,即使没有明确的指令,也可以自主地为人类用户执行复杂的任务。与聊天机器人等其他 AI 软件不同,AI 智能体可以超越特定提示词上下文运行,独立查找信息和执行操作以实现更广泛的目标。
AI 智能体基于大型语言模型(LLM) 构建,能够处理和解释多种数据类型,包括对话请求和 Web 托管内容。它们可以通过应用程序编程接口(API)与外部应用交互,模拟人类用户与网络应用的交互(例如,填写表单、阅读网页),并通过模型上下文协议(MCP)等新兴标准连接到各种工具。这些能力使他们能够在其直接环境之外采取行动。此外,AI 智能体通过利用过去交互记录和人工输入的“数据飞轮”反馈循环学习并优化其未来行动。
AI 智能体是能够自主决策并处理任务的实际软件程序。智能体 AI 是指专注于创建这些 AI 智能体的 AI 开发领域。
生成式 AI(GenAI),包括像 ChatGPT 这样的 LLM,旨在根据提示词生成内容。智能体 AI 建立在生成式 AI 之上,但更进一步,允许 AI 智能体在定义的上下文之外执行操作,即使没有直接提示词。例如,LLM 可能会生成电子邮件草稿,而 AI 智能体还可以查找客户信息并发送个性化电子邮件。
AI 智能体主要有两种类型:后台智能体和表面智能体。后台智能体处理日常任务时与维护人员类似,几乎不需要用户交互。表面智能体(如前台工作人员)与人类用户进行更直接的交互,协助他们完成各种任务。此外,系统可以是单一智能体(使用一种模型)或多智能体(结合多个智能体协作解决问题)。
智能体 AI 聊天机器人是一种对话式 AI,不仅可以与用户交互,还可以代表用户在聊天上下文之外执行操作。与传统可能提供指令的聊天机器人不同,智能体 AI 聊天机器人可以直接执行操作,例如提交支持工单。
非智能体 AI 聊天机器人采取被动响应式,即使由 LLM 驱动,也主要根据训练数据提供信息或指示。然而,智能体 AI 聊天机器人可以发起和完成超出用户直接交互的操作,并且可以从更广泛的现实世界数据中学习,而不仅仅依赖于其初始训练。
Cloudflare 开发人员平台提供了用于构建和部署 AI 驱动的智能体的工具,这些智能体可以自主执行任务、实时通信、与 AI 模型交互、浏览网页、查询数据库,并支持人类监督。Cloudflare 的全球网络还支持部署 AI 智能体,这些智能体的代码可在世界各地靠近最终用户的位置运行。