An AI agent is a computer program powered by artificial intelligence that can autonomously perform complex tasks for human users, even without explicit instructions. Unlike other AI software, such as chatbots, AI agents can operate beyond a specific prompt-based context and independently find information and take actions to achieve a broader objective.

How do AI agents function?

AI agents are built upon large language models (LLMs) and are capable of processing and interpreting diverse data types, including conversational requests and web-hosted content. They can interact with external applications through application programming interfaces (APIs), simulate human user interactions with web apps (e.g., filling out forms, reading webpages), and connect to various tools via emerging standards like the Model Context Protocol (MCP). These capabilities enable them to take actions beyond their immediate environment. Furthermore, AI agents learn and refine their future actions through a "data flywheel" feedback loop, which uses records of past interactions and human input.

What is the difference between agentic AI and AI agents?

AI agents are the actual software programs that make autonomous decisions and handle tasks. Agentic AI refers to the field of AI development that focuses on creating these AI agents.

How does agentic AI compare to generative AI?

Generative AI (GenAI), which includes LLMs like ChatGPT, is designed to produce content in response to prompts. Agentic AI is built on top of GenAI, but it goes a step further by allowing AI agents to perform actions outside of a defined context, even without direct prompts. For example, while an LLM might generate an email draft, an AI agent could also find customer information and send personalized emails.

What are the different categories of AI agents?

There are two primary types of AI agents: background agents and surface agents. Background agents handle routine tasks with minimal user interaction, similar to maintenance workers. Surface agents, like front-desk staff, interact more directly with human users, assisting them with various tasks. Additionally, systems can be single-agent (using one model) or multi-agent (combining multiple agents that collaborate to solve problems).

What is an agentic AI chatbot?

An agentic AI chatbot is a conversational AI that can not only interact with users but also take actions outside of the chat context on their behalf. Unlike traditional chatbots that might provide instructions, an agentic AI chatbot could directly perform the action, such as filing a support ticket.

How do agentic AI chatbots differ from non-agentic AI chatbots?

Non-agentic AI chatbots are reactive and primarily provide information or directions based on their training data, even if powered by an LLM. Agentic AI chatbots, however, can initiate and complete actions beyond the user's immediate interaction and can learn from a broader range of real-world data, not just their initial training.

How does Cloudflare support the development of agentic AI?

The Cloudflare developer platform offers tools for building and deploying AI-powered agents that can perform tasks autonomously, communicate in real time, interact with AI models, browse the web, query databases, and support human oversight. Cloudflare's global network also enables the deployment of AI agents with code running close to end users worldwide.

什么是 AI 代理？

AI 代理是一种由人工智能提供支持的计算机程序，可以代表人类用户自主执行复杂的任务。

学习目标

阅读本文后，您将能够：

描述代理式 AI 的定义
描述 AI 代理的工作原理
了解 AI 代理如何采取行动

什么是 AI 代理？

AI 代理是一种由人工智能 (AI) 提供支持的计算机程序，即使没有明确的指令，它也可以自主执行任务来协助人类用户。不同于聊天机器人等其他基于 AI 的软件，AI 代理可以在基于特定提示的上下文之外运行。可以这么说，它们能够脱离训练数据并环顾整个世界来查找信息，然后根据这些信息自主采取行动，以实现更大的目标。

AI 代理可以做出决策，从过去的经验中学习，并相应地调整行动。它们甚至可以咨询其他 AI 代理来获取相关信息。人类负责为 AI 代理设定目标，而代理的职责是弄清楚如何实现这些目标。它们可以独立运行，或者只需极少的人工干预就能运行。

AI 代理可以为硬件提供支持（机器人技术）或仅在软件中运行。

代理式 AI 与 AI 代理

AI 代理就是前文所述的软件程序：它们能够自主决策并处理任务。代理式 AI 是 AI 开发领域，它支持构建 AI 代理。（想一想生成式 AI 与个别大型语言模型（例如 Microsoft Copilot）之间的区别，或者想一想“烹饪”与具体菜肴之间的区别。）

代理式 AI 与生成式 AI

生成式 AI (GenAI) 是指一种深度学习模型，它可以根据提示来生成内容。ChatGPT 等 LLM 都属于这类 AI。代理式 AI 则建立在 GenAI 基础之上。LLM 只能通过特定用户界面或 API 对提示做出回复，而 AI 代理则可以超越既定的上下文，甚至在没有提示的情况下也可以执行操作。

大公司的销售主管可能会这样提示大型语言模型 (LLM) 说：“请帮我写一封电子邮件，让我可以发送给我司的 10 个最大客户，邀请他/她们来参加晚宴。”但如果使用代理式 AI，该主管可能会提示 AI 代理说：“请邀请我司的 10 个最大客户来参加晚宴”。换句话说，LLM 可以生成文本，AI 代理则应该能够生成电子邮件文本、在 CRM 中找到排名前 10 的客户，以及发送个性化电子邮件来邀请客户参加活动（前提条件是它拥有足够的权限这样做）。

AI 代理的工作原理是什么？

大型语言模型 (LLM)

AI 代理基于 LLM 而构建。LLM 是一种经过大量样本数据训练的 AI 模型，能够理解人类创建的内容并生成自己的内容。LLM 甚至可以理解不确切的人类提示和请求。

由于 AI 代理基于 LLM 构建，因此，它们可以处理并解读从用户的对话请求到 Web 托管的视频内容等各种数据和内容。AI 代理可以解读来自多种媒体类型的内容，包括：代码、文本、音频、视频等等。然后，他们就可以利用从这些内容中了解到的内容来优化行动。

外部集成与交互

此外，AI 代理具备与世界互动的方式。在机器人技术中，这可能包括物理传感器和摄像头。对于纯软件 AI 代理，这可能有几种形式：

代理可以通过 API 直接接入外部应用
一些 AI 代理可以像人类用户一样与 Web 应用交互，例如填写表单、阅读网页等（它们可能会使用无头浏览器来实现此目的）
一种名为模型上下文协议 (MCP) 的新兴标准，可以将 AI 代理连接到各种工具（电子邮件客户端、CRM、账单系统等），并让代理进行适当的身份验证和授权。

这些与 AI 代理环境之外的世界进行交互的方式，让 AI 代理能够采取行动。企业可以制定 AI 代理的防护措施，以帮助确保它们采取的行动正确无误，就像人类用户在 IT 环境中的权限可能受到限制一样。除了将策略编程写入 AI 代理之外，企业还可以采用人机交互方法，即：由人类验证 AI 代理提供的答案是否准确或批准代理的行动。

通过数据飞轮学习

AI 代理也可以学习，利用过去行动的结果和人类用户的输入来完善其未来的行动。它们拥有“记忆”，不仅仅是指 RAM 的计算能力，还包括记住过去的交互和结果。通过一个称为“数据飞轮”的反馈循环进行这种学习：底层模型会利用代理的交互记录来改进未来的性能。

AI 代理有哪些类型？

AI 代理主要有两种类型：

后台代理：它们在后台执行任务，尤其是日常任务，几乎不需要用户交互。后台代理就像门卫或维护人员一样，负责保持办公室清洁和照明正常。
平面代理：它们更直接地与人类用户交互。聊天机器人、客户服务和 AI 助手都属于此类 AI 代理。平面代理就像办公大楼的前台工作人员，负责与走进大楼的人互动并根据需要完成某些任务。

还有单一代理和多个代理系统。单一代理 AI 系统仅基于一种模型构建。而个多代理 AI 系统组合了多个代理的功能，这些代理可以通过相互协商来解决问题。

什么是代理式 AI 聊天机器人？

像传统聊天机器人一样，代理式 AI 聊天机器人能够与人们进行对话交互。不过，代理式 AI 聊天机器人可以脱离自身环境（离开聊天环境），代表交互对象采取行动。传统聊天机器人也许能够提供关于提交支持工单的说明。代理式 AI 聊天机器人则能够自行提交工单。

代理式 AI 聊天机器人与非代理式 AI 聊天机器人

非代理式 AI 聊天机器人是被动响应，它们会根据训练数据来提供针对用户提示的答案。此类 AI 聊天机器人可能仍然由 LLM 提供支持，但与代表用户执行操作的代理式 AI 聊天机器人相比，它们更擅长为用户提供实用内容或指示。代理式 AI 聊天机器人能够在与用户交互的上下文之外执行操作，它们还可以从训练数据之外的各种来源进行学习。

Cloudflare 如何支持代理式 AI？

Cloudflare 开发人员平台会提供构建和部署 AI 代理所需的所有工具，以便这些代理可以：

自主执行任务
与客户实时沟通
调用 AI 模型
浏览 Web 内容
查询数据库
支持人机交互

此外，Cloudflare 全球网络让开发人员可以构建 AI 代理，在世界任何地方运行代码并尽可能靠近最终用户。了解如何开始在 Cloudflare 上构建 AI 代理。

常见问题解答

什么是 AI 代理？

AI 智能体是一种由人工智能驱动的计算机程序，即使没有明确的指令，也可以自主地为人类用户执行复杂的任务。与聊天机器人等其他 AI 软件不同，AI 智能体可以超越特定提示词上下文运行，独立查找信息和执行操作以实现更广泛的目标。

AI 智能体如何运作？

AI 智能体基于大型语言模型（LLM）构建，能够处理和解释多种数据类型，包括对话请求和 Web 托管内容。它们可以通过应用程序编程接口（API）与外部应用交互，模拟人类用户与网络应用的交互（例如，填写表单、阅读网页），并通过模型上下文协议（MCP）等新兴标准连接到各种工具。这些能力使他们能够在其直接环境之外采取行动。此外，AI 智能体通过利用过去交互记录和人工输入的“数据飞轮”反馈循环学习并优化其未来行动。

智能体 AI 与 AI 智能体之间有什么区别？

AI 智能体是能够自主决策并处理任务的实际软件程序。智能体 AI 是指专注于创建这些 AI 智能体的 AI 开发领域。

智能体 AI 与生成式 AI 相比如何？

生成式 AI（GenAI），包括像 ChatGPT 这样的 LLM，旨在根据提示词生成内容。智能体 AI 建立在生成式 AI 之上，但更进一步，允许 AI 智能体在定义的上下文之外执行操作，即使没有直接提示词。例如，LLM 可能会生成电子邮件草稿，而 AI 智能体还可以查找客户信息并发送个性化电子邮件。

AI 智能体有哪些不同类别？

AI 智能体主要有两种类型：后台智能体和表面智能体。后台智能体处理日常任务时与维护人员类似，几乎不需要用户交互。表面智能体（如前台工作人员）与人类用户进行更直接的交互，协助他们完成各种任务。此外，系统可以是单一智能体（使用一种模型）或多智能体（结合多个智能体协作解决问题）。

什么是代理式 AI 聊天机器人？

智能体 AI 聊天机器人是一种对话式 AI，不仅可以与用户交互，还可以代表用户在聊天上下文之外执行操作。与传统可能提供指令的聊天机器人不同，智能体 AI 聊天机器人可以直接执行操作，例如提交支持工单。

智能体 AI 聊天机器人与非智能体 AI 聊天机器人有何不同？

非智能体 AI 聊天机器人采取被动响应式，即使由 LLM 驱动，也主要根据训练数据提供信息或指示。然而，智能体 AI 聊天机器人可以发起和完成超出用户直接交互的操作，并且可以从更广泛的现实世界数据中学习，而不仅仅依赖于其初始训练。

Cloudflare 如何支持智能体 AI 的开发？

Cloudflare 开发人员平台提供了用于构建和部署 AI 驱动的智能体的工具，这些智能体可以自主执行任务、实时通信、与 AI 模型交互、浏览网页、查询数据库，并支持人类监督。Cloudflare 的全球网络还支持部署 AI 智能体，这些智能体的代码可在世界各地靠近最终用户的位置运行。

入门指南

人工智能

机器学习

大数据

学习中心