什么是深度学习?

深度学习是一种强大的机器学习类型,可以处理无标签数据并识别模式。深度学习是多种 AI 的基础。

学习目标

阅读本文后,您将能够:

  • 定义深度学习
  • 区分深度学习和机器学习
  • 了解无监督学习、神经网络和无标签数据

复制文章链接

什么是深度学习?

深度学习是机器学习的一种类型,它可以识别复杂的模式,并以类似于人类的方式进行联想。其能力范围包括识别照片中的物品、识别声音、驾驶汽车或创作插图等。从本质上讲,深度学习模型是一种计算机程序,由于其处理数据的方法复杂而精密,因此能够展现出智能。

深度学习是人工智能 (AI) 的一种,是许多 AI 服务和模型发挥作用的核心。大型语言模型 (LLM)(如 ChatGPT、Bard 和 Bing Chat)以及图像生成器(如 Midjourney 和 DALL-E)都依赖深度学习来学习语言和上下文,并生成逼真的回答。预测式 AI 模型利用深度学习从大量历史数据中获取结论。

深度学习如何工作?

通常,使用计算机程序需要精确的输入才能获得正确的输出。相比之下,深度学习可以获取任意或不精确的数据,并产生相关的输出结果。例如,传统的计算机程序或许可以分辨出两幅数字肖像是否完全相同。然而,即使肖像本身不同,深度学习模型或许也能够识别出肖像上主体的相似之处。

深度学习依赖大型数据集和大量计算能力——随着这两样的可用性不断提高,深度学习模型也变得越来越完善。如今,大数据集合和 GPU 驱动的云计算服务使开发人员和日常用户比以往任何时候都更容易接触深度学习。

机器学习和深度学习有什么区别?

机器学习是一种无需明确指令即可学习的计算机程序。深度学习是一种专门的机器学习,就像喷气式飞机是一种专门的飞机一样。两者都是让计算机程序从一组数据中自主学习。然而,深度学习可以做得更多,就像喷气式飞机比螺旋桨飞机或滑翔机更强大一样。

深度学习也可以从无标记数据中学习,而更基本的机器学习模型可能需要更多的数据上下文,才能正确地“学习”。最后,深度学习模型是利用神经网络构建的。机器学习模型可以在神经网络的基础上构建,但并非总是如此。

如何使用深度学习?

深度学习在当今世界已经有了大量的应用,而且新的用途仍在不断发现中。目前的使用案例包括:

  • 语音助手
  • 自动驾驶汽车
  • 预测模型
  • 创建图像
  • 自然语言处理
  • 对话式 AI 聊天机器人
  • 医学研究

什么是无监督学习?

在机器学习领域中,无监督学习是一种在不了解数据集包含的内容的情况下识别大型数据集中的模式和关联的方法。相比之下,监督式学习为模型提供示例输入和输出。深度学习可以使用监督式学习来训练模型,但其无监督学习的能力使其有别于其他类型的机器学习。

想象一下,给机器学习模型输入新闻文章示例,并指出每篇文章的相关主题。经过充分训练后,该模型也许能够就某一主题“撰写”一篇文章。这就是监督式学习。

现在,想象一下给深度学习模型输入一系列新闻文章示例,但没有指出每篇文章的相关主题。模型如果足够强大,也许能够撰写关于给定主题的文章,只需提供主题作为输入即可。这就是无监督学习。

什么是无标签数据?

无标签数据是指没有分类、标记或标签的数据。无标签数据集可以包含任何任意数据,也可以采取任何形式:随机照片、视频汇编、文件名长列表、日志数据或以上所有形式的组合。没有上下文的新闻文章(如前面的例子)就是一个无标签数据的例子。

深度学习模型能够对无标签数据进行上下文联系和“理解”。一般情况下,数据越多,模型就越完善。

无标签数据和对象存储

无标签数据通常也是非结构化数据。非结构化数据不遵循任何特定格式,因此可以包含任何类型的数字信息。对象存储通常用于保存此类非结构化数据。此类数据集合可以无限增长,而对象存储是一种高度可扩展、成本效益相当高的存储方式。

当深度学习模型从大量数据集合中学习时,即使这些数据是无标记数据和非结构化数据,它们也会变得更加有效。因此,对象存储是深度学习模型的重要资源。

什么是神经网络?

神经网络是一种基于人脑功能的机器学习架构。神经网络是节点的集合,每个节点都是自己的处理单元。具有统计意义的数据会从一个节点传递到下一个节点。

这些节点至少分布在三个层上:输入层、隐藏层和输出层。通常每个层有几个节点。可以有多个隐藏层,深度学习模型往往有很多隐藏层。

把神经网络想象成一个共同解决问题的团队。团队中的每个成员都负责问题的一个方面,一旦完成了自己的工作,就会将任务移交给下一个团队成员。最后,团队共同达成了一个完整的解决方案。

神经网络已经存在了几十年,但与过去的神经网络相比,现代深度学习使用的层数更多。另外,当今的深度学习模型还能获得比以往任何时候都要多得多的计算能力和数据,使开发人员能够加快 AI 技术的进步。

Cloudflare 如何构建深度学习模型?

Cloudflare 帮助开发人员轻松构建可从任何地方访问的 AI 应用程序,并将延迟降到最低。Cloudflare Workers AI 提供对 Cloudflare 全球网络上无服务器 GPU 的访问,以运行先进的机器学习模型。Cloudflare R2 是一种没有出口费用的对象存储,可更经济高效地存储大型数据集,用于训练深度学习模型。

了解有关 Cloudflare for AI 的所有信息。