Blob 存储是一种高度可扩展的方式,利用数据湖在云中存储非结构化数据。
阅读本文后,您将能够:
复制文章链接
Blob 存储是一种适用于非结构化数据的云存储。Blob 是“Binary Large Object(二进制大型对象)”的缩写,它表示二进制形式的大量数据,不一定符合任何文件格式。Blob 存储将这些大量数据保存在称之为数据湖的非分层存储区域中。
想象一下,Alice 将她的衣服成套存放,非常方便穿戴,而 Bob 只是将他的衣服扔成一堆。Bob 的方法更像是 Blob 存储:任何一件衣服都可以放入他的堆中,并且不必以任何特定的方式整理衣服。Bob 的方法是有利的,因为他可以快速且几乎无休止地往他的衣服堆上继续放衣服:他只要继续往上放就可以了,而不用像 Alice 那样折叠和整理它们。
尽管 Bob 的服装存储方法让他难以快速找到某一件特定的衣服,但许多组织需要类似的数据存储方法。他们有很多数据,他们需要存储大量数据,而无需将其组织成层次结构或让其适应给定的格式。
Blob 存储使开发人员能够为基于云的应用程序和移动应用程序构建数据湖。Blob 存储对于存储媒体、大文件备份和数据日志特别有用。但它可以用于任何内容——甚至是通常可能进入层次更高的数据库的文件。
Blob 存储是对象存储的一种类型。对象存储将文件或 Blob 保存在没有层次结构的平面“数据湖”或“池”中;数据湖/池是大量非结构化数据的集合。对象存储与文件存储和块存储的对比:
对于现代组织而言,文件和块存储通常不够灵活或可扩展性不够。相比之下,对象存储的可扩展性非常强,有些人甚至认为它是“无限”存储。但是,使用对象存储而不是文件或块存储会使数据检索更加复杂。
二进制大型对象 (Blob) 是任意大小的数据的集合。Blob 不必遵循给定的格式或具有与之关联的任何元数据。它们是一系列字节,每个字节由 8 位(1 或 0,因此是“二进制”描述符)组成。任何类型的数据都可以放在一个 Blob 中。
在一些实施中,Blob 存储在容器中。容器是计算机的用户空间环境的一部分,已与计算机的其余部分分开。容器是云计算的一种广泛形式。顾名思义,容器是自包含的——除了存储它们所拥有的任何文件和应用程序之外,它们还存储所需的所有依赖项。了解有关容器的更多信息。
可扩展性:Blob 存储容量几乎是无限的。随着存储数据量的增长,仍然可以轻松并快速地保存数据以供日后检索。
云原生:Blob 存储托管在云中。这使得 Blob 存储非常适合在云中构建或迁移到云的组织。这也意味着可以通过互联网从任何位置访问 Blob 存储,就像所有云服务一样。
与编程语言无关:Blob 存储提供商通常允许开发人员使用多种语言来访问他们的 Blob。
成本效益高:Blob 存储通常有分层定价。很少被访问的数据处于更便宜的层级,这意味着如果大部分数据不被定期访问,则总体上可以更便宜地存储大量数据。
Blob 存储的一些主要用例包括:
键值存储是一种在数据库或数据湖中查找对象的方法,其中每个对象都被赋予一个唯一的“键”来识别它。键值方法非常适合对象存储和 Blob 存储,因为搜索机制不需要知道它正在搜索的值或对象的任何信息。(相比之下,文件存储按字段、元数据等进行搜索。)只需要对象的关联键即可以查找值。
Cloudflare Workers KV 使开发人员能够构建无服务器应用程序以使用键值存储。阅读 Workers KV 文档以了解更多信息。
任何类型的云存储都需要受到保护,以免遭遇数据泄漏、破坏和未经授权的访问。Blob 存储供应商提供一定程度的保护,但云安全配置通常由客户来进行。强大的云安全实施对于保持 Blob 存储安全至关重要。
Cloudflare R2 Storage 允许开发人员存储大量非结构化数据。R2 提供数据检索而无需数据出口费用,使其比许多其他类型的云存储更具成本效益。了解有关 Cloudflare R2 Storage 的更多信息。