什么是数据迁移? | 定义和共同流程

数据迁移是将数字信息转移到不同的位置(如转移到云存储)、应用程序、数据库或计算环境的过程。

学习目标

阅读本文后,您将能够:

  • 定义数据迁移
  • 解释五种不同类型的数据迁移
  • 探索数据迁移计划包括哪些内容
  • 描述基本的数据迁移过程

相关内容


想要继续学习吗?

订阅 TheNET,这是 Cloudflare 每月对互联网上最流行见解的总结!

参阅 Cloudflare 的隐私政策,了解我们如何收集和处理您的个人数据。

复制文章链接

什么是数据迁移?

数据迁移是选择、准备和将现有数据从一个计算环境转移到另一个环境的过程。 数据可以在应用程序、存储系统、数据库、数据中心和业务流程之间进行迁移。

每个企业的数据迁移目标和流程都是独一无二的。它们必须考虑许多因素,例如成本、时间、技术要求、对业务运营的影响、数据丢失的可能性、合规要求等。

企业为什么要迁移数据?

企业可能出于多种原因开展数据迁移项目,如::

  • 减少媒体、存储或其他IT设备的成本
  • 扩大和扩展存储容量
  • 改善客户的网站或数字体验
  • 集中和简化数据管理
  • 加快应用性能
  • 合并公司收购的数据
  • 满足新的合规或安全要求
  • 加强数据分析和报告能力

考虑以下例子:当有人买了一台新电脑时,他们通常喜欢安装最新版本的软件,而只是把最重要的文件从旧电脑上复制过来。 添加臃肿的过时软件和文件会不必要地占用存储空间,拖慢他们的新设备。 同样,有效的数据迁移可以确保新系统利用正确的清理、提取和转换的数据。

数据迁移可以成为 数字化转型的一个关键推动因素 ,即利用数字技术来实现业务工作负载和流程的现代化。 它往往与 云迁移 ,特别是确保没有过时或损坏的数据被迁移到一个组织的新云基础设施。

数据迁移的主要类型有哪些?

数据中心存储软件应用程序所使用的文件或数据库,这些软件应用程序驱动业务流程和工作流程。 因此,数据迁移通常被划分为五种类型:

  1. 存储迁移 ,将数据从一个存储介质转移到另一个。 组织可能会改变物理媒体格式(如从纸张到数字文件或硬盘驱动器),或从内部存储到 云存储。 数据也可以在一个或多个云存储系统之间进行迁移。 在存储迁移之后,数据的访问方式发生了变化,尽管数据本身没有变化。
  2. 应用程序迁移 将软件应用程序从一个计算环境转移到另一个环境。 这可能包括将应用程序从内部服务器迁移到 环境,在云之间迁移(例如从AWS到微软Azure),或升级应用并退役旧的应用。 因为每个应用程序都有一个独特的数据模型,数据的格式(以及终端用户如何看待它)在应用程序迁移过程中可能会发生变化。
  3. 业务流程迁移 转移由人类操作的应用程序或数据库(如CRM或ERP平台),为客户生产服务。 业务流程迁移通常是由公司合并、收购或重组引起的。
  4. 数据库迁移,有时也称为模式迁移,在两个或多个数据库之间移动数据。 数据库是用数据库管理系统(DBMS)来管理的,如Oracle、MySQL、PostgreSQL等,所以数据库迁移可能意味着从一个DBMS迁移到另一个,或者升级到一个较新的DBMS版本。
  5. 数据中心迁移 是指将资产从一个 数据中心 转移到另一个地点或操作环境。 数据中心的迁移特别复杂,因为数据中心包括存储、检索、分发或存档数据和应用程序的IT资产。 根据组织的目标,数据中心迁移可能涉及完全改变物理硬件, 虚拟机,或云解决方案。

数据迁移过程涉及什么?

对于每种类型的数据迁移,没有 "一刀切 "的过程。 然而,一个完整的数据迁移计划包含三个阶段,然后由其他一些组件和阶段组成。

  1. 迁徙前
  2. 迁移("上线")。
  3. 迁移后(测试/审计)

迁移前(规划/发现)

迁移前是最初的规划阶段,它确保迁移将顺利进行,并旨在将风险降至最低。 在这个阶段,数据迁移团队建立项目目标、范围、所需人员/资源和关键要求。

迁移前的任务可以包括(但不限于):

  • 评估(剖析)数据来源、目的地和格式
  • 检查数据质量、异常情况或重复情况
  • 识别受影响的用户和潜在的干扰
  • 确定硬件、软件和安全要求
  • 确定所需的成本、人员和数据迁移工具
  • 设定一个迁移完成的时间表
  • 清理或重新格式化数据
  • 备份数据并确定如何处理过时的数据
  • 决定具体的方法(在下一节中描述)。
  • 创建风险缓解和利益相关者沟通计划

迁移("上线")。

一旦计划被创建,正确的权限得到保证,并且所有的数据都准备好迁移到目标系统,实际的数据迁移就开始了。 "上线 "的执行可以包括:

  • 加载必要的权限和设置
  • 用实时环境的镜像测试迁移工作
  • 实施数据迁移策略和安全规则
  • 测试新系统中的数据以确保其准确性
  • 修复迁移带来的问题
有一些具体的策略用于应用程序迁移到云端,如重新托管(也称为 "提升和转移"),重新架构,重新平台,以及其他。 阅读 "什么是云迁移?" ,了解更多信息。

迁移后(验证)

数据迁移在 "翻开开关 "后并没有完成。 必须对迁移的结果进行审计和验证,以确保所有的东西都被正确地转移和记录。

一旦迁移后的审计被认为是成功的,旧系统就可以退役了。

常见的数据迁移方法

在数据迁移中,企业可能决定将一个系统迁移到另一个系统,或将两个系统合并成一个全新的系统。 无论他们选择哪种策略,有两种常见的数据迁移方法。

"大爆炸" 迁移: "大爆炸 "数据迁移在一个阶段将整个数据集从遗留系统转移到新的目标系统。 这种迁移通常发生在计划中的停工期间(如周末或假日)或期间。

优点:

  • 需要较短的实施时间
  • 用户不需要在两个不同的系统之间来回切换
  • 潜在的低成本,因为两个系统不需要同时维护

缺点:

  • 增加了初始规划、开发和测试阶段的负担
  • 用户没有多少时间来熟悉新系统
  • 系统的一个部分出现故障会导致其他部分出现问题--需要完全回滚到旧系统中去

“滴灌式” 迁移(Trickle-feed migration):对于需要避免数据无法访问时段的全球性企业或关键基础设施提供商,不妨选择 “滴灌式”数据迁移方案。这种分阶段的方法以较小的增量打包和传输数据。

优点:

  • 几乎可以随时发生
  • 给予终端用户更多的时间来学习和适应新系统
  • 系统中的一个部分出现故障,对整个组织的影响较小

缺点:

  • 要求整个组织有更多的同步性
  • 终端用户对在系统间来回切换可能会感到困惑
  • 新旧系统同时运行一段时间后,成本可能会增加

数据迁移与数据整合

数据迁移和术语 "数据整合 " ,有时可以互换使用,但它们是不同的。 与数据迁移项目(只发生一次)不同,数据整合是一个持续的过程,涉及到增量数据的变化。 此外,与数据迁移不同,数据整合可以将驻留在不同地点的数据合并为一个统一的视图。

数据迁移可能是数据集成计划的一个关键里程碑。 例如,一个企业可能将大量的非结构化数据(如音乐、视频和图像)迁移到一个新的 对象存储 服务,但将这些数据与托管在其他地方的媒体处理工具进行整合。

Cloudflare能否帮助进行数据迁移?

Cloudflare R2 是一个与AWS S3兼容的全球分布式对象存储,允许开发人员以零出口费用存储大量非结构化数据。 R2使客户能够快速、轻松地将存储在其他云提供商的数据对象迁移到他们选择的R2桶中, R2 Migrator (也被称为Super Slurper)。

Cloudflare D1, an SQL database at the edge, also enables developers to import existing SQLite tables and their data directly.

了解更多 关于Cloudflare的开发者平台。

常见问题解答

What is the primary purpose of data migration?

Data migration is the process of moving digital information from one environment to another. This might involve moving data between different applications, databases, storage systems, or even entire data centers. It is often a critical step in digital transformation, part of organizations modernizing their infrastructure.

What are the different types of data migration?

Data migrations are generally categorized into five types based on what is being moved:

  • Storage migration: Moving data from one medium to another (e.g., from on-premises hardware to the cloud)
  • Application migration: Shifting software programs between computing environments
  • Database migration: Transferring data between different database management systems
  • Business process migration: Moving applications or databases used for customer services, often during company mergers
  • Data center migration: Relocating an entire suite of IT assets to a new operating environment

How does a "big bang" migration differ from a "trickle-feed" approach?

A "big bang" migration moves the entire dataset in one single phase, usually during a period of planned downtime. While it is faster and often cheaper, it carries a higher risk of system-wide failure. A "trickle-feed" migration is a phased approach that moves data in smaller increments. This allows for continuous operation and gives users time to adapt, though it can be more complex and expensive to manage two systems simultaneously.

Is data migration the same as data integration?

While they are related, data migration is a one-time project to move data to a new home. Data integration is an ongoing process that combines data from different sources. Migration is often a starting point that enables later integration efforts.

Why would a company choose to migrate their data to the cloud?

Businesses typically migrate data to reduce equipment costs, expand storage capacity, and improve application performance. It also helps centralize data management.

How does Cloudflare simplify the data migration process?

Cloudflare offers tools like the R2 Migrator, which allows users to easily move data from other cloud providers into Cloudflare R2 storage without incurring expensive egress fees. Additionally, Cloudflare D1 allows developers to import existing SQL tables directly, streamlining the transition to edge-based databases.