无缝迁移到Azure Database for PostgreSQL灵活服务器的最佳做法

本文介绍遇到的常见陷阱和最佳做法，以确保顺利且成功迁移到Azure Database for PostgreSQL。

预迁移验证

迁移的第一步是在执行迁移之前运行迁移前验证。可以在迁移设置页上使用“验证”和“验证和迁移”选项。迁移前验证会针对预定义的规则集进行彻底检查。目标是确定潜在问题，并提供可操作的见解来修正操作。继续运行迁移前验证直到状态变为“成功”。若要了解详细信息，请参阅预迁移验证。

目标灵活服务器配置

在对数据进行初始基本复制期间，会在目标服务器上执行多个插入语句，进而生成提前写入日志 (WAL)。在存档这些 WAL 之前，日志将占用目标存储以及数据库所需要的存储。

若要计算该数字，请登录到源实例并为所有要迁移的数据库运行以下命令：

SELECT pg_size_pretty( pg_database_size('dbname') );

建议在灵活服务器上分配足够的存储，相当于 1.25 倍（即多 25%），比上述命令输出中使用的存储多。还可以使用 Storage Autogrow。

重要

手动配置或存储自动增长功能下，存储大小无法减少。在存储配置范围中，每个步骤都在尺寸上翻倍，因此提前估算所需的存储空间是明智的。

创建 Azure Database for PostgreSQL 灵活服务器的快速入门指南是一个理想的开始。有关每个服务器配置的详细信息，请参阅Azure Database for PostgreSQL灵活服务器中的 Compute 和 storage 选项。

迁移时间线

迁移开始后，每个迁移的最大生存期为 7 天（168 小时），并在 7 天后超时。完成所有检查并确保数据验证完成后，可以进行迁移和应用程序切换，以避免迁移超时。在联机迁移中，完成基础复制后，切换窗口的有效期为三天（72 小时）。在脱机迁移中，应用程序应停止向数据库写入内容，以防止数据丢失。同样，对于联机迁移，请在整个迁移过程中保持低流量。

大多数非生产服务器（开发、UAT、测试和暂存）是使用脱机迁移方法迁移的。由于这些服务器的数据少于生产服务器，因此迁移速度很快。要迁移生产服务器，需要知道完成迁移所需的时间，以提前做好规划。

完成迁移所需的时间取决于多个因素。它包括数据库数、大小、每个数据库中的表数、索引数以及数据的跨表分布。它还取决于目标服务器的 SKU，以及源服务器和目标服务器上可用的 IOPS。由于有许多的因素会影响迁移时间，因此很难估算完成迁移所需的总时间。最佳方法是先对工作负载进行一次测试迁移。

要计算执行生产服务器迁移导致的总停机时间，需要考虑以下阶段：

PITR 迁移：准确估算迁移生产数据库服务器所需时间的最佳方法是对生产服务器进行时间点还原 (PITR)，然后在此新还原的服务器上运行脱机迁移。
缓冲区迁移：完成前一步骤后，可将实际的生产迁移安排在应用程序流量较低的时间段。可将此迁移安排在同一天或大概一周后。此时，源服务器的大小可能已经增大。根据此增量更新生产服务器的估算迁移时间。如果增量很大，考虑使用 PITR 服务器再执行一次测试。但是对于大多数服务器而言，大小的增加不应该太显著。
数据验证：生产服务器的迁移完成后，需要验证灵活服务器中的数据是否是源实例的精确副本。可使用开源或第三方工具或可手动进行验证。 在实际迁移之前，准备您要执行的验证步骤。验证可能包括：
- 迁移中涉及的所有表的行计数一致性检查。
- 所有数据库对象（表、序列、扩展、过程和索引）的匹配计数。
- 比较关键的应用程序相关列的最大或最小 ID。
  
  注意事项
  
  数据库的相对大小不是验证的正确指标。源实例可能有膨胀或死元组，从而可能会增大源实例的大小。源实例和目标服务器之间存在大小差异是正常的。前三个验证步骤中有问题表明迁移出现问题。
迁移服务器设置：必须将任何自定义参数、防火墙规则（如果适用）、标记和警报从源实例手动复制到目标。
更改连接字符串：成功验证后，应用程序应会更改其连接字符串以指向灵活服务器。与应用程序团队协调此活动，以更改所有指向源实例的连接字符串引用。在灵活服务器中，用户参数可以采用连接字符串格式的 user=username 格式使用。

例如：psql -h myflexserver.postgres.database.chinacloudapi.cn -u user1 -d db1

虽然迁移的运行通常不会出现任何问题，但如果需要更多时间进行调试，或需要重启迁移，则最好针对意外情况做好规划。

确定迁移速度基准

下表显示了使用迁移服务对各种大小的数据库执行迁移所需的时间。迁移是通过使用具有 SKU Standard_D4ds_v4（4 核心，16 GB 内存）的灵活服务器执行的。

数据库大小	大约所需时间 (HH:MM)
1GB	00:01
5 GB	00:03
10 GB	00:08
50 GB	00:35
100 GB	01:00
500 GB	04:00
1,000 GB	07:00

前面的数字提供了完成迁移所需的大致时间。我们强烈建议使用工作负载进行测试迁移，以准确评估服务器迁移的价值。

重要

尽管可突发 SKU 不是限制因素，但建议为您的弹性服务器选择更高的 SKU，以加快迁移速度。 Azure Database for PostgreSQL灵活服务器支持近乎零的停机时间计算和 IOPS 缩放，因此 SKU 可以在最短的停机时间内进行更新。始终可以更改 SKU 来满足迁移后的应用程序需求。

提高迁移速度：表的并行迁移

由于 PostgreSQL 迁移服务会耗尽灵活服务器上的容器，因此建议对目标使用功能强大的 SKU。 SKU 越强大，可以并行迁移的表越多。迁移后，可以将 SKU 缩减回首选配置。本部分包含在表之间的数据分布需要更均衡或更强大的 SKU 对迁移速度没有显著影响时提高迁移速度的步骤。

如果源上的数据分布高度倾斜，大部分数据都存在于一个表中，则分配的迁移计算需要得到充分利用，这会造成瓶颈。因此，将大型表拆分为较小的区块，然后将其并行迁移。此功能适用于大于 20 GB 的表。如果满足以下条件之一，则有可能将表拆分为较小的区块：

表必须有一列是smallint、integer 或big int类型的简单主键或唯一索引（而非复合主键或唯一索引）。

注意事项

对于第一种或第二种方法，必须仔细评估向源架构添加唯一索引列的影响。只有在确认添加唯一索引列不会影响应用程序后，你才能继续进行更改。
如果表没有 smallint、integer 或 big int 类型的简单主键或唯一索引，但具有满足数据类型条件的列，则可使用以下命令将该列转换为唯一索引。此命令不需要对表进行锁定。
```
    create unique index concurrently partkey_idx on <table name> (column name);
```
如果表没有smallint、integer或big int主键或唯一索引，也没有满足数据类型条件的任何列，则可以使用ALTER添加此类列，并在迁移完成后删除它。运行 ALTER 命令需要对表进行锁定。
```
    alter table <table name> add column <column name> big serial unique;
```

如果满足前述条件，则将以多个分区并行的方式迁移表，这应该会提高迁移速度。

工作原理

迁移服务查找表的大小，以检查它是否大于 20 GB。
如果大小大于 20 GB，并且存在 smallint、integer 或 big int 主键或唯一索引，则表拆分为多个部分，并且每个部分并行迁移。

总之，如果存在以下情况，PostgreSQL 迁移服务将通过并行线程迁移表，从而缩短迁移时间：

表中有一列设置为 smallint、integer 或 big int 类型的简单主键或唯一索引。
表大小大于 20 GB。
使用的 SKU 包含空闲核心，可用于以并行方式迁移表。

清空 PostgreSQL 数据库中的膨胀

随着时间的推移，数据添加、更新和删除，PostgreSQL 可能会积累无效行并浪费存储空间。这种膨胀可能导致storage要求增加，并降低查询性能。清空是一项重要的维护任务，可帮助回收此浪费的空间，并确保数据库高效运行。清理可解决死行和表膨胀等问题，以确保高效使用存储。它还有助于确保迁移更快，因为迁移时间是数据库大小的函数。

PostgreSQL 提供 VACUUM 命令来回收死行占用的存储。此外，ANALYZE 选项可收集统计信息，以进一步优化查询规划。对于存在大量写入活动的表，VACUUM 过程可以通过使用 VACUUM FULL 变得更加主动，但需要更多时间来运行。

标准真空
```
VACUUM your_table;
```
真空分析
```
VACUUM ANALYZE your_table;
```
适用于大量写入表的主动清空
```
VACUUM FULL your_table;
```

在此示例中，请将 your_table 替换为实际的表名称。不带 VACUUM 的 FULL 命令可高效回收空间，而 VACUUM ANALYZE 则会优化查询规划。由于 VACUUM FULL 选项对性能影响较大，因此应谨慎使用此选项。

一些数据库可存储图像或文档等可能随时间推移促进数据库膨胀的大型对象。 VACUUMLO 命令专为 PostgreSQL 中的大型对象而设计。

清空大型对象
```
VACUUMLO;
```

定期合并这些清空策略可确保 PostgreSQL 数据库得到良好维护。

特殊注意事项

某些特殊条件通常是指你在继续学习教程或模块之前需要注意的特殊环境、配置或先决条件。这些条件可能包括特定软件版本、硬件要求或成功完成学习内容所需的其他工具。

联机迁移

联机迁移使用pgcopydb follow，并应用一些逻辑解码限制。我们还建议在正在进行在线迁移的数据库的所有表中设置主键。如果缺少主键，则该缺陷会导致仅在迁移期间反映 insert 操作，而不包括更新或删除。在继续联机迁移之前，请将临时主键添加到相关表。

注意事项

在没有主键的情况下联机迁移表时，只会在目标上重播 insert 操作。如果在源上更新或删除的记录不反映目标，则这可能会在数据库中引入不一致。

另一种方法是使用 ALTER TABLE 命令，其中操作为 REPLICA IDENTIY，并带有 FULL 选项。 FULL 选项记录行中所有列的旧值，以便即使没有主键，所有 CRUD 操作也会在联机迁移期间反映在目标上。如果这些选项都不起作用，请执行脱机迁移作为替代方法。

数据库连接清理

有时，启动迁移时可能会遇到此错误：

CL003:Target database cleanup failed in the pre-migration step. Reason: Unable to kill active connections on the target database created by other users. Please add the pg_signal_backend role to the migration user using the command 'GRANT pg_signal_backend to <migrationuser>' and try a new migration.

在此场景中，可向 migration user 授予关闭与数据库所有活动连接的权限，也可以在重试迁移之前手动关闭连接。

Last updated on 2026-07-03