Azure 备份根据备份要求和基础结构拓扑(本地或 Azure)提供多个备份解决方案。 任何备份用户或管理员都应看到所有解决方案中发生的情况,并会在出现重大情况时收到通知。 本文详细介绍了 Azure 备份服务提供的监视和通知功能。
注意
以下部分介绍的功能也可以通过 备份中心访问。 备份中心是 Azure 中的一种统一管理体验。 它使企业能够大规模管理、监视、操作和分析备份。 使用此解决方案,您可以执行备份管理中大部分关键操作,而不受限于单个保管库的范围。
恢复服务保管库中的备份项
可通过恢复服务保管库监视所有备份项。 导航到恢复服务保管库的备份实例部分,此时会打开一个视图,其中提供给定工作负荷类型的所有备份项的详细列表,以及每个项的上次备份状态、可用的最新还原点等信息。 你还可以查看备份保管库中的备份实例列表。
注意
对于使用 DPM 备份到 Azure 的项,该列表将显示使用 DPM 服务器保护的所有数据源(包括磁盘和联机数据源)。 如果对保留了备份数据的数据源停止保护,则该数据源仍会在门户中列出。 可访问数据源的详细信息,查看恢复点是否存在于磁盘、联机或同时存在于这两者中。 此外,对于联机保护已停止但数据仍被保留的数据源,联机恢复点的计费将继续,直至数据被彻底删除。
DPM 版本必须是 DPM 1807(5.1.378.0)或 DPM 2019(版本 10.19.58.0 或更高版本),才能在恢复服务保管库门户中看到备份项。
对于 DPM、MABS 和 MARS,备份项(VM 名称、群集名称、主机名、卷或文件夹名称)和保护组不能包含“”、“'<”、“%”、“>&”、“:”、“?”、“/”、“#”或任何控制字符。
备份作业
Azure 备份针对 Azure 备份保护的工作负荷提供内置的监视和警报功能。 导航到“备份中心”的“备份作业”窗格,可以查看保管库中最近的备份和还原作业。
执行配置备份、备份、还原、删除备份等操作时,会生成作业。
此处会显示来自下列 Azure 备份解决方案的任务:
- Azure VM 备份
- Azure 文件备份
- Azure 工作负荷备份,例如 SQL 和 SAP HANA
- Microsoft Azure 恢复服务 (MARS) 代理
未显示来自 System Center Data Protection Manager (SC-DPM) 和 Microsoft Azure 备份服务器 (MABS) 的作业。
注意
- Azure VM 中的 Azure 工作负荷(例如 SQL 和 SAP HANA 备份)包含大量的备份作业。 例如,日志备份可能每隔 15 分钟运行一次。 因此,对于此类数据库工作负荷,只会显示用户触发的操作。 不会显示计划的备份操作。
- 在备份中心,可查看过去 14 天的作业。 如果要查看较长持续时间内的作业,可转到各个恢复服务保管库并选择“备份作业”选项卡。对于超过 6 个月的作业,建议使用 Log Analytics 和/或备份报告可靠、高效地查询旧作业。
用于 Azure 备份的 Azure Monitor 警报
Azure 备份还通过 Azure Monitor 提供警报,使你能够在不同的 Azure 服务(包括 Azure 备份)中获得一致的警报管理体验。 使用 Azure Monitor 警报可以将警报路由到 Azure Monitor 支持的任何通知通道,例如电子邮件、Webhook、逻辑应用等。
Azure 备份目前提供两种主要类型的内置警报:
- 安全警报:在删除了备份数据或禁用了保管库的软删除功能等情况下,安全警报(严重性为 Sev 0)将会触发并显示在 Azure 门户中,或者可通过其他客户端(PowerShell、CLI 和 REST API)获取。 默认会生成安全警报,且无法将其关闭。 但是,您可以控制哪些场景会触发通知(例如电子邮件)。 有关如何配置通知的详细信息,请参阅操作规则。
- 作业失败警报:对于备份失败和还原失败等情况,Azure 备份通过 Azure Monitor 提供内置警报(严重性为“严重性 1”)。 不同于安全警报,可以选择关闭针对作业失败场景的 Azure Monitor 警报。 例如,你已通过 Log Analytics 为作业失败配置自定义警报规则,且不需要为每个作业失败触发内置警报。 默认情况下,作业失败警报是开启的。 有关详细信息,请参阅有关针对这些场景打开警报的部分。
下表汇总了当前通过 Azure Monitor 提供的各种备份警报和支持的工作负载/保管库类型:
| 警报类别 | 警报名称 | 支持的工作负载类型/保管库类型 | 说明 |
|---|---|---|---|
| 安全性 | 删除备份数据 | - Azure 虚拟机 - Azure VM 中的 SQL(非 AG 场景) - Azure VM 中的 SAP HANA - Azure 备份代理 - DPM (数据包管理器) - Azure 备份服务器 - Azure PostgreSQL 数据库服务器 - Azure Blob - Azure 托管磁盘 |
停止备份并删除备份数据时,将触发此警报。 注意 如果为保管库禁用了软删除功能,则不会收到“删除备份数据”警报。 |
| 安全性 | 即将清除 | - Azure 虚拟机 - Azure VM 中的 SQL - Azure VM 中的 SAP HANA |
对于支持软删除的所有工作负载,当某个项的备份数据在 2 天后就会被 Azure 备份服务永久清除时,将触发此警报。 |
| 安全性 | 清除完成 | - Azure 虚拟机 - Azure VM 中的 SQL - Azure VM 中的 SAP HANA |
删除备份数据 |
| 安全性 | 为保管库禁用了软删除 | 恢复服务保管库 | 当 Azure 备份服务永久删除了某个项的软删除备份数据时,将触发此警报。 |
| 安全性 | 修改保留期较短的策略 | - Azure 虚拟机 - Azure VM 中的 SQL - Azure VM 中的 SAP HANA - Azure 文件存储 |
当修改备份策略以使用较少的保留期时,将触发此警报。 |
| 安全性 | 修改保护策略以缩短保留时间 | - Azure 虚拟机 - Azure VM 中的 SQL - Azure VM 中的 SAP HANA - Azure 文件存储 |
当将备份实例分配到保留时间较短的其他策略时,将触发此警报。 |
| 安全性 | MUA 已禁用 | 恢复服务保管库 | 当用户禁用保管库的邮件用户代理 (MUA) 功能时,将触发此警报。 |
| 安全性 | 禁用混合安全性功能 | 恢复服务保管库 | 当为保管库禁用混合安全性设置时,此警报会被触发。 |
| 作业 | 备份失败 | - Azure 虚拟机 - Azure VM 中的 SQL - Azure VM 中的 SAP HANA - Azure 备份代理 - Azure 文件存储 - Azure PostgreSQL 数据库服务器 - Azure 托管磁盘 |
发生备份作业失败时,将触发此警报。 针对备份失败的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分。 |
| 作业 | 还原失败 | - Azure 虚拟机 - Azure VM 中的 SQL(非 AG 场景) - Azure VM 中的 SAP HANA - Azure 备份代理 - Azure 文件存储 - Azure PostgreSQL 数据库服务器 - Azure Blob - Azure 托管磁盘 |
发生还原作业失败时,将触发此警报。 针对还原失败的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分。 |
| 作业 | 不支持的备份类型 | - Azure VM 中的 SQL - Azure VM 中的 SAP HANA |
当数据库的当前设置不支持策略中的特定备份类型时,将触发此警报。 不支持的备份类型情景的警报默认已开启。 有关详细信息,请参阅有关针对此场景打开警报的部分。 |
| 作业 | 工作负载扩展不正常 | - Azure VM 中的 SQL - Azure VM 中的 SAP HANA |
当用于数据库备份的 Azure 备份工作负载扩展处于不正常状态(这可能会导致将来的备份失败)时,将触发此警报。 针对工作负载扩展不正常场景的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分。 |
注意
- 对于 Azure VM 备份,在删除基础 VM 或另一个备份作业已在进行中(导致另一个备份作业失败)的情况下,不会发送备份失败警报。 这是因为,这些方案预期备份会按设计失败,因此这两种情况下不会生成警报。
启用针对作业失败情况的 Azure Monitor 警报
若要选择打开针对备份失败和还原失败场景的 Azure Monitor 警报,请执行以下步骤:
选择保管库类型:
默认情况下,为作业失败生成内置的 Azure Monitor 警报。 如果要关闭这些情形的警报,您可以相应地编辑保管库的监视设置属性。
若要管理备份保管库的监视设置,请执行以下步骤:
转到保管库并选择“属性”。
找到“监控设置”保管库属性,然后选择“更新”。
在上下文窗格中,选择适当的选项,根据要求启用/禁用作业失败的内置 Azure Monitor 警报。
我们还建议选中“仅使用 Azure Monitor 警报”复选框。
通过选择此选项,你同意仅通过 Azure Monitor 接收备份警报,并且将停止接收来自旧版经典警报解决方案的警报。 查看经典警报和内置 Azure Monitor 警报之间的主要差别。
选择“保存”以便保存保管库的设置。
在 Azure 门户中查看已触发的警报
为保管库触发警报后,您可以转到 Azure 门户的备份中心查看警报。 在“概述”选项卡中可以看到按严重性划分的活动警报汇总。 其中显示了两种类型的警报:
- 数据源警报:与正在备份的特定数据源关联的警报(例如,VM 备份或还原失败、删除数据库备份数据等)显示在“数据源警报”部分下。
- 全局警报:不与特定数据源关联的警报(例如,禁用保管库软删除功能)会显示在“全局警报”部分中。
以上每种警报类型又进一步划分为“安全”和“已配置”警报。 目前,安全警报的场景包括删除备份数据或禁用保管库的软删除功能(这些适用于上节详述的工作负载)。 配置的警报包括备份失败和还原失败,因为这些警报仅在未针对这些方案禁用警报时触发。
选择任一数字(或“警报”菜单项)会打开一个列表,其中列出了触发的所有活动警报和应用的相关筛选器。 可以根据各种属性(例如订阅、资源组、保管库、严重性、状态等)进行筛选。 可以选择任一警报以查看有关该警报的更多详细信息,例如受影响的数据源、警报说明和建议的操作,等等。
可以选择“更改警报状态”将警报的状态更改为“已确认”或“已关闭”。
注意
- “备份中心”目前仅显示针对基于 Azure 的工作负载的警报。 若要查看针对本地资源的警报,请转到恢复服务保管库,然后选择“警报”菜单项。
- 备份中心仅显示 Azure Monitor 警报。 由较旧警报解决方案(通过恢复服务保管库中的“备份警报”选项卡访问)引发的警报不会显示在备份中心。 有关 Azure Monitor 警报的详细信息,请参阅 Azure 中的警报概述。
- 目前,对于 blob 还原警报,仅在创建警报规则时同时选择了datasourceId和datasourceType两个维度,警报才会显示在数据源警报下。 如果未选择任何维度,警报将显示在全局警报下。
为警报配置通知
若要配置 Azure Monitor 警报通知,请创建警报处理规则。 若要创建警报处理规则(之前称为操作规则)将电子邮件通知发送到给定的电子邮件地址,请执行以下步骤。 此外,请按照以下步骤将这些警报路由到其他通知通道,例如 ITSM、Webhook、逻辑应用等。
在 Azure 门户中,转到“备份中心”。
选择菜单中的“警报”,然后选择“警报处理规则”。
选择“创建”。
选择该警报处理规则的应用范围。
可以针对订阅内的所有资源应用该规则。 还可以选择性地对警报应用筛选器,例如,仅针对特定严重性的警报生成通知。
在“规则设置”下,创建一个操作组(或使用现有的操作组)。
操作组是接收警报通知的目标。 例如,一个电子邮件地址。
在“基本信息”选项卡上,选择操作组的名称,以及要在其下创建该操作组的订阅和资源组。
在“通知”选项卡上,选择“电子邮件/短信”并输入收件人电子邮件 ID 。
选择“查看+创建”-“创建”以部署操作组。
保存操作规则。
恢复服务保管库中的备份警报
重要
本部分介绍一种较旧的警报解决方案(称为经典警报)。 我们建议改用基于 Azure Monitor 的警报,因为它提供多种优势。 有关如何切换的详细信息,请参阅切换基于 Azure Monitor 的警报。
警报主要是指通知您采取相应行动的情境。 “备份警报”部分显示 Azure 备份服务生成的警报。 这些警报由服务定义,你无法自定义创建任何警报。
警报场景
以下方案由服务定义为可发出警报的方案:
- 备份/还原失败
- 备份成功,但有针对 Microsoft Azure 恢复服务 (MARS) 代理的警告。
- 停止保护并删除数据
- 保管库已禁用软删除功能
- 数据库工作负载的备份类型不受支持
- 数据库备份的工作负载扩展健康问题
来自各种 Azure 备份解决方案的警报
下面是来自 Azure 备份解决方案的警报:
- Azure VM 备份
- Azure 文件备份
- Azure 工作负荷备份,例如 SQL 备份、SAP HANA 备份
- Microsoft Azure 恢复服务 (MARS) 代理
注意
- 此处不会显示 System Center Data Protection Manager (SC-DPM) 和 Microsoft Azure 备份服务器 (MABS) 中的警报。
- 目前不会为 Azure 文件存储备份发送停止保护并删除数据的警报。
- 仅当对保管库启用了软删除功能时,才会生成“停止保护并删除数据”警报。也就是说,如果保管库禁用了软删除功能,那么会发送单个警报以通知您软删除功能已被禁用。 后续删除任何项的备份数据都不会引发警报。
合并警报
对于 Azure 工作负载备份解决方案(例如 SQL 和 SAP HANA),系统可能频繁生成日志备份(根据策略,最高可达每 15 分钟生成 1 次)。 因此,你可能会遇到日志备份频繁失败的情况(最高可达每 15 分钟失败一次)。 在这种情况下,如果每次失败都引发一次警报,最终用户将会不堪其扰。
因此,系统会在第一次失败时发送警报,以后由于同一根本原因而失败时则不会生成警报。 第一个警报的失败计数已更新。 但如果你已停用警报,则下一次发生时会再次触发警报,并将其视为该次事件的第一次警报。 这是 Azure 备份针对 SQL 和 SAP HANA 备份执行警报合并的方式。
不合并按需备份作业。
未引发警报的例外情况
在一些例外情况下,失败时不会引发警报。 它们分别是:
- 您已明确取消了正在运行的作业。
- 作业失败,因为另一个备份作业正在进行中(无需采取任何操作,因为我们必须等待前一个作业完成)。
- VM 备份作业失败,因为备份的 Azure VM 不再存在。
- 合并的警报
之所以设计上述异常,是因为我们知道,这些操作的结果(主要是用户触发的操作)会立即在门户/PS/CLI 客户端中显示。 因此,你会立即了解相关情况,不需要通知。
警报类型
可以根据警报严重性定义三种类型的警报:
- 关键:原则上,任何(计划的或用户触发的)备份或恢复失败都会导致生成警报并显示为“关键”警报。 还会针对破坏性操作(例如删除备份)生成警报。
- 警告:如果备份操作成功但出现了几条警告,则会将这些警报列为“警告”警报。 “警告”警报目前仅适用于 Azure 备份代理备份。
- 信息性:目前,Azure 备份服务不会生成任何信息性警报。
备份警报的通知
注意
只能通过 Azure 门户配置通知。 目前不支持 PS/CLI/REST API/Azure 资源管理器模板客户端。
一旦引发警报,你就会收到通知。 Azure 备份通过电子邮件提供内置通知机制。 可以指定在生成警报时接收通知的个人电子邮件地址或通讯组列表。 你还可以选择是要接收每个警报的通知,还是将这些警报分组成按小时摘要,然后接收通知。
配置通知后,你会收到一封欢迎电子邮件或简介电子邮件。 由此可以确认,在引发警报时,Azure 备份可向这些地址发送电子邮件。
如果将频率设置为“每小时摘要”,并且警报在一小时内触发并解决,那么后续的每小时摘要中将不会包括该警报。
注意
- 如果执行破坏性操作(例如“停止保护并删除数据”),那么即使没有为恢复服务保管库配置通知,也会引发警报,并向订阅所有者、管理员和共同管理员发送电子邮件。
- 若要针对成功的作业配置通知,请使用 Log Analytics。
停用警报
若要停用/解决某个活动警报,可以选择与要停用的警报相对应的列表项。 这将打开一个屏幕,其中会显示有关警报的详细信息,顶部有一个“停用”按钮。 选择此按钮会将警报的状态更改为“非活动”。 还可以通过右键单击与警报对应的列表项,然后选择“停用”来停用该警报。