Service Fabric 事件列表

Service Fabric 公开一组主要的群集事件,以通知群集的状态为 Service Fabric 事件。 这些事件基于 Service Fabric 在节点上执行的操作和群集所有者/操作员所做的群集或管理决策。 可以通过多种配置方式访问这些事件,包括使用群集配置 Azure Monitor 日志,或查询 EventStore。 在 Windows 计算机上,这些事件被传输到 EventLog - 因此可以在“事件查看器”中查看 Service Fabric 事件。

下面是这些事件的一些特征

  • 每个事件被绑定到群集中的特定实体,例如应用程序程序、服务、节点、副本。
  • 每个事件都包含一组公共字段:EventInstanceId、EventName 和 Category。
  • 每个事件都包含字段,这些字段将事件绑定回与之关联的实体。 例如,ApplicationCreated 事件将具有标识创建的应用程序名称的字段。
  • 事件以此方式构建,因此,可以在各种工具中使用它们来执行进一步分析。 此外,事件的相关详细信息被定义为单独的属性,而不是一个长字符串。
  • 事件由 Service Fabric 中的不同子系统编写,由下面的源(任务)标识。 有关这些子系统的详细信息,请参阅 Service Fabric 体系结构Service Fabric 技术概览

下面是这些按实体组织的 Service Fabric 事件的列表。

群集事件

群集升级事件

有关群集升级的详细信息,请参阅此处

EventId 名称 类别 说明 源(任务) Level
29627 ClusterUpgradeStarted 升级 群集升级已启动 CM 信息
29628 ClusterUpgradeCompleted 升级 群集升级已完成 CM 信息
29629 ClusterUpgradeRollbackStarted 升级 群集升级已开始回退 CM 警告
29630 ClusterUpgradeRollbackCompleted 升级 群集升级已完成回退 CM 警告
29631 ClusterUpgradeDomainCompleted 升级 升级域在群集升级期间已完成升级 CM 信息

节点事件

节点生命周期事件

EventId 名称 类别 说明 源(任务) Level
18602 NodeDeactivateCompleted StateTransition 节点停用已完成 FM 信息
18603 NodeUp StateTransition 群集检测到节点已启动 FM 信息
18604 NodeDown StateTransition 群集检测到节点已关闭。 在节点重新启动时,会看到后跟 NodeUp 事件的 NodeDown 事件 FM 错误
18605 NodeAddedToCluster StateTransition 一个新节点已添加到群集,Service Fabric 可以将应用程序部署到此节点 FM 信息
18606 NodeRemovedFromCluster StateTransition 从群集中删除了一个节点。 Service Fabric 将无法再将应用程序部署到此节点 FM 信息
18607 NodeDeactivateStarted StateTransition 节点停用已启动 FM 信息
25621 NodeOpenSucceeded StateTransition 节点已成功启动 FabricNode 信息
25622 NodeOpenFailed StateTransition 节点未能启动并加入环 FabricNode 错误
25624 NodeClosed StateTransition 节点已成功关闭 FabricNode 信息
25626 NodeAborted StateTransition 一个节点已经以非正常方式关闭 FabricNode 错误

Ktl 记录器节点事件

EventId 名称 类别 说明 源(任务) Level
50187 SharedLogWriteThrottled 健康产业 写入共享日志受限 KtlLoggerNode 信息
50188 SharedLogWriteUnthrottled 健康产业 写入共享日志不受限 KtlLoggerNode 信息

应用程序事件

应用程序生命周期事件

EventId 名称 类别 说明 源(任务) Level
29620 ApplicationCreated LifeCycle 新应用程序已创建 CM 信息
29625 ApplicationDeleted LifeCycle 一个现有的应用程序已删除 CM 信息
23083 ApplicationProcessExited LifeCycle 应用程序中的一个进程已退出 Hosting 信息

应用程序升级事件

有关应用程序升级的详细信息,请参阅此处

EventId 名称 类别 说明 源(任务) Level
29621 ApplicationUpgradeStarted 升级 应用程序升级已启动 CM 信息
29622 ApplicationUpgradeCompleted 升级 应用程序升级已完成 CM 信息
29623 ApplicationUpgradeRollbackStarted 升级 应用程序升级已开始回退 CM 警告
29624 ApplicationUpgradeRollbackCompleted 升级 应用程序升级已完成回退 CM 警告
29626 ApplicationUpgradeDomainCompleted 升级 升级域在应用程序升级期间已完成升级 CM 信息

服务事件

服务生命周期事件

EventId 名称 类别 说明 源(任务) Level
18657 ServiceCreated LifeCycle 已创建新服务 FM 信息
18658 ServiceDeleted LifeCycle 已删除一个现有的服务 FM 信息

分区事件

分区移动事件

EventId 名称 类别 说明 源(任务) Level
18940 PartitionReconfigured LifeCycle 分区重新配置已完成 RA 信息

副本事件

副本生命周期事件

EventId 名称 类别 说明 源(任务) Level
61701 ReliableDictionaryOpened LifeCycle 可靠字典已打开 DistributedDictionary 信息
61702 ReliableDictionaryClosed LifeCycle 可靠字典已关闭 DistributedDictionary 信息
61703 ReliableDictionaryCheckpointRecovered LifeCycle 可靠字典已恢复其检查点 DistributedDictionary 信息
61704 ReliableDictionaryCheckpointFilesSent LifeCycle 副本已发送可靠字典的检查点文件 DistributedDictionary 信息
61705 ReliableDictionaryCheckpointFilesReceived LifeCycle 副本已接收可靠字典的检查点文件 DistributedDictionary 信息
61963 ReliableQueueOpened LifeCycle 可靠队列已打开 DistributedQueue 信息
61964 ReliableQueueClosed LifeCycle 可靠队列已关闭 DistributedQueue 信息
61965 ReliableQueueCheckpointRecovered LifeCycle 可靠队列已恢复其检查点 DistributedQueue 信息
61966 ReliableQueueCheckpointFilesSent LifeCycle 副本已发送可靠队列的检查点文件 DistributedQueue 信息
63647 ReliableQueueCheckpointFilesReceived LifeCycle 副本已接收可靠队列的检查点文件 DistributedQueue 信息
63648 ReliableConcurrentQueueOpened LifeCycle 可靠并发队列已打开 ReliableConcurrentQueue 信息
63649 ReliableConcurrentQueueClosed LifeCycle 可靠并发队列已关闭 ReliableConcurrentQueue 信息
63650 ReliableConcurrentQueueCheckpointRecovered LifeCycle 可靠并发队列已恢复其检查点 ReliableConcurrentQueue 信息
61687 TStoreError 失败 可靠集合已收到意外错误 TStore 错误
63831 PrimaryFullCopyInitiated LifeCycle 主要副本已启动完整副本 TReplicator 信息
63832 PrimaryPartialCopyInitiated LifeCycle 主要副本已启动不完整副本 TReplicator 信息
16831 BuildIdleReplicaStarted LifeCycle 主要副本已开始构建空闲副本 复制 信息
16832 BuildIdleReplicaCompleted LifeCycle 主要副本已构建完空闲副本 复制 信息
16833 BuildIdleReplicaFailed LifeCycle 主要副本无法构建空闲副本 复制 警告
16834 PrimaryReplicationQueueFull 健康产业 主要副本的复制队列已满 复制 警告
16835 PrimaryReplicationQueueWarning 健康产业 主要副本的复制队列已快满 复制 警告
16836 PrimaryReplicationQueueWarningMitigated 健康产业 主要副本的复制队列正常 复制 信息
16837 SecondaryReplicationQueueFull 健康产业 次要副本的复制队列已满 复制 警告
16838 SecondaryReplicationQueueWarning 健康产业 次要副本的复制队列已快满 复制 警告
16839 SecondaryReplicationQueueWarningMitigated 健康产业 次要副本的复制队列正常 复制 信息
16840 PrimaryFaultedSlowSecondary 健康产业 主要副本已导致慢速次要副本出现故障 复制 警告
16841 ReplicatorFaulted 健康产业 副本已出现故障 复制 警告

容器事件

容器生命周期事件

EventId 名称 说明 源(任务) Level 版本
23074 ContainerActivated 容器已启动 Hosting 信息 1
23075 ContainerDeactivated 容器已停止 Hosting 信息 1
23082 ContainerExited 容器已退出 - 请检查 UnexpectedTermination 标志 Hosting 信息 1

BackupRestoreService 事件

在 SF 群集上启用 BackupRestoreService (BRS) 时,它会公开用户触发的事件和定期操作,以便用户了解操作的状态。 用户触发的操作包括在群集上创建备份策略、在分区上触发备份或在 BRS 上下文中触发任何其他有效操作等操作。 BRS 定期在群集级别发出当前活动策略的状态、有关上次备份和即将进行的计划备份的信息,以及分区级别不同阶段定期备份的状态。

BackupRestoreService 分区事件

EventId 名称 说明 源(任务) Level
65305 BRSInfo 触发定期备份 BackupRestoreService 信息
65307 BRSWarning 增量备份失败,触发完整备份 BackupRestoreService 警告
65309 BRSError 定期备份失败 BackupRestoreService 错误

BackupRestoreService 群集事件

EventId 名称 说明 源(任务) Level
65306 BRSInfo 已创建备份策略 BackupRestoreService 信息
65308 BRSWarning 已删除备份策略 BackupRestoreService 警告
65310 BRSError AddBackupPolicy 失败 BackupRestoreService 错误

运行状况报告

Service Fabric 运行状况模型提供丰富、灵活且可扩展的运行状况评估和报告。 从 Service Fabric 版本 6.2 开始,运行状况数据将作为平台事件写入,以提供运行状况历史记录。 为保持较低的运行状况事件数量,我们只将以下内容作为 Service Fabric 事件编写:

  • 所有 ErrorWarning 运行状况报告
  • 转换期间的 Ok 运行状况报告
  • ErrorWarning 运行状况事件过期。 这可以用于确定一个实体不正常的时间

群集运行状况报告事件

EventId 名称 说明 源(任务) Level 版本
54428 ClusterNewHealthReport 新的群集运行状况报告可用 HM 信息 1
54437 ClusterHealthReportExpired 现有的群集运行状况报告已过期 HM 信息 1

节点运行状况报告事件

EventId 名称 说明 源(任务) Level 版本
54423 NodeNewHealthReport 新的节点运行状况报告可用 HM 信息 1
54432 NodeHealthReportExpired 现有的节点运行状况报告已过期 HM 信息 1

应用程序运行状况报告事件

EventId 名称 说明 源(任务) Level 版本
54425 ApplicationNewHealthReport 新的应用程序运行状况报告已创建。 这适用于未部署的应用程序。 HM 信息 1
54426 DeployedApplicationNewHealthReport 新的已部署应用程序运行状况报告已创建 HM 信息 1
54427 DeployedServicePackageNewHealthReport 新的已部署服务运行状况报告已创建 HM 信息 1
54434 ApplicationHealthReportExpired 现有的应用程序运行状况报告已过期 HM 信息 1
54435 DeployedApplicationHealthReportExpired 现有的已部署应用程序运行状况报告已过期 HM 信息 1
54436 DeployedServicePackageHealthReportExpired 现有的已部署服务运行状况报告已过期 HM 信息 1

服务运行状况报告事件

EventId 名称 说明 源(任务) Level 版本
54424 ServiceNewHealthReport 新的服务运行状况报告已创建 HM 信息 1
54433 ServiceHealthReportExpired 现有的服务运行状况报告已过期 HM 信息 1

分区运行状况报告事件

EventId 名称 说明 源(任务) Level 版本
54422 PartitionNewHealthReport 新的分区运行状况报告已创建 HM 信息 1
54431 PartitionHealthReportExpired 现有的分区运行状况报告已过期 HM 信息 1

副本运行状况报告事件

EventId 名称 说明 源(任务) Level 版本
54429 StatefulReplicaNewHealthReport 有状态副本运行状况报告已创建 HM 信息 1
54430 StatelessInstanceNewHealthReport 新的无状态实例运行状况报告已创建 HM 信息 1
54438 StatefulReplicaHealthReportExpired 现有的有状态副本运行状况报告已过期 HM 信息 1
54439 StatelessInstanceHealthReportExpired 现有的无状态实例运行状况报告已过期 HM 信息 1

混沌测试事件

混沌会话事件

EventId 名称 说明 源(任务) Level 版本
50021 ChaosStarted 混沌测试会话已启动 Testability 信息 1
50023 ChaosStopped 混沌测试会话已停止 Testability 信息 1

混沌节点事件

EventId 名称 说明 源(任务) Level 版本
50033 ChaosNodeRestartScheduled 节点已计划在混沌测试会话过程中重启 Testability 信息 1
50087 ChaosNodeRestartCompleted 节点已在混沌测试会话过程中完成重启 Testability 信息 1

混沌应用程序事件

EventId 名称 说明 源(任务) Level 版本
50053 ChaosCodePackageRestartScheduled 已计划在混沌测试会话过程中进行代码包重启 Testability 信息 1
50101 ChaosCodePackageRestartCompleted 代码包重启已在混沌测试会话过程中完成 Testability 信息 1

混沌分区事件

EventId 名称 说明 源(任务) Level 版本
50069 ChaosPartitionPrimaryMoveScheduled 主分区已计划在混沌测试会话过程中移动 Testability 信息 1
50077 ChaosPartitionSecondaryMoveScheduled 辅助分区已计划在混沌测试会话过程中移动 Testability 信息 1
65003 PartitionPrimaryMoveAnalysis 可以对主分区移动进行更深入的分析 Testability 信息 1

混沌副本事件

EventId 名称 说明 源(任务) Level 版本
50047 ChaosReplicaRestartScheduled 已计划在混沌测试会话过程中进行副本重启 Testability 信息 1
50051 ChaosReplicaRemovalScheduled 已计划在混沌测试会话过程中进行副本删除 Testability 信息 1
50093 ChaosReplicaRemovalCompleted 已完成在混沌测试会话过程中进行副本删除的操作 Testability 信息 1

其他事件

相关事件

EventId 名称 说明 源(任务) Level 版本
65011 CorrelationOperational 已检测到相关性 Testability 信息 1

6.2 版本之前的事件

以下是 6.2 版本之前的 Service Fabric 提供的事件综合列表。

EventId 名称 源(任务) Level
25620 NodeOpening FabricNode 信息
25621 NodeOpenedSuccess FabricNode 信息
25622 NodeOpenedFailed FabricNode 信息
25623 NodeClosing FabricNode 信息
25624 NodeClosed FabricNode 信息
25625 NodeAborting FabricNode 信息
25626 NodeAborted FabricNode 信息
29627 ClusterUpgradeStart CM 信息
29628 ClusterUpgradeComplete CM 信息
29629 ClusterUpgradeRollback CM 信息
29630 ClusterUpgradeRollbackComplete CM 信息
29631 ClusterUpgradeDomainComplete CM 信息
23074 ContainerActivated Hosting 信息
23075 ContainerDeactivated Hosting 信息
29620 ApplicationCreated CM 信息
29621 ApplicationUpgradeStart CM 信息
29622 ApplicationUpgradeComplete CM 信息
29623 ApplicationUpgradeRollback CM 信息
29624 ApplicationUpgradeRollbackComplete CM 信息
29625 ApplicationDeleted CM 信息
29626 ApplicationUpgradeDomainComplete CM 信息
18566 ServiceCreated FM 信息
18567 ServiceDeleted FM 信息

后续步骤