Compartir a través de

EventStore 概述

注意

从 Service Fabric 版本 6.4 开始。 EventStore API 仅可用于在 Azure 上运行的 Windows 群集。 我们正在将此功能移植到 Linux 以及我们的独立群集。

概述

EventStore 服务是从版本 6.2 中引入的,它是 Service Fabric 中的监视选项。 EventStore 提供了在给定时间点中了解群集或工作负载的状态的方法。 EventStore 是有状态 Service Fabric 服务,它维护群集中的事件。 事件通过 Service Fabric Explorer、REST 和 API 公开。 EventStore 直接查询群集来获取关于群集中的任何实体的诊断数据,并且应当用来帮助执行以下操作:

  • 在开发或测试时或者当可能使用监视管道时对问题进行诊断
  • 确认正在正确处理对群集执行的管理操作
  • 获取 Service Fabric 如何与特定实体进行交互的“快照”

屏幕截图显示了“节点”窗格中多个事件(包括 NodeDown 事件)的“事件”选项卡。

若要查看 EventStore 中可用的事件的完整列表,请参阅 Service Fabric 事件

注意

从 Service Fabric 版本 6.4 开始。 EventStore API 和 UX 已正式发布,适用于 Azure Windows 群集。 我们正在将此功能移植到 Linux 以及我们的独立群集。

可以向 EventStore 服务查询可用于群集中的每个实体和实体类型的事件。 这意味着可以在以下级别查询事件:

  • 群集:特定于群集本身的事件(例如群集升级)
  • 多节点:所有节点级事件
  • 节点:特定于一个节点的事件,由 nodeName 标识
  • 多应用程序:所有应用程序级事件
  • 应用程序:特定于一个应用程序的事件,由 applicationId 标识
  • 多服务:来自群集中所有服务的事件
  • 服务:来自特定服务的事件,由 serviceId 标识
  • 多分区:来自所有分区的事件
  • 分区:来自特定分区的事件,由 partitionId 标识
  • 分区副本:来自所有副本的事件/特定分区中的实例,由 partitionId 标识
  • 分区副本:来自特定副本的事件/实例,由 replicaIdpartitionId 标识

若要了解有关 API 的详细信息,请参阅 EventStore API 参考

EventStore 服务还能够将群集中的事件相关联。 通过查看在同一时间从可能已相互影响的不同实体写入的事件,EventStore 服务能够将这些事件进行关联来帮助查明群集中发生各项活动的原因。 例如,如果某个应用程序变得不正常且没有诱发任何变化,则 EventStore 将查看由平台公开的其他事件并且可能会将此情况与 ErrorWarning 事件相关联。 这有助于更快地进行故障检测和根本原因分析。

在群集上启用 EventStore

本地群集

群集中的 fabricSettings.json 中,添加 EventStoreService 作为 addOn 功能,并执行群集升级。

    "addOnFeatures": [
        "EventStoreService"
    ],

Azure 群集版本 6.5+

如果 Azure 群集已升级到版本 6.5 或更高版本,则 EventStore 将在该群集上自动启用。 若要选择退出,需要执行以下操作更新群集模板:

  • 使用 2019-03-01 的 API 版本或更高版本
  • 将以下代码添加到群集中的属性部分
      "fabricSettings": [
        …
      ],
      "eventStoreServiceEnabled": false
    

Azure 群集版本 6.4

如果使用的是版本 6.4,则可以编辑 Azure 资源管理器模板,以启用 EventStore 服务。 此操作通过执行群集配置升级和添加以下代码来完成。你可以使用 PlacementConstraints 将 EventStore 服务的副本放置在特定的 NodeType(例如,专用于系统服务的 NodeType)上。 upgradeDescription 部分配置配置升级,以触发节点上的重新启动。 可以在其他更新中删除该部分。

    "fabricSettings": [
          …
          …
          …,
         {
            "name": "EventStoreService",
            "parameters": [
              {
                "name": "TargetReplicaSetSize",
                "value": "3"
              },
              {
                "name": "MinReplicaSetSize",
                "value": "1"
              },
              {
                "name": "PlacementConstraints",
                "value": "(NodeType==<node_type_name_here>)"
              }
            ]
          }
        ],
        "upgradeDescription": {
          "forceRestart": true,
          "upgradeReplicaSetCheckTimeout": "10675199.02:48:05.4775807",
          "healthCheckWaitDuration": "00:01:00",
          "healthCheckStableDuration": "00:01:00",
          "healthCheckRetryTimeout": "00:5:00",
          "upgradeTimeout": "1:00:00",
          "upgradeDomainTimeout": "00:10:00",
          "healthPolicy": {
            "maxPercentUnhealthyNodes": 100,
            "maxPercentUnhealthyApplications": 100
          },
          "deltaHealthPolicy": {
            "maxPercentDeltaUnhealthyNodes": 0,
            "maxPercentUpgradeDomainDeltaUnhealthyNodes": 0,
            "maxPercentDeltaUnhealthyApplications": 0
          }
        }

后续步骤