使用可靠集合

项目
2024/08/12

Service Fabric 通过可靠集合向 .NET 开发人员提供有状态的编程模型。具体而言，Service Fabric 提供可靠字典和可靠队列类。在使用这些类时，状态是分区的（实现伸缩性）、复制的（实现可用性），并在分区内进行事务处理（实现 ACID 语义）。让我们看一下可靠字典对象的典型用法，并看一看它究竟在做些什么。

try
{
   // Create a new Transaction object for this partition
   using (ITransaction tx = base.StateManager.CreateTransaction())
   {
      // AddAsync takes key's write lock; if >4 secs, TimeoutException
      // Key & value put in temp dictionary (read your own writes),
      // serialized, redo/undo record is logged & sent to secondary replicas
      await m_dic.AddAsync(tx, key, value, cancellationToken);

      // CommitAsync sends Commit record to log & secondary replicas
      // After quorum responds, all locks released
      await tx.CommitAsync();
   }
   // If CommitAsync isn't called, Dispose sends Abort
   // record to log & all locks released
}
catch (TimeoutException)
{
   // choose how to handle the situation where you couldn't get a lock on the file because it was 
   // already in use. You might delay and retry the operation
   await Task.Delay(100);
}

可靠字典对象上的所有操作（无法恢复的 ClearAsync 除外）都需要一个 ITransaction 对象。此对象与在单个分区中对任何可靠字典和/或可靠队列对象尝试进行的任何及所有更改具有关联性。可通过调用分区的 StateManager 的 CreateTransaction 方法获取 ITransaction 对象。

在上面的代码中，ITransaction 对象传递到可靠字典的 AddAsync 方法。在内部，接受键的字典方法采用与键关联的读取器/写入器锁。如果此方法修改键的值，则在键上使用写入锁；如果此方法只读取键的值，则在键上使用读取锁。由于 AddAsync 将键值修改成新的传入值，因此使用键的写入锁。因此，如果有 2（或更多个）线程尝试在同一时间添加相同的键值，则一个线程将获取写入锁，另一个线程会阻塞。默认情况下，方法最多阻塞 4 秒以获取锁，4 秒后方法会引发 TimeoutException。方法重载存在可让你根据需要传递显式超时值。

通常，编写代码响应 TimeoutException 的方式是捕获它，然后重试整个操作（如以上代码中所示）。在此简单代码中，我们只调用每次超过 100 毫秒的 Task.Delay。但实际上，最好改用某种形式的指数退让延迟。

获取锁后，AddAsync 会在与 ITransaction 对象关联的内部临时字典中添加键和值对象引用。这就完成了读取自己编写的语义。也就是说，在调用 AddAsync 之后，稍后对 TryGetValueAsync 的调用（使用相同的 ITransaction 对象）会返回值，即使尚未提交事务。

备注

使用新事务调用 TryGetValueAsync 会返回对上次提交的值的引用。请勿直接修改该引用，因为这会绕过保存和复制所做更改的机制。建议将值设置为只读，这样，更改键值的唯一方法就是使用可靠字典 API。

接下来，AddAsync 将键和值对象序列化为字节数组，并将这些字节数组附加到本地节点的日志文件。最后，AddAsync 将字节数组发送给所有辅助副本，使其具有相同的键/值信息。即使键/值信息已写入日志文件，在提交其关联的事务之前，这些信息不被视为字典的一部分。

在上述代码中，调用 CommitAsync 会提交所有事务操作。具体而言，它将提交信息附加到本地节点的日志文件，同时将提交记录发送给所有辅助副本。回复副本的仲裁（多数）后，所有数据更改将被视为永久性，并释放通过 ITransaction 对象操作的任何键关联锁，使其他线程/事务可以操作相同的键及其值。

如果未调用 CommitAsync（通常是因为引发了异常），则会释放 ITransaction 对象。在释放未提交的 ITransaction 对象时，Service Fabric 会将中止信息追加到本地节点的日志文件，且不需要将任何信息发送到任何辅助副本。然后将释放通过事务操作的任何与键关联的锁。

易失可靠集合

在某些工作负载中，例如复制缓存，可以容忍偶尔的数据丢失。将数据写入可靠字典时，避免将其保存到磁盘可以提高延迟和吞吐量。缺乏持久性的代价是，如果发生仲裁丢失，则将发生完全数据丢失。由于仲裁丢失很少发生，因此对于这些工作负载来说，性能提高值得极小概率的数据丢失可能性。

目前，易失性支持仅适用于可靠字典和可靠队列，而不适用于 ReliableConcurrentQueues。请参阅注意事项列表，决定是否使用易失性集合。

若要在服务中启用易失性支持，请将服务类型声明中的 HasPersistedState 标志设置为 false，如下所示：

<StatefulServiceType ServiceTypeName="MyServiceType" HasPersistedState="false" />

备注

现有的持久化服务不可变得不稳定，反之亦然。如果要这样做，则需要删除现有服务，然后使用更新的标志部署服务。这意味着，如果要更改 HasPersistedState 标志，则必须自愿接受完全数据丢失。

常见陷阱及其规避方法

现在你已了解可靠集合在内部的工作原理，让我们了解一些常见的误用。参阅以下代码：

using (ITransaction tx = StateManager.CreateTransaction())
{
   // AddAsync serializes the name/user, logs the bytes,
   // & sends the bytes to the secondary replicas.
   await m_dic.AddAsync(tx, name, user);

   // The line below updates the property's value in memory only; the
   // new value is NOT serialized, logged, & sent to secondary replicas.
   user.LastLogin = DateTime.UtcNow;  // Corruption!

   await tx.CommitAsync();
}

使用常规 .NET 字典时，可以在字典中添加键/值，然后更改属性的值（例如 LastLogin）。不过，此代码无法对可靠字典正常运行。我们前面讨论过：调用 AddAsync 将键/值对象序列化成字节数组，并将数组存储到本地文件，并将它们发送到辅助副本。稍后如果更改属性，只会更改内存中的属性值，而不会影响本地文件或发送到副本的数据。如果进程崩溃，内存中的内容将全部丢失。启动新的进程或另一个副本变成主副本时，旧属性值是可用的值。

再次强调，上面这种错误是很容易发生的。只有在进程崩溃时才能发现错误。编写代码的正确方式是只需反转两行：

using (ITransaction tx = StateManager.CreateTransaction())
{
   user.LastLogin = DateTime.UtcNow;  // Do this BEFORE calling AddAsync
   await m_dic.AddAsync(tx, name, user);
   await tx.CommitAsync();
}

这是另一个常见的错误：

using (ITransaction tx = StateManager.CreateTransaction())
{
   // Use the user's name to look up their data
   ConditionalValue<User> user = await m_dic.TryGetValueAsync(tx, name);

   // The user exists in the dictionary, update one of their properties.
   if (user.HasValue)
   {
      // The line below updates the property's value in memory only; the
      // new value is NOT serialized, logged, & sent to secondary replicas.
      user.Value.LastLogin = DateTime.UtcNow; // Corruption!
      await tx.CommitAsync();
   }
}

同样地，使用常规 .NET 字典时，以上代码以常见的模式正常运行：开发人员使用键查询值。如果值存在，开发人员会更改属性的值。不过，使用可靠集合时，此代码会出现前面所述的相同问题： 将对象分配给可靠集合后，你不得修改该对象

在可靠集合中更新值的正确方式是获取对现有值的引用，并将此引用所引用的对象视为不可变。然后创建新的对象，即原始对象的完全相同副本。现在，可以修改此新对象的状态，将新对象写入集合，以便将它序列化为字节数组、附加到本地文件并发送到副本。提交更改之后，内存中的对象、本地文件和所有副本都处于完全一致的状态。大功告成！

以下代码演示在可靠集合中更新值的正确方式：

using (ITransaction tx = StateManager.CreateTransaction())
{
   // Use the user's name to look up their data
   ConditionalValue<User> currentUser = await m_dic.TryGetValueAsync(tx, name);

   // The user exists in the dictionary, update one of their properties.
   if (currentUser.HasValue)
   {
      // Create new user object with the same state as the current user object.
      // NOTE: This must be a deep copy; not a shallow copy. Specifically, only
      // immutable state can be shared by currentUser & updatedUser object graphs.
      User updatedUser = new User(currentUser);

      // In the new object, modify any properties you desire
      updatedUser.LastLogin = DateTime.UtcNow;

      // Update the key's value to the updateUser info
      await m_dic.SetValue(tx, name, updatedUser);
      await tx.CommitAsync();
   }
}

定义不可变的数据类型以防止编程器错误

理想情况下，我们希望编译器能够在意外生成改变对象状态的代码、而此对象又不该改变时报告错误。但是 C# 编译器做不到这一点。因此，为了避免潜在的编程器错误，我们强烈建议将可靠集合使用的类型定义为不可变类型。具体而言，这意味着你要坚持使用核心值类型（例如数字 [Int32、UInt64 等]、DateTime、Guid、TimeSpan 等）。也可以使用 String。最好是避免集合属性，因为将其序列化和反序列化经常会降低性能。但是，如果希望使用集合属性，强烈建议使用 .NET 的不可变集合库 (System.Collections.Immutable)。可以从 https://nuget.org 下载此库。此外，我们建议尽可能地密封类，并将字段设为只读。

以下 UserInfo 类型演示如何利用上述建议定义不可变类型。

[DataContract]
// If you don't seal, you must ensure that any derived classes are also immutable
public sealed class UserInfo
{
   private static readonly IEnumerable<ItemId> NoBids = ImmutableList<ItemId>.Empty;

   public UserInfo(String email, IEnumerable<ItemId> itemsBidding = null) 
   {
      Email = email;
      ItemsBidding = (itemsBidding == null) ? NoBids : itemsBidding.ToImmutableList();
   }

   [OnDeserialized]
   private void OnDeserialized(StreamingContext context)
   {
      // Convert the deserialized collection to an immutable collection
      ItemsBidding = ItemsBidding.ToImmutableList();
   }

   [DataMember]
   public readonly String Email;

   // Ideally, this would be a readonly field but it can't be because OnDeserialized
   // has to set it. So instead, the getter is public and the setter is private.
   [DataMember]
   public IEnumerable<ItemId> ItemsBidding { get; private set; }

   // Since each UserInfo object is immutable, we add a new ItemId to the ItemsBidding
   // collection by creating a new immutable UserInfo object with the added ItemId.
   public UserInfo AddItemBidding(ItemId itemId)
   {
      return new UserInfo(Email, ((ImmutableList<ItemId>)ItemsBidding).Add(itemId));
   }
}

ItemId 类型也是不可变类型，如下所示：

[DataContract]
public struct ItemId
{
   [DataMember] public readonly String Seller;
   [DataMember] public readonly String ItemName;
   public ItemId(String seller, String itemName)
   {
      Seller = seller;
      ItemName = itemName;
   }
}

架构版本控制（升级）

就内部而言，可靠集合使用 .NET 的 DataContractSerializer 串行化对象。串行化对象保存在主副本的本地磁盘中，并传输到辅助副本。随着服务日趋成熟，你可能想要更改服务所需的数据种类（架构）。必须十分谨慎地对待数据的版本控制方法。首先但同样重要的是，始终必须能够反序列化旧数据。具体而言，这意味着反序列化代码必须无限向后兼容：服务代码的版本 333 必须能够对 5 年前服务代码第 1 版放在可靠集合中的数据进行操作。

此外，服务代码一次只升级一个域。因此，在升级期间，同时执行两个不同版本的服务代码。必须避免新版本的服务代码使用新的架构，因为旧版的服务代码可能无法处理新的架构。应该尽可能将每个版本的服务都设计成向前兼容 1 个版本。具体而言，这意味着 V1 的服务代码应当能够忽略它不显式处理的任何架构元素。但是，它必须能够保存它不显式了解的任何数据，并且在更新字典键或值时将它写回。

警告

尽管可以修改键的架构，但必须确保键密钥的相等和比较算法是稳定的。其中任一算法更改后，可靠集合的行为未定义，并可能导致数据损坏、丢失和服务崩溃。 .NET 字符串可以用作键，但请使用字符串本身作为键，不要使用 String.GetHashCode 的结果作为键。

或者，可以执行多阶段升级。

将服务升级到新版本
- 其具有服务代码包中包含的原始 V1 和新的 V2 版本的数据协定；
- 根据需要注册自定义 V2 状态序列化程序；
- 使用 V1 数据协定对原始 V1 集合执行所有操作。
将服务升级到新版本
- 创建新的 V2 集合；
- 在单个事务中首先对 V1，然后对 V2 集合执行添加、更新和删除操作；
- 仅对 V1 集合执行读取操作。
将 V1 集合中的所有数据复制到 V2 集合。
- 这可以通过步骤 2 中部署的服务版本在后台进程中完成。
- 重新处理 V1 集合中的所有键。默认情况下，枚举是使用 IsolationLevel.Snapshot 执行的，以避免在操作期间锁定集合。
- 对于每个键，请使用单独的事务来
  - V1 集合中的 TryGetValueAsync。
  - 如果自复制过程开始以来，该值已从 V1 集合中删除，则应跳过该键，而不是在 V2 集合中重新显示。
  - TryAddAsync 将值添加到 V2 集合。
  - 如果自复制过程开始以来已将值添加到 V2 集合中，则应跳过该键。
  - 仅当 TryAddAsync 返回 true 时，才应提交事务。
  - 值访问 API 默认使用 IsolationLevel.ReadRepeatable，并依赖于锁定来保证在提交或中止事务之前，其他调用方不会修改这些值。
将服务升级到新版本
- 仅对 V2 集合执行读取操作；
- 仍会首先在 V1，然后在 V2 集合上执行每个添加、更新和删除操作，以保持回滚到 V1 的选项。
全面测试服务并确认其按预期工作。
- 如果错过了任何未更新为同时在 V1 和 V2 集合上运行的值访问操作，你可能会注意到缺少数据。
- 如果缺少任何数据，请回退到步骤 1，移除 V2 集合并重复此过程。
将服务升级到新版本
- 仅对 V2 集合执行所有操作；
- 使用服务回滚无法再返回到 V1，并且需要使用反向步骤 2-4 向前滚动。
升级服务的新版本
- 移除 V1 集合。
等待日志截断。
- 默认情况下，每向可靠的集合写入（添加、更新和删除）50MB 就会执行一次。
将服务升级到新版本
- 服务代码包中不再包含 V1 数据协定。

后续步骤

若要了解如何创建向前兼容的数据约定，请参阅向前兼容的数据协定

若要了解版本控制数据协定的最佳做法，请参阅数据协定版本控制

若要了解如何实现版本容错的数据协定，请参阅版本容错的序列化回调

若要了解如何提供可跨多个版本互操作的数据结构，请参阅 IExtensibleDataObject

若要了解如何配置可靠集合，请参阅复制程序配置

通过