Azure Service Fabric 中的 Reliable Collection 对象序列化

Reliable Collections 通过复制和保留项目,确保这些项目在机器故障和电力中断时能够持久。 若要复制和保留项目,Reliable Collections 需要对其进行串行化。

Reliable Collections 从可靠状态管理器获取与给定类型对应的串行化程序。 可靠状态管理器包含内置序列化程序,允许针对给定类型注册自定义串行化程序。

内置串行化程序

可靠状态管理器包含针对一些常见类型的内置串行化程序,以便在默认情况下对其进行高效串行化。 对于其他类型,可靠状态管理器回退为使用 DataContractSerializer。 内置串行化程序更高效,因为它们知道其类型无法更改,且它们无需包含类型名称等有关类型的信息。

可靠状态管理器拥有针对以下类型的内置串行化程序:

  • Guid
  • bool
  • 字节
  • sbyte
  • byte[]
  • char
  • string
  • Decimal
  • Double
  • FLOAT
  • int
  • uint
  • long
  • ulong
  • short
  • ushort

自定义序列化

自定义串行化程序通常用于提高性能,或用于在网络传输时以及在磁盘上加密数据。 自定义串行化程序通常比通用序列化程序更高效,因为它们不需要串行化有关类型的信息。

IReliableStateManager.TryAddStateSerializer<T> 用于为给定类型 T 注册自定义序列化程序。此注册应在 StatefulServiceBase 构造内发生,以确保在开始恢复前,所有可靠集合都有权访问相关序列化程序来读取其保留的数据。

public StatefulBackendService(StatefulServiceContext context)
  : base(context)
  {
    if (!this.StateManager.TryAddStateSerializer(new OrderKeySerializer()))
    {
      throw new InvalidOperationException("Failed to set OrderKey custom serializer");
    }
  }

注意

自定义串行化程序优先于内置串行化程序。 例如,如果为 int 注册了自定义串行化程序,则会使用它来串行化整数,而不使用 int 的内置串行化程序。

如何实现自定义串行化程序

自定义序列化程序需要实现 IStateSerializer<T> 接口。

注意

IStateSerializer<T> 包含读取和写入重载,可接受称为基值的附加 T。 此 API 用于差分序列化。 当前未公开差分序列化功能。 因此,在公开和启用差分序列化前,不会调用这两个重载。

以下是名为 OrderKey 的自定义类型示例,它包含四个属性

public class OrderKey : IComparable<OrderKey>, IEquatable<OrderKey>
{
    public byte Warehouse { get; set; }

    public short District { get; set; }

    public int Customer { get; set; }

    public long Order { get; set; }

    #region Object Overrides for GetHashCode, CompareTo and Equals
    #endregion
}

下面是 IStateSerializer<OrderKey> 的一个实现示例。 请注意,接受 baseValue 的读取和写入重载调用各自的重载来实现向前兼容。

public class OrderKeySerializer : IStateSerializer<OrderKey>
{
  OrderKey IStateSerializer<OrderKey>.Read(BinaryReader reader)
  {
      var value = new OrderKey();
      value.Warehouse = reader.ReadByte();
      value.District = reader.ReadInt16();
      value.Customer = reader.ReadInt32();
      value.Order = reader.ReadInt64();

      return value;
  }

  void IStateSerializer<OrderKey>.Write(OrderKey value, BinaryWriter writer)
  {
      writer.Write(value.Warehouse);
      writer.Write(value.District);
      writer.Write(value.Customer);
      writer.Write(value.Order);
  }

  // Read overload for differential de-serialization
  OrderKey IStateSerializer<OrderKey>.Read(OrderKey baseValue, BinaryReader reader)
  {
      return ((IStateSerializer<OrderKey>)this).Read(reader);
  }

  // Write overload for differential serialization
  void IStateSerializer<OrderKey>.Write(OrderKey baseValue, OrderKey newValue, BinaryWriter writer)
  {
      ((IStateSerializer<OrderKey>)this).Write(newValue, writer);
  }
}

可升级性

应用程序滚动升级过程中,升级应用于部分节点,一次一个升级域。 在此过程中,一些升级域将位于较新版本的应用程序上,而一些升级域将位于较旧版本的应用程序上。 在滚动更新期间,新版本的应用程序必须能够读取旧版本的数据,并且旧版本的应用程序必须能够读取新版本的数据。 如果数据格式不向前和向后兼容,则升级可能会失败(或更糟),甚至可能丢失数据。

如果使用的是内置序列化程序,则无需担心兼容性问题。 但是,如果使用自定义串行化程序或 DataContractSerializer,数据必须能够无限向后和向前兼容。 换而言之,串行化程序的每个版本都需要能够序列化和反序列化类型的任何版本。

数据协定用户应遵循用于添加、删除和更改字段的定义完善的版本控制规则。 数据协定还支持处理未知字段、挂接到序列化和反序列化进程以及处理类继承。 有关详细信息,请参阅使用数据协定

自定义串行化程序用户应遵循其使用的串行化程序的指导原则,以确保它向前和向后兼容。 支持所有版本的常用方法是在开头添加大小信息,并且仅添加可选属性。 这样一来,每个版本都可以读取尽可能多的数据并跳过数据流的其余部分。

后续步骤