为关系建模
本文讨论可帮助设计 Azure 表存储解决方案的建模流程。
构建域模型是复杂系统设计中的一个关键步骤。 通常情况下,使用建模流程确定实体及实体之间的关系,并以此作为了解业务域及获取系统设计信息的方式。 本部分重点介绍如何将域模型中找到的一些常见关系类型转换为表服务的设计。 从逻辑数据模型映射到基于 NoSQL 的物理数据模型的过程与在设计关系数据库时使用的过程不同。 关系数据库设计通常采用数据规范化过程(针对最大限度减少冗余进行优化)和声明性查询功能(提取了数据库工作原理的实现方式)。
一对多关系
业务域对象之间的一对多关系频繁发生:例如,一个部门拥有许多员工。 有多种方法可在表服务中实现一对多关系,每种方法都有与特定方案相关的利弊。
请考虑这样一个示例:一个具有数万个部门和员工实体的大型跨国公司,其中每个部门都有许多员工,每个员工都与一个特定部门相关联。 一种方法是存储不同的部门和员工实体,如下所示:
此示例展示了类型之间基于 PartitionKey 值的隐式一对多关系。 每个部门可以有许多员工。
此示例还显示了同一个分区中的部门实体及其相关的员工实体。 可以选择对不同实体类型使用不同分区、表或甚至不同存储帐户。
另一种方法是使数据非规范化,并只存储具有非规范化部门数据的员工实体,如下面的示例所示。 在此特定方案中,如果要求能够更改部门经理的详细信息,则此非规范化方法可能不是最佳方法,因为要这样做,需要更新部门中的每个员工。
有关详细信息,请参阅本指南后面的 反规范化模式 。
下表总结了上述每种方法对于存储具有一对多关系的员工和部门的优缺点。 还应考虑希望执行各种操作的频率:如果设计中包含的代价高昂的操作很少发生,则这可能是可以接受的。
方法 | 优点 | 缺点 |
---|---|---|
不同的实体类型、同一分区、同一个表 |
|
|
不同的实体类型、不同的分区或表或存储帐户 |
|
|
非规范化为单个实体类型 |
|
|
*有关详细信息,请参阅实体组事务
如何在这些选项中进行选择,以及哪些优点和缺点最重要,取决于特定应用程序方案。 例如,修改部门实体的频率;所有员工查询是否都需要附加部门信息;有多接近对分区或存储帐户的伸缩性限制?
一对一关系
域模型可能包括实体之间的一对一关系。 如果需要在表服务中实现一对一关系,还必须选择在需要检索两个相关的实体时如何链接这两个实体。 此链接可为隐式或显式,前者基于键值中的约定,后者在每个实体中按 PartitionKey and RowKey 值的形式存储指向其相关实体的链接。 有关是否应将相关实体存储在同一个分区中的讨论,请参阅一对多关系这部分。
还有可能引导在表服务中实现一对一关系的实现注意事项:
- 处理大型实体,详细信息请参阅大实体模式。
- 实施访问控制(有关详细信息),请参阅“使用共享访问签名控制访问权限”。
在客户端中联接
尽管可通过多种方式在表服务中为关系建模,但不能忘记使用表服务的两个主要原因是伸缩性和性能。 如果发现要建模的多个关系损害解决方案的性能和可伸缩性,则应问自己是否有必要在表设计中构建所有数据关系。 如果让客户端应用程序执行任何必要的联接,可能能够简化设计并改进解决方案的伸缩性和性能。
例如,如果小型表包含不经常更改的数据,则可以检索一次此类数据并将其缓存到客户端。 这可以避免为检索相同数据而进行的重复往返操作。 在本指南中我们已查看过的示例中,小型组织中的部门集可能很小并且不经常更改,使它成为合适的数据候选项,客户端应用程序可以下载一次该数据并将其缓存为查找数据。
继承关系
如果客户端应用程序使用一组构成继承关系的的类来表示业务实体,则可以轻松地在表服务中持久保存这些实体。 例如,客户端应用程序中可能定义了以下一组类,其中 Person 是一个抽象类。
可以使用单个 Person 表通过如下代码中的实体在表服务中持久保存两个具体类的实例:
若要深入了解如何在客户端代码中处理同张表中的多个实体类型,请参阅本指南后面的处理异类实体类型部分。 此部分提供了如何在客户端代码中识别实体类型的示例。