Azure Synapse Analytics 中专用 SQL 池(以前为 SQL DW)的表数据类型

本文中包含有关在专用 SQL 池中定义表数据类型的建议。

支持的数据类型

专用 SQL 池(前 SQL DW)支持最常用的数据类型。 有关受支持数据类型的列表,请参阅 CREATE TABLE 语句中的数据类型

最大限度地减小行长度

最大限度地减小数据类型大小可以缩短行长度,从而获得更好的查询性能。 使用适合数据的最小数据类型。

  • 避免使用较大默认长度定义字符列。 例如,如果最长的值是 25 个字符,则将列定义为 VARCHAR(25)。
  • 仅需要 VARCHAR 时请避免使用 NVARCHAR
  • 尽可能使用 NVARCHAR(4000) 或 VARCHAR(8000),而非 NVARCHAR(MAX) 或 VARCHAR(MAX)。

如果使用 PolyBase 外部表加载表,则表行的定义长度不能超过 1 MB。 当数据长度可变的行超过 1 MB 时,可使用 BCP 而不是 PolyBase 加载行。

识别不支持的数据类型

如果要从另一个 SQL 数据库迁移数据库,可能会发现专用 SQL 池中不支持的数据类型。 使用以下查询发现现有 SQL 架构中不支持的数据类型:

SELECT  t.[name], c.[name], c.[system_type_id], c.[user_type_id], y.[is_user_defined], y.[name]
FROM sys.tables  t
JOIN sys.columns c on t.[object_id]    = c.[object_id]
JOIN sys.types   y on c.[user_type_id] = y.[user_type_id]
WHERE y.[name] IN ('geography','geometry','hierarchyid','image','text','ntext','sql_variant','xml')
 AND  y.[is_user_defined] = 1;

对不受支持的数据类型的解决方法

以下列表显示了专用 SQL 池(前 SQL DW)不支持的数据类型,并为不支持的数据类型提供有用的替代方法。

不支持的数据类型 解决方法
几何学 varbinary
地理 varbinary
hierarchyid nvarchar(4000)
图像 varbinary
text varchar
ntext nvarchar
sql_variant 将列拆分成多个强类型化列。
桌子 转换成暂时表。
timestamp 重写代码来使用 datetime2CURRENT_TIMESTAMP 函数。 仅支持常量作为默认值,因此current_timestamp不能定义为默认约束。 如果需要从时间戳类型列迁移行版本值,请使用 BINARY(8) 或 VARBINARY(8) 来表示 NOT NULL 或 NULL 的行版本值。
xml varchar
用户定义的类型 尽可能转换回原生数据类型。
默认值 默认值仅支持文本和常量。

后续步骤

有关开发表的详细信息,请参阅 表概述