编码策略

编码策略定义数据的编码、压缩和索引编制方式。 此策略应用于存储的数据的所有列。 默认编码策略是根据列的数据类型应用的,某个后台进程会根据需要自动调整编码策略。

方案

我们建议保留默认策略,特殊情况除外。 修改默认列的编码策略以根据性能/COGS 权衡微调控制可能是有用的做法。 例如:

  • 应用于 string 列的默认索引编制是为字词搜索构建的。 如果你只想查询列中的特定值,并使用编码配置文件 Identifier 简化索引,则可能会降低 COGS。 有关详细信息,请参阅字符串数据类型
  • 从未查询或不需要快速搜索的字段可禁用索引编制。 可使用配置文件 BigObject 关闭索引,并在动态列或字符串列中增加最大值大小。 例如,使用此配置文件存储 hll() 函数返回的 HLL 值。

工作原理

编码策略更改不会影响已引入的数据。 只会根据新策略执行新的引入操作。 编码策略应用于表中的各个列,但可以在列级别、表级别(影响表的所有列)或数据库级别进行设置。