Azure Synapse Analytics – 工作负荷管理门户监视
本文介绍了如何监视工作负荷组资源利用率和查询活动。 有关如何配置 Azure 指标资源管理器的详细信息,请参阅使用 Azure Monitor 指标资源管理器分析指标一文。 有关如何监视系统资源使用情况的详细信息,请参阅 Azure Synapse Analytics 监视文档中的资源利用率部分。 有两种不同类别的工作负荷组指标用于监视工作负荷管理:资源分配和查询活动。 可以按工作负荷组拆分和筛选这些指标。 根据指标是系统定义的(资源类工作负荷组)还是用户定义的(由用户通过 CREATE WORKLOAD GROUP 语法创建),可以对其进行拆分和筛选。
工作负荷管理指标定义
有关工作负载管理指标的说明,请参阅 Microsoft.Synapse/workspaces/sqlPools 支持的指标中的“SQL 专用池 - 工作负载管理”条目。
监视方案和操作
下面是一系列图表配置,其中重点介绍了工作负荷管理指标在故障排除方面的用法,以及解决问题的相关操作。
工作负荷隔离利用不足
假设在以下工作负荷组和分类器配置中创建了名为 wgPriority
的工作负荷组,TheCEO membername
使用 wcCEOPriority
工作负荷分类器映射到此工作负荷组。 wgPriority
工作负荷组为其配置了 25% 的工作负荷隔离 (MIN_PERCENTAGE_RESOURCE
= 25)。 TheCEO 提交的每个查询获得了 5% 的系统资源 (REQUEST_MIN_RESOURCE_GRANT_PERCENT
= 5)。
CREATE WORKLOAD GROUP wgPriority
WITH ( MIN_PERCENTAGE_RESOURCE = 25
,CAP_PERCENTAGE_RESOURCE = 50
,REQUEST_MIN_RESOURCE_GRANT_PERCENT = 5);
CREATE WORKLOAD CLASSIFIER wcCEOPriority
WITH ( WORKLOAD_GROUP = 'wgPriority'
,MEMBERNAME = 'TheCEO');
下方的图表使用以下指标配置:
指标 1:有效的最小资源百分比(平均值聚合,blue line
)
指标 2:按系统百分比列出的工作负荷组分配(平均值聚合,purple line
)
筛选:[工作负荷组] = wgPriority
该图表显示,工作负载隔离配置为 25% 时,平均使用率仅为 10%。 在这种情况下,可将 MIN_PERCENTAGE_RESOURCE
参数值降至 10 到 15 之间,并允许系统上的其他工作负荷使用资源。
工作负荷组瓶颈
假设在以下工作负荷组和分类器配置中创建了名为 wgDataAnalyst
的工作负荷组,DataAnalyst membername
使用 wcDataAnalyst
工作负荷分类器映射到此工作负荷组。 wgDataAnalyst
工作负荷组为其配置了 6% 的工作负荷组隔离(MIN_PERCENTAGE_RESOURCE
= 6),资源限制为 9% (CAP_PERCENTAGE_RESOURCE
= 9)。 DataAnalyst 提交的每个查询获得了 3% 的系统资源 (REQUEST_MIN_RESOURCE_GRANT_PERCENT
= 3)。
CREATE WORKLOAD GROUP wgDataAnalyst
WITH ( MIN_PERCENTAGE_RESOURCE = 6
,CAP_PERCENTAGE_RESOURCE = 9
,REQUEST_MIN_RESOURCE_GRANT_PERCENT = 3);
CREATE WORKLOAD CLASSIFIER wcDataAnalyst
WITH ( WORKLOAD_GROUP = 'wgDataAnalyst'
,MEMBERNAME = 'DataAnalyst');
下方的图表使用以下指标配置:
指标 1:有效的资源百分比上限(平均值聚合,blue line
)
指标 2:按资源百分比上限列出的工作负载组分配(平均值聚合 purple line
)
指标 3:工作负荷组排队查询(总和聚合,turquoise line
)
筛选:[工作负荷组] = wgDataAnalyst
该图表显示,使用 9% 的资源上限时,工作负载组的利用率为 90% 以上(从“按最大资源百分比列出的工作负载组分配”指标可以看出)。 如“工作负载组排队查询”指标所示,查询正在稳定排队。 在这种情况下,将 CAP_PERCENTAGE_RESOURCE
值增加至 9% 以上允许更多查询并行执行。 增加 CAP_PERCENTAGE_RESOURCE
的前提条件是有足够的可用资源,并且其他工作负荷组未隔离资源。 通过检查“有效的资源百分比上限”指标来确认上限是否增加。 如果需要更高的吞吐量,另请考虑将 REQUEST_MIN_RESOURCE_GRANT_PERCENT
值增加至 3 以上。 增加 REQUEST_MIN_RESOURCE_GRANT_PERCENT
可以提高查询的运行速度。