Compartir a través de

Azure Synapse Analytics – 工作负荷管理门户监视

本文介绍了如何监视工作负荷组资源利用率和查询活动。 有关如何配置 Azure 指标资源管理器的详细信息,请参阅使用 Azure Monitor 指标资源管理器分析指标一文。 有关如何监视系统资源使用情况的详细信息,请参阅 Azure Synapse Analytics 监视文档中的资源利用率部分。 有两种不同类别的工作负荷组指标用于监视工作负荷管理:资源分配和查询活动。 可以按工作负荷组拆分和筛选这些指标。 根据指标是系统定义的(资源类工作负荷组)还是用户定义的(由用户通过 CREATE WORKLOAD GROUP 语法创建),可以对其进行拆分和筛选。

工作负荷管理指标定义

有关工作负载管理指标的说明,请参阅 Microsoft.Synapse/workspaces/sqlPools 支持的指标中的“SQL 专用池 - 工作负载管理”条目。

监视方案和操作

下面是一系列图表配置,其中重点介绍了工作负荷管理指标在故障排除方面的用法,以及解决问题的相关操作。

工作负荷隔离利用不足

假设在以下工作负荷组和分类器配置中创建了名为 wgPriority 的工作负荷组,TheCEO membername 使用 wcCEOPriority 工作负荷分类器映射到此工作负荷组。 wgPriority 工作负荷组为其配置了 25% 的工作负荷隔离 (MIN_PERCENTAGE_RESOURCE = 25)。 TheCEO 提交的每个查询获得了 5% 的系统资源 (REQUEST_MIN_RESOURCE_GRANT_PERCENT = 5)。

CREATE WORKLOAD GROUP wgPriority
WITH ( MIN_PERCENTAGE_RESOURCE = 25
      ,CAP_PERCENTAGE_RESOURCE = 50
      ,REQUEST_MIN_RESOURCE_GRANT_PERCENT = 5);

CREATE WORKLOAD CLASSIFIER wcCEOPriority
WITH ( WORKLOAD_GROUP = 'wgPriority'
      ,MEMBERNAME = 'TheCEO');

下方的图表使用以下指标配置:
指标 1:有效的最小资源百分比(平均值聚合,blue line
指标 2:按系统百分比列出的工作负荷组分配(平均值聚合,purple line
筛选:[工作负荷组] = wgPriority
显示包含两个指标和筛选器的图表的屏幕截图。 该图表显示,工作负载隔离配置为 25% 时,平均使用率仅为 10%。 在这种情况下,可将 MIN_PERCENTAGE_RESOURCE 参数值降至 10 到 15 之间,并允许系统上的其他工作负荷使用资源。

工作负荷组瓶颈

假设在以下工作负荷组和分类器配置中创建了名为 wgDataAnalyst 的工作负荷组,DataAnalyst membername 使用 wcDataAnalyst 工作负荷分类器映射到此工作负荷组。 wgDataAnalyst 工作负荷组为其配置了 6% 的工作负荷组隔离(MIN_PERCENTAGE_RESOURCE = 6),资源限制为 9% (CAP_PERCENTAGE_RESOURCE = 9)。 DataAnalyst 提交的每个查询获得了 3% 的系统资源 (REQUEST_MIN_RESOURCE_GRANT_PERCENT = 3)。

CREATE WORKLOAD GROUP wgDataAnalyst  
WITH ( MIN_PERCENTAGE_RESOURCE = 6
      ,CAP_PERCENTAGE_RESOURCE = 9
      ,REQUEST_MIN_RESOURCE_GRANT_PERCENT = 3);

CREATE WORKLOAD CLASSIFIER wcDataAnalyst
WITH ( WORKLOAD_GROUP = 'wgDataAnalyst'
      ,MEMBERNAME = 'DataAnalyst');

下方的图表使用以下指标配置:
指标 1:有效的资源百分比上限(平均值聚合,blue line
指标 2:按资源百分比上限列出的工作负载组分配(平均值聚合 purple line
指标 3:工作负荷组排队查询(总和聚合,turquoise line
筛选:[工作负荷组] = wgDataAnalyst
显示包含三个指标和筛选器的图表的屏幕截图。 该图表显示,使用 9% 的资源上限时,工作负载组的利用率为 90% 以上(从“按最大资源百分比列出的工作负载组分配”指标可以看出)。 如“工作负载组排队查询”指标所示,查询正在稳定排队。 在这种情况下,将 CAP_PERCENTAGE_RESOURCE 值增加至 9% 以上允许更多查询并行执行。 增加 CAP_PERCENTAGE_RESOURCE 的前提条件是有足够的可用资源,并且其他工作负荷组未隔离资源。 通过检查“有效的资源百分比上限”指标来确认上限是否增加。 如果需要更高的吞吐量,另请考虑将 REQUEST_MIN_RESOURCE_GRANT_PERCENT 值增加至 3 以上。 增加 REQUEST_MIN_RESOURCE_GRANT_PERCENT 可以提高查询的运行速度。

后续步骤