监视托管虚拟网络内的集成运行时
适用于:Azure 数据工厂 Azure Synapse Analytics
可以使用 Azure 数据工厂托管的虚拟网络将数据源安全地连接到数据工厂服务管理的虚拟网络。 通过使用此功能,可以为数据集成和业务流程过程建立专用的隔离环境。
使用托管虚拟网络时,可将数据工厂中的数据集成和业务流程功能与 Azure 虚拟网络的安全性和灵活性相结合。 它使你能够构建可靠、可缩放且安全的数据集成管道,以无缝连接到网络资源,无论这些资源在本地还是在云中。
托管计算的一个常见问题是缺乏对性能和运行状况的可见性,尤其是在托管虚拟网络环境中。 如果不进行适当的监视,识别和解决问题将变得很困难,并且可能会导致潜在的延迟、错误和性能下降。
通过在数据工厂中使用增强型监视,可以深入了解数据集成过程。 这些见解可提高效率、改善资源利用率并增强整体性能。 通过主动监视和及时警报,可以解决问题、优化工作流,并确保数据集成管道在托管虚拟网络环境中顺利执行。
新指标
引入新指标可增强托管虚拟网络环境中的可见性和监视功能。
Azure 数据工厂提供三种不同类型的计算池:
- 适用于复制活动的计算
- 适用于管道活动的计算,例如查找
- 适用于外部活动的计算,例如 Azure Databricks 笔记本
这些计算池提供了灵活性和可伸缩性,可适应不同的工作负载并以最佳方式分配资源。 每个都计算池经过定制,可处理特定的活动执行要求。
为了帮助确保跨所有计算池进行一致和全面的监视,我们实施了相同的监视指标集:
- 容量使用量
- 可用容量百分比
- 等待队列长度
无论你使用的是哪种类型的计算池,都可以访问和分析一组标准化的指标,以便深入了解其数据集成活动的性能和运行状况。
注意
仅当在托管虚拟网络的集成运行时中启用生存时间 (TTL) 时,这些指标才有效。
指标 | 计价单位 | 说明 |
---|---|---|
MVNet 集成运行时的副本容量利用率 | 百分比 | 1 分钟窗口内托管虚拟网络集成运行时中 TTL 复制活动数据集成单元 (DIU) 利用率的最大百分比。 |
MVNet 集成运行时的副本可用容量百分比 | 百分比 | 1 分钟窗口内托管虚拟网络集成运行时中 TTL 复制活动可用 DIU 的最大百分比。 |
MVNet 集成运行时的副本等待队列长度 | Count | 1 分钟窗口内托管虚拟网络集成运行时中 TTL 复制活动的等待队列长度。 |
MVNet 集成运行时的管道容量利用率 | 百分比 | 1 分钟窗口内托管虚拟网络集成运行时中管道活动 DIU 利用率的最大百分比。 |
MVNet 集成运行时的管道可用容量百分比 | 百分比 | 1 分钟窗口内托管虚拟网络集成运行时中管道活动可用 DIU 的最大百分比。 |
MVNet 集成运行时的管道等待队列长度 | Count | 1 分钟窗口内托管虚拟网络集成运行时中管道活动的等待队列长度。 |
MVNet 集成运行时的外部容量利用率 | 百分比 | 1 分钟窗口内托管虚拟网络集成运行时中外部活动 DIU 利用率的最大百分比。 |
MVNet 集成运行时的外部可用容量百分比 | 百分比 | 1 分钟窗口内托管虚拟网络集成运行时中外部活动可用 DIU 的最大百分比。 |
MVNet 集成运行时的外部等待队列长度 | Count | 1 分钟窗口内托管虚拟网络集成运行时中外部活动的等待队列长度。 |
有关这些指标的详细信息,请参阅 Microsoft.DataFactory/factories 支持的指标。
使用指标进行性能优化
借助这些指标,可以无缝跟踪和评估托管虚拟网络中集成运行时的性能和可靠性。 还可以通过优化计算设置和工作流来发现持续改进的潜在领域,以最大限度地提高效率。
为了更清楚地了解这些指标的实际应用,下面提供了一些示例方案。
已平衡
如果发现容量利用率低于 100%,并且可用容量百分比较高,则表明你预留的计算资源正在得到有效利用。
如果等待队列长度一直保持较低水平或偶尔出现短时间峰值,建议将其他活动排入队列,直到容量利用率达到 100%。 此方法有助于确保资源得到最佳利用,并帮助保持工作流的流畅性,同时将延迟降到最低。
性能优先
如果发现容量利用率一直较低,而且等待队列长度也一直较低,或者偶尔出现短时间峰值,则表明你预留的计算资源高于活动的实际需求。
在这种情况下,无论可用容量百分比是高还是低,都建议减少分配的计算资源以降低成本。 通过调整计算大小以满足工作负载需求,可以在不影响运营效率的情况下优化资源利用率并节省成本。
成本优先
如果发现所有指标(包括容量利用率、可用容量百分比和等待队列长度)都很高,则表明你预留的计算资源可能无法满足活动需求。
在这种情况下,建议增加分配的计算资源以缩短队列时间。 添加更多计算容量有助于确保活动有足够的资源高效运行,从而最大限度地减少拥挤队列导致的任何延迟。
间歇性活动执行
如果你注意到可用容量百分比在特定时间段内在低值和高值之间波动,这可能是由于活动在间歇性地执行,其中你配置的生存时间 (TTL) 周期短于活动之间的间隔。 这会对工作流的性能产生重大影响。 若要解决此问题,有两种可能的解决方案。 首先,可以将更多活动排队,以保持一致的工作负载并更有效地利用可用的计算资源。 通过持续占用计算资源,可以避免预热时间并实现更好的性能。 或者,可以考虑扩大 TTL 时长,以匹配活动之间的间隔。 这可确保计算资源在较长时间内保持可用状态,从而减少预热期的频率并优化成本效益。
通过实施其中任一解决方案,可以增强工作流的性能,最大程度地降低成本影响,并确保更顺利地执行间歇性活动。
相关内容
继续阅读以下文章,以了解托管虚拟网络和托管专用终结点:Azure 数据工厂托管虚拟网络。