Azure HDInsight 监视数据参考
本文包含此服务的所有监视参考信息。
请参阅监视 HDInsight,详细了解可为 Azure HDInsight 收集的数据以及如何使用这些数据。
指标
本部分列出了为此服务自动收集的所有平台指标。 这些指标也是 Azure Monitor 中支持的所有平台指标的全局列表的一部分。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
Microsoft.HDInsight/clusters 支持的指标
下表列出了可用于 Microsoft.HDInsight/clusters 资源类型的指标。
表标题
- 指标 - 在 Azure 门户中显示的指标显示名称。
- Rest API 中的名称 - 在 REST API 中引用的指标名称。
- 单位 - 度量单位。
- 聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
- 维度 - 适用于指标的维度。
- 时间粒度 - 对指标采样的间隔。 例如,
PT1M
表示该指标每分钟采样一次,PT30M
表示每 30 分钟一次,PT1H
表示每小时一次,以此类推。 - DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。 要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置。
类别 | 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|---|
可用性 | 已分类的网关请求数 按类别(1xx/2xx/3xx/4xx/5xx)统计的网关请求数 |
CategorizedGatewayRequests |
计数 | 计数、总计 | HttpStatus |
PT1M、PT1H、P1D | 是 |
可用性 | 网关请求数 网关请求数 |
GatewayRequests |
计数 | 计数、总计 | HttpStatus |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理使用者 RequestThroughput 向 Kafka REST 代理发出的使用者请求数 |
KafkaRestProxy.ConsumerRequest.m1_delta |
每秒计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理使用者未成功的请求数 使用者请求异常数 |
KafkaRestProxy.ConsumerRequestFail.m1_delta |
每秒计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理使用者 RequestLatency 通过 Kafka REST 代理的使用者请求中的消息延迟 |
KafkaRestProxy.ConsumerRequestTime.p95 |
毫秒 | 平均值 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理使用者请求积压工作 使用者 REST 代理队列长度 |
KafkaRestProxy.ConsumerRequestWaitingInQueueTime.p95 |
毫秒 | 平均值 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理制造者 MessageThroughput 通过 Kafka REST 代理的制造者消息数 |
KafkaRestProxy.MessagesIn.m1_delta |
每秒计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理使用者 MessageThroughput 通过 Kafka REST 代理的使用者消息数 |
KafkaRestProxy.MessagesOut.m1_delta |
每秒计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理 ConcurrentConnections 通过 Kafka REST 代理的并发连接数 |
KafkaRestProxy.OpenConnections |
计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理制造者 RequestThroughput 向 Kafka REST 代理发出的制造者请求数 |
KafkaRestProxy.ProducerRequest.m1_delta |
每秒计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理生成者未成功的请求数 生成者请求异常数 |
KafkaRestProxy.ProducerRequestFail.m1_delta |
每秒计数 | 总计 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理制造者 RequestLatency 通过 Kafka REST 代理的生成者请求中的消息延迟 |
KafkaRestProxy.ProducerRequestTime.p95 |
毫秒 | 平均值 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | REST 代理生成者请求积压工作 生成者 REST 代理队列长度 |
KafkaRestProxy.ProducerRequestWaitingInQueueTime.p95 |
毫秒 | 平均值 | Machine 、Topic |
PT1M、PT1H、P1D | 是 |
可用性 | 活动辅助角色数目 活动辅助角色数目 |
NumActiveWorkers |
计数 | 平均值、最大值、最小值 | MetricName |
PT1M、PT1H、P1D | 是 |
可用性 | 挂起的 CPU YARN 中挂起的 CPU 请求数 |
PendingCPU |
计数 | 平均值、最大值、最小值 | <无> | PT1M、PT1H、P1D | 是 |
可用性 | 挂起的内存 YARN 中挂起的内存请求数 |
PendingMemory |
计数 | 平均值、最大值、最小值 | <无> | PT1M、PT1H、P1D | 是 |
指标维度
有关指标维度定义的信息,请参阅多维指标。
此服务具有以下与其指标关联的维度。
Microsoft.HDInsight/clusters 表的维度包括:
- HttpStatus
- 计算机
- 主题
- MetricName
资源日志
本部分列出了可为此服务收集的资源日志类型。 本部分拉取自 Azure Monitor 支持的所有资源日志类别类型列表。
HDInsight 不使用 Azure Monitor 资源日志或诊断设置。 日志是通过其他方法收集的,包括使用 Log Analytics 代理。
Azure Monitor 日志表
本部分涉及与此服务相关的所有 Azure Monitor 日志表,Log Analytics 可使用 Kusto 查询来查询这些表。
此服务使用列出的表来存储资源日志数据。 以下列与此相关。
HDInsight 群集
Microsoft.HDInsight/Clusters
可用日志和指标因 HDInsight 群集类型而异。
- HDInsightAmbariClusterAlerts
- HDInsightAmbariSystemMetrics
- HDInsightGatewayAuditLogs
- HDInsightHBaseLogs
- HDInsightHBaseMetrics
- HDInsightHadoopAndYarnLogs
- HDInsightHadoopAndYarnMetrics
- HDInsightHiveAndLLAPLogs
- HDInsightHiveAndLLAPMetrics
- HDInsightHiveQueryAppStats
- HDInsightHiveTezAppStats
- HDInsightJupyterNotebookEvents
- HDInsightKafkaLogs
- HDInsightKafkaMetrics
- HDInsightKafkaServerLog
- HDInsightOozieLogs
- HDInsightRangerAuditLogs
- HDInsightSecurityLogs
- HDInsightSparkApplicationEvents
- HDInsightSparkBlockManagerEvents
- HDInsightSparkEnvironmentEvents
- HDInsightSparkExecutorEvents
- HDInsightSparkExtraEvents
- HDInsightSparkJobEvents
- HDInsightSparkLogs
- HDInsightSparkSQLExecutionEvents
- HDInsightSparkStageEvents
- HDInsightSparkStageTaskAccumulables
- HDInsightSparkTaskEvents
- HDInsightStormLogs
- HDInsightStormMetrics
- HDInsightStormTopologyMetrics
日志表映射
新的 Azure Monitor 集成在 Log Analytics 工作区中实施新表。 下表显示了从经典 Azure Monitor 集成到新集成的日志表映射。
“新表”列显示新表的名称。 “说明”行描述在此表中提供的日志/指标的类型。 “经典表”列是经典 Azure Monitor 集成中的所有表的列表,其数据现在显示在新表中。
注意
某些表是全新的,而不是基于以前的表。
常规工作负载表
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightAmbariSystemMetrics | 从 Ambari 收集的系统指标。 指标现在来自群集中的每个节点(边缘节点除外),而不只是两个头节点。 每个指标现在都是一列,并且每个指标对每个记录报告一次。 | metrics_cpu_nice_cl、metrics_cpu_system_cl、metrics_cpu_user_cl、metrics_memory_cache_CL、metrics_memory_swap_CL、metrics_memory_total_CLmetrics_memory_buffer_CL、metrics_load_1min_CL、metrics_load_cpu_CL、metrics_load_nodes_CL、metrics_load_procs_CL、metrics_network_in_CL、metrics_network_out_CL |
HDInsightAmbariClusterAlerts | 来自群集中每个节点(边缘节点除外)的 Ambari 群集警报。 每个警报都是此表中的一个记录。 | metrics_cluster_alerts_CL |
HDInsightSecurityLogs | 来自 Ambari 审核和身份验证日志的记录。 | log_ambari_audit_CL, log_auth_CL |
HDInsightRangerAuditLogs | 来自 ESP 群集的 Ranger 审核日志的所有记录。 | ranger_audit_logs_CL |
HDInsightGatewayAuditLogs_CL | 网关节点审核信息。 与经典表的格式相同,仍位于“自定义日志”部分中。 | log_gateway_Audit_CL |
Spark 工作负载
注意
Spark 应用程序相关表已替换为 11 个新 Spark 表,这些表提供有关 Spark 工作负载的更多深入信息。
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightSparkLogs | 与 Spark 及其相关组件(Livy 和 Jupyter)相关的所有日志。 | log_livy_CL、log_jupyter_CL、log_spark_CL、log_sparkappsexecutors_CL、log_sparkappsdrivers_CL |
HDInsightSparkApplicationEvents | Spark 应用程序的事件信息,包括提交和完成时间、应用 ID 和 AppName。 可用于跟踪应用程序的启动和完成时间。 | |
HDInsightSparkBlockManagerEvents | 与 Spark 的块管理器相关的事件信息。 包括执行程序内存使用情况等信息。 | |
HDInsightSparkEnvironmentEvents | 与应用程序执行环境相关的事件信息,包括 Spark 部署模式、主设备以及有关执行程序的信息。 | |
HDInsightSparkExecutorEvents | 有关应用程序的 Spark 执行程序使用情况的事件信息。 | |
HDInsightSparkExtraEvents | 不符合任何其他 Spark 表的事件信息。 | |
HDInsightSparkJobEvents | 有关 Spark 作业的信息,其中包括其开始和结束时间、结果和关联阶段。 | |
HDInsightSparkSqlExecutionEvents | 有关 Spark SQL 查询的事件信息,包括其计划信息和说明以及开始和结束时间。 | |
HDInsightSparkStageEvents | 各个 Spark 阶段的事件信息,包括其开始时间和完成时间、失败状态和详细执行信息。 | |
HDInsightSparkStageTaskAccumulables | 各个阶段和任务的性能指标。 | |
HDInsightTaskEvents | 各个 Spark 任务的事件信息,包括开始和完成时间、关联阶段、执行状态和任务类型。 | |
HDInsightJupyterNotebookEvents | Jupyter Notebook 的事件信息。 |
Hadoop/YARN 工作负载
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightHadoopAndYarnMetrics | 来自 Hadoop 和 YARN 框架的 JMX 指标。 包含与以前的自定义日志表相同的 JMX 指标,以及更重要的指标:时间线服务器、节点管理器和作业历史记录服务器。 每条记录包含一个指标。 | metrics_resourcemanager_clustermetrics_CL、metrics_resourcemanager_jvm_CL、metrics_resourcemanager_queue_root_CL、metrics_resourcemanager_queue_root_joblauncher_CL、metrics_resourcemanager_queue_root_default_CL、metrics_resourcemanager_queue_root_thriftsvr_CL |
HDInsightHadoopAndYarnLogs | 从 Hadoop 和 YARN 框架生成的所有日志。 | log_mrjobsummary_CL、log_resourcemanager_CL、log_timelineserver_CL、log_nodemanager_CL |
Hive/LLAP 工作负载
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightHiveAndLLAPMetrics | 来自 Hive 和 LLAP 框架的 JMX 指标。 包含与以前的自定义日志表相同的所有 JMX 指标,每条记录包含一个指标。 | llap_metrics_hiveserver2_CL、llap_metrics_hs2_metrics_subsystemllap_metrics_jvm_CL、llap_metrics_llap_daemon_info_CL、llap_metrics_buddy_allocator_info_CL、llap_metrics_deamon_jvm_CL、llap_metrics_io_CL、llap_metrics_executor_metrics_CL、llap_metrics_metricssystem_stats_CL、llap_metrics_cache_CL |
HDInsightHiveAndLLAPLogs | 从 Hive、LLAP 及其相关组件(WebHCat 和 Zeppelin)生成的日志。 | log_hivemetastore_CL log_hiveserver2_CL、log_hiveserve2interactive_CL、log_webhcat_CL、log_zeppelin_zeppelin_CL |
Kafka 工作负载
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightKafkaMetrics | 来自 Kafka 的 JMX 指标。 包含与旧的自定义日志表相同的所有 JMX 指标,以及其他重要指标。 每条记录包含一个指标。 | metrics_kafka_CL |
HDInsightKafkaLogs | 从 Kafka 中转站生成的所有日志。 | log_kafkaserver_CL、log_kafkacontroller_CL |
HBase 工作负载
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightHBaseMetrics | 来自 HBase 的 JMX 指标。 包含与以前的表相同的所有 JMX 指标。 与以前的表不同,每行包含一个指标。 | metrics_regionserver_CL、metrics_regionserver_wal_CL、metrics_regionserver_ipc_CL、metrics_regionserver_os_CL、metrics_regionserver_replication_CL、metrics_restserver_CL、metrics_restserver_jvm_CL、metrics_hmaster_assignmentmanager_CL、metrics_hmaster_ipc_CL、metrics_hmaser_os_CL、metrics_hmaster_balancer_CL、metrics_hmaster_jvm_CL、metrics_hmaster_CL、metrics_hmaster_fs_CL |
HDInsightHBaseLogs | 来自 HBase 及其相关组件(Phoenix 和 HDFS)的日志。 | log_regionserver_CL、log_restserver_CL、log_phoenixserver_CL、log_hmaster_CL、log_hdfsnamenode_CL、log_garbage_collector_CL |
Oozie 工作负载
新建表 | 说明 | 经典表 |
---|---|---|
HDInsightOozieLogs | 从 Oozie 框架生成的所有日志。 | Log_oozie_CL |
活动日志
链接表列出了可在此服务的活动日志中记录的操作。 这是活动日志中所有可能的资源提供程序操作的子集。
有关活动日志条目架构的详细信息,请参阅活动日志架构。
相关内容
- 有关如何监视 HDInsight 的说明,请参阅监视 HDInsight。
- 请参阅使用 Azure Monitor 监视 Azure 资源,详细了解如何监视 Azure 资源。