Azure 机器学习设计器算法和模块参考

此参考内容提供了 Azure 机器学习设计器中可用的每种机器学习算法和模块的技术背景。

每个模块表示一组可以独立运行并可根据所需输入来执行机器学习任务的代码。 模块可能包含特定的算法,或者可能执行在机器学习中非常重要的任务,如替换缺少的值或进行统计分析。

有关选择算法的帮助,请参阅

提示

在设计器的任何管道中,可以获取有关特定模块的信息。 在模块列表中的模块上方悬停时,或是在模块的右窗格中,选择模块卡上的“了解更多”链接。

数据准备模块

功能 说明 模块
数据输入和输出 将数据从云源移动到管道中。 在运行管道时将结果或中间数据写入到 Azure 存储、SQL 数据库或 Hive,或者使用云存储空间在管道之间交换数据。 手动输入数据
导出数据
导入数据
数据转换 对数据进行的机器学习独有的操作,例如将数据规范化或装箱、维数缩减以及在各种文件格式间转换数据。 添加列
添加行
应用数学运算
应用 SQL 转换
清理缺失数据
剪切值
转换为 CSV
转换为数据集
转换为指示器值
编辑元数据
将数据分组到箱中
联接数据
规范化数据
分区和采样
删除重复的行
SMOTE
选择列转换
在数据集中选择列
拆分数据
特征选择 选择用于构建分析模型的相关有用特征的子集。 基于筛选器的特征选择
排列特征重要性
统计函数 提供与数据科学相关的各种统计方法。 汇总数据

机器学习算法

功能 说明 模块
回归 预测值。 提升决策树回归
决策林回归
快速林分位回归
线性回归
神经网络回归
泊松回归
群集 将数据分到一组。 K 均值聚类分析
分类 预测类。 从二进制(双类)或多类算法中进行选择。 多类提升决策树
多类决策林
多类逻辑回归
多类神经网络
“一对多”多类
“一对一个多类
双类平均感知器
双类提升决策树
双类决策林
双类逻辑回归
双类神经网络
双类支持向量机

用于构建和评估模型的模块

功能 说明 模块
模型训练 通过算法运行数据。 训练群集模型
训练模型
训练 Pytorch 模型
优化模型超参数
模型评分和评估 度量已训练模型的准确度。 应用转换
将数据分配到群集
交叉验证模型
评估模型
为图像模型评分
评分模型
Python 语言 编写代码并将其嵌入到模块中,以便将 Python 与管道集成。 创建 Python 模型
执行 Python 脚本
R 语言 编写代码并将其嵌入到模块中,以便将 R 与管道集成。 执行 R 脚本
文本分析 提供专用计算工具来处理结构化和非结构化文本。 将单词转换为矢量
从文本中提取 N 元语法特征
特征哈希
预处理文本
隐性 Dirichlet 分配
对 Vowpal Wabbit 模型评分
训练 Vowpal Wabbit 模型
计算机视觉 与图像数据预处理和图像识别相关的模块。 应用图像转换
转换为图像目录
初始化图像转换
拆分图像目录
DenseNet
ResNet
建议 构建推荐模型。 评估推荐器
为 SVD 推荐器评分
为 Wide and Deep 推荐器评分
训练 SVD 推荐器
训练 Wide and Deep 推荐器
异常检测 构建异常情况检测模型。 基于 PCA 的异常情况检测
训练异常情况检测模型

Web 服务

了解 Azure 机器学习设计器中的实时推理所需的 Web 服务模块

错误消息

了解在 Azure 机器学习设计器中使用模块时可能会遇到的错误消息和异常代码

后续步骤