Azure 机器学习设计器机器学习算法备忘单

“Azure 机器学习算法备忘单”可帮助你从设计器为预测分析模型选择正确的算法

注意

设计器支持两种类型的组件:经典预生成组件和自定义组件。 这两种类型的组件不兼容。

经典预生成组件主要为数据处理和传统的机器学习任务(如回归和分类)提供预生成组件。 此类型的组件将继续受支持,但不会增加任何新组件。

自定义组件允许你以组件的形式提供自己的代码。 它支持跨工作区共享,以及跨 Studio、CLI 和 SDK 接口进行无缝创作。

本文适用于经典预生成组件。

Azure 机器学习有一个大型算法库,包括“分类”、“推荐系统”、“聚类分析”、“异常检测”、“回归”和“文本分析”系列。 每一类算法都可用于解决一种类型的机器学习问题。

有关详细信息,请参阅如何选择算法

下载:机器学习算法备忘单

在此下载备忘单:机器学习算法备忘单(11 x 17 英寸)

Machine Learning Algorithm Cheat Sheet: Learn how to choose a Machine Learning algorithm.

下载该机器学习算法备忘单,并将其打印为 Tabloid 大小,既方便携带又可帮助你选择算法。

如何使用机器学习算法备忘单

此算法备忘单中提供的建议近似于经验法则。 一些可以不完全照做,一些可以大胆地违反。 此备忘单旨在提供一个起点。 不要害怕在数据上进行多种算法之间的正面竞争。 每种算法的原理和生成数据的系统都需要了解,此外别无选择。

每种机器学习算法都有自己的风格或归纳偏差。 对于特定问题,有多种算法可能都合适,但会有一种算法可能比其他算法更合适。 但并非总是可以预先知道哪种是最合适的。 在这些情况下,会在备忘单中列出几种算法。 适当的策略是尝试一种算法,如果结果尚不令人满意,则尝试其他算法。

若要详细了解 Azure 机器学习设计器中的算法,请访问算法和组件参考

机器学习的种类

有三种主要类别的机器学习:监督式学习非监督式学习强化学习

监督式学习

在监督式学习中,将标记每个数据点或将其与某个类别或相关值相关联。 将图像分配为“猫”或“狗”是分类标签的一个示例。 值标签的示例是与二手车关联的销售价格。 监督式学习的目的是研究大量类似这样的标记示例,并能够对未来的数据点进行预测。 例如,识别包含正确动物的新照片或为其他二手车指定准确的销售价格。 这是一种常用且有用的机器学习类型。

非监督式学习

在非监督式学习中,数据点没有与其关联的标签。 相反,非监督式学习算法的目的是以某种方式组织数据或者说明其结构。 像 K-means 一样,非监督式学习将数据分组到群集中,或者找到不同的方法来查看复杂数据,使其看起来更简单。

强化学习

在强化学习中,算法需选择响应每个数据点的操作。 它是机器人学中的常见方法,在此技术中,一个时间点的传感器读数集是数据点,算法必须选择机器人的下一个动作。 它也是物联网应用程序的理想选择。 学习算法还会在短时间后收到奖励信号,指示决策的优秀程度。 基于该信号,该算法会修改其策略以获得最高奖励。

后续步骤