组件：将数据分配到群集

本文介绍如何在 Azure 机器学习设计器中使用“将数据分配到群集”组件。该组件通过使用“K-Means 群集”算法训练的聚类分析模型来生成预测。

“将数据分配到群集”组件会返回一个数据集，其中包含每个新数据点可能的分配。

如何使用“将数据分配到群集”

在 Azure 机器学习设计器中，找到先前训练的聚类分析模型。可以使用以下方法之一创建和训练聚类分析模型：
- 使用 K-Means 群集组件配置 K-Means 群集算法，并使用数据集和“训练聚类分析模型”组件训练模型（文本）。
- 还可以从工作区中的“保存的模型” 组添加现有的已训练聚类分析模型。
将训练的模型附加到“将数据分配到群集”的左侧输入端口。
将新的数据集作为输入附加。

在此数据集中，标签为可选。通常情况下，聚类分析是一种无人监督的学习方法。你不会提前知道这些类别。但是，输入列必须与在训练聚类分析模型时使用的列相同，否则会发生错误。

提示

若要减少从群集预测写入设计器的列数，请使用选择数据集中的列，然后选择列的子集。
如果希望结果包含完整的输入数据集（包括显示结果的列（群集分配）），请让“选中以便进行追加，或者取消选中以便只获取结果”复选框保持选中状态。

如果清除此复选框，则仅返回结果。将预测作为 Web 服务的一部分创建时，可以使用此选项。
提交管道。

结果

若要查看数据集中的值，请右键单击组件，然后选择“可视化”。或者选择该组件并切换到右侧面板中的“输出”选项卡，单击“端口输出”中的直方图图标以直观显示结果。

Last updated on 2024-08-29