当我们说我们正在评估WEKA frmework中的集群时,我们的意思是什么?聚类是一种无监督的对象分组方法.当我们说要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这意味着什么?
谢谢
阿布舍克
解决方法
正如在
this页面上所写:
评估
Weka评估聚类的方式取决于您选择的聚类模式.有四种不同的群集模式可用(作为群集模式面板中的按钮):
>使用训练集(默认).生成聚类之后,Weka根据聚类表示将训练实例分类为聚类,并计算落入每个聚类的实例百分比.例如,由k-means产生的上述聚类在聚类0中显示43%(6个实例),在聚类1中显示57%(8个实例).>在提供的测试集或百分比分割中,如果群集表示是概率性的(例如,对于EM),Weka可以在单独的测试数据上评估群集.>类到集群评估.在这种模式下,Weka首先忽略class属性并生成聚类.然后在测试阶段,它根据每个集群中类属性的多数值为集群分配类.然后,它根据此分配计算分类错误,并显示相应的混淆矩阵. k-means的一个例子如下所示.