发布网友 发布时间:2022-04-25 01:09
共1个回答
热心网友 时间:2022-04-10 20:09
聚类分析是无监督分类,就是只有自变量(指标)数据,没有(表示类别的)因变量数据,就可以根据指标数据的距离或相似性进行归类,而且归为多少类也是不确定的,取决于数据本身和分类效果的度量指标。常见的聚类分析算法有层次聚类,K均值聚类,高斯混合聚类,还有基于密度的DBSCAN聚类。
判别分析是有监督分类,就是既有自变量(指标)数据,又有(表示类别的)因变量数据,根据已知类别的样本所提供的信息,总结出分类的规律性,并建立好判别公式和判别准则,这样有了新样本,就能据此判断其所属类别。除了通常的距离判别(相当于KNN),贝叶斯判别(朴素贝叶斯),Fisher判别,其它机器学习中的分类算法,比如决策树,支持向量机,神经网络等也都是判别分析算法。