皇冠官网

菠菜信誉线上平台体育彩票大厅_K-Means算法

发布日期:2025-07-31 04:59    点击次数:110
菠菜信誉线上平台体育彩票大厅 一、什么是 聚类分析

聚类分析是数据挖掘中的一种攻击举止,不错匡助咱们发现数据对象中荫藏的有价值信息。聚类分析的中枢念念想是把柄相同性原则将具有较高相同度的数据对象分裂到团结类簇皇冠体育 官网,从而使得团结组中的数据点之间具有更高的相同性。

在聚类算法中,时常包括三个阶段:特征遴选和特征索求、数据对象间相同度蓄意以及把柄相同度将数据对象分组。把柄不同的聚类花式,聚类算法不错分为两大类:档次聚类算法和分裂聚类算法。

档次聚类算法试图构建一个高级次的嵌套聚类树结构,通过不同类别间的数据对象的相同度来兑现。聚类树的构建有两种类型:凝华型档次聚类(自底进取的花式构设立结构)和分裂型档次聚类(自顶向下的花式构设立结构)。

分裂聚类算法需要预先指定聚类数量和聚类中心,通过优化一些赔本函数来将数据集分红若干互不相交的簇。这种举止需要事前知谈聚类数量和聚类中心,因此在试验应用中需要严慎遴选。

二、K-Means聚类算法01 K-Means聚类算法旨趣

K-Means算法是一种典型的基于分裂的聚类算法,亦然一种无监督学习算法。K-Means算法的念念想很通俗,对给定的样本集,用欧氏距离动作揣测数据对象间相同度的目的,相同度与数据对象间的距离成反比,相同度越大,距离越小。

预先指定运转聚类数以及个运转聚类中心,按照样本之间的距离大小,把样本集分裂为个簇把柄数据对象与聚类中心之间的相同度,不休更新聚类中心的位置,不休裁减类簇的误差正常和(Sum of Squared Error,SSE) ,当SSE不再变化或想法函数拘谨时,聚类收尾,得到最终适度。

K-Means算法的中枢念念想:最初从数据纠合迅速录取k个运转聚类中心 Ci(i≤1≤k),蓄意其尾数据对象与与聚类中心Ci的欧氏距离,找出离想法数据对象最近的聚类中心Ci,并将数据对象分派到聚类中心Ci所对应的簇中。然后蓄意每个簇中数据对象的平均值动作新的聚类中心,进行下一次迭代,直到聚类中心不再变化或达到最大的迭代次数时住手。

北京时间6月20日,关于李凯尔归化的事情终于传出了好消息,根据多位权威媒体人的报道,李凯尔已经获得了中国国籍,他将会身披中国队球衣出战世界杯。虽然,李凯尔的经纪公司极力否认李凯尔已经完成归化,但是据导演我躺哪的报道,李凯尔已经取得了上海的户口,并且他还反驳李凯尔的经纪公司只是代理公司不是宇宙的中心。随后,越来越多的媒体爆出了李凯尔归化的更多细节,所以李凯尔的归化其实已经不会存在变数了,只等中国篮协的最后官宣。

空间中数据对象与聚类中心间的欧氏距离蓄意公式为:

菠菜信誉线上平台体育彩票开彩票直播

皇冠体育hg86a

欧博直营网

图片

其中,X为数据对象;Ci为第i个聚类中心;m为数据对象的维度;Xj,Cij为X和Ci的第j个属性值。

总共这个词数据集的误差正常和SSE蓄意公式为:

图片

欧博线上娱乐

其中,SSE的大小暗示聚类适度的狠恶;k为簇的个数。

02 K-Means聚类算法举止

K-Means聚类算法举止本色是EM算法(最大祈望算法(Expectation-Maximization algorithm, EM))的模子优化历程,具体举止如下:

(1)迅速遴选k个样本动作运转簇类的均值向量;

(2)将每个样本数据集分裂离它距离最近的簇;

皇冠新2

(3)把柄每个样本所属的簇,更新簇类的均值向量;

(4)重迭(2)(3)步,当达到建筑的迭代次数或簇类的均值向量不再转变时,模子构建完成,输出聚类算法适度。

03 K-Means算法迭代历程

K-Means聚类算法是一个不休迭代的历程,如图所示,原始数据集有4个簇,图中庸分别代表数据点的横纵坐标值,使用K-Means算法对数据集进行聚类,在对数据集经过两次迭代后得到最终的聚类适度,迭代历程如下图所示。

图片

(a)原始数据

图片

(b)迅速遴选运转中心

图片

(c)第一次迭代

图片

皇冠篮球90比分

(d)第二次迭代

图片

体育彩票大厅

(e)最终适度

K-Means聚类算法的裂缝

该算法相等通俗且使用无为,然则主要存在以下四个裂缝:

1. K值需要预先给定 ,属于预先常识,很厚情况下K值的测度辱骂常艰苦的,关于像蓄意一起微信用户的交游圈这么的场景就统统的没主见用K-Means进行。关于不错细则K值不会太大但不解确精准的K值的场景,不错进行迭代运算,然后找出对应的K值,这个值通常能较好地相貌有若干个簇类;

2.K-Means算法对运转录取的 聚类中心点是敏锐 的,不同的迅速种子点得到的聚类适度统统不同;

皇冠客服飞机:@seo3687

3.该算法并不得当总共的数据类型。它不成惩办非球形簇、不同尺寸和不同密度的簇;

4.易堕入局部最优解。

K-Means 聚类算法的矫正

基于萤火虫优化的加权K-Means算法,操纵萤火虫优化算法的全局搜索才调强,易拘谨的特色录取K-Means算法的运转聚类中心。

由于数据属性对聚类适度的影响进度不同,在传统欧式距离的基础上引入权重值,加大了数据的不同属性间的区分进度,摒除了数据纠合噪声点的影响。该算法很好地克服了传统K-Means算法中运转聚类中心难录取和噪声点对聚类适度的影响,教学了聚类的性能。

还有基于矫正丛林优化算法的K-Means算法,引入衰减因子动作自顺应步长加速算法聚类速率,联结算术交叉操作,矫正传统丛林优化算法易堕入局部最优解、拘谨慢的缺点,提高聚类精度和聚类准确率。

“十三五”期间,各地按既定计划完成5年“能耗双控”目标,若保持节奏,可顺利达成“双控”目标。落实效果反映目标设置合理性可操作性。

将遗传算法与K-Means算法相联结,提高K-Means算法的聚类效力与精准度。该算法最初使用隔邻排序算法对原始数据纠合的重迭数据进行清算,将去重后的数据进行归一化,蓄意数据纠合各个数据对象之间的欧氏距离,然后使用公式

图片

www.fuwci.com

求数据集的平均欧氏距离,其中,Dis(Si,Sj)为数据对象Si和Sj之间的欧氏距离,An为数据对象的数量。数据纠合的每个数据对象要是与想法点的距离在AvgDis之内,那么以为该数据对象为想法点的临近点,并统计其临近点的数量。将数据纠合各个数据对象的临近点的数量按降序摆设,取其前k个数据对象动作运转聚类中心进行K-Means聚类。然后操纵遗传算法对K-Means聚类后的适度进行清算,运转种群是由50个01字符生成的基因序列,遴选每个基因对应的特征动作K-Means 聚类算法的适度。顺应度函数公式为

图片

其中,fi为基因i的顺应度,N为数据纠合数据对象的数量,aik为基因i在聚类适度被分错的数量,l为种群中个体的数量,k为簇的数量。为了蓄意愈加便捷,需要将顺应度进行归一化:

图片

其中,fmax和fmin分别代表了种群中顺应度的最大值与最小值。把柄个体的顺应度的大小遴选轮盘对赌区域进行交叉操作和突变操作,摒除数据纠合不消的属性特征,要是达到最大迭代次数则输出新种群和最优适度,不然操纵遗传算法陆续进行迭代。

菠菜老平台集团三、追念

(1)教学K-Means算法惩办海量或多维数据集的才调。跟着大数据期间的到来,咱们所能得到的信息量呈指数式爆炸,若何将K-Means更好地用于惩办指数级数据的聚类,亦然咱们需要商议的标的。

(2)裁减K-Means算法的技艺复杂度。矫正的K-Means聚类算法有着精采的聚类效力,但这是在殉国了技艺的前提下换来的,若何能更好更快地教学聚类才调皇冠体育 官网,需要咱们作念更进一步优化。

本站仅提供存储奇迹,总共内容均由用户发布,如发现存害或侵权内容,请点击举报。