关于优化K-Means算法的更多问题

问题描述我想写一篇题为《K-Means聚类算法的优化版本》的论文。本文在此链接中:https://fedcsis.org/proceedings/2014/pliks/258.pdf。这篇论文并不明显。我在Stackoverflow中看到@VPPMan被问到一些关于这方面问题(O

发布:2022-12-11 标签:optimizationalgorithmmachine-learningk-means


用R编写自己的KMeans算法

问题描述我正在尝试用R编写我自己的第一个KMeans算法。我在这个领域是新手,所以请不要因为我看不到明显的东西而评判我。在当前状态下,该算法取两个向量x,y,计算每个数据点到簇中心的距离,并分配从其中心到数据点距离最小的簇。当分配没有变化,因此聚类中心没有变化时,算法停止。#Sa

发布:2022-10-16 标签:algorithmrmachine-learningdata-miningk-means


如何执行K-medoid

问题描述我花了很长时间试图弄清楚如何(在纸上)执行K-medoids算法,但我不能理解如何开始和迭代。例如:我有6个点、k、c1和c2之间的距离矩阵。如果有人能教我如何在这个例子上执行K-medoid算法,我会很高兴的。如何开始和迭代?谢谢推荐答案更多细节:将K设置为所需的簇数,

发布:2022-10-16 标签:data-miningcluster-analysisk-means


从word2vec模型获取距离矩阵和特征矩阵

问题描述我已经使用gensim为一个巨大的语料库生成了word2vec模型,我需要使用k均值聚类来对词汇表进行聚类,以满足我的需要:余弦距离矩阵(字对字,因此矩阵的大小为字数x字数)要素矩阵(字对要素,因此矩阵的大小是字数x要素数(200))对于特征矩阵,我尝试使用x=Model

发布:2022-10-16 标签:pythonk-meansword2vecgensim


用序列请求的数组设置数组元素在%1维后具有不均匀形状检测到的形状是(2,)+不均匀部分

问题描述importosimportnumpyasnpfromscipy.signalimport*importcsvimportmatplotlib.pyplotaspltfromscipyimportsignalfrombrainflow.board_shimimportBo

发布:2022-10-16 标签:pythonarrayspython-3.xnumpyk-means


来自KMeans&Quot;的3D散点图图例错误找不到要放入图例中的标签的句柄

问题描述我为用于RFM分析的KMeans模型绘制了3D散点图。我使用了KMeans模型标签来表示"颜色"组。当我使用Legend()时,它弹出一个错误,"找不到带标签的句柄放入图例"frommpl_toolkits.mplot3dimportAxes3D%matplotlibno

发布:2022-10-16 标签:pythonlegendscatter3dk-means


证明k-均值总是收敛的吗?

问题描述我了解k-Means算法的步骤。然而,我不确定算法是否总是收敛?或者,观察结果是否总是可以从一个质心切换到另一个质心?推荐答案算法始终收敛(根据定义),但不一定收敛到全局最优。算法可以从质心切换到质心,但这是算法的一个参数(precision或delta)。这有时被称为"

发布:2022-10-16 标签:k-means


K均值簇中节点和质心之间的距离?

问题描述用于提取k均值群集中节点和质心之间距离的任何选项。我对一个嵌入文本的数据集进行了KMeans聚类,我想知道每个集群中哪些节点远离质心,以便我可以检查各个节点的功能是否有所不同。提前谢谢!推荐答案KMeans.transform()返回每个样本到群集中心的距离数组。impo

发布:2022-10-16 标签:scikit-learnpython-3.xeuclidean-distancek-means


KMeans表示使用Python进行集群

问题描述我有一个数据集NameSystemAAZANaNBAZBNaNBNaNCAYCAYDAZEAYEAYENaNFAZFAZFNaN使用此数据集时,我需要根据"系统&为特定"名称&Quot;重复的次数对数据集进行群集。在上面的示例中,名称A、B和D有一个子

发布:2022-10-16 标签:pythonk-meansknnhierarchical-clustering


K-Means聚类-输出聚类包含相同数量的元素,但顺序不同[Python]

问题描述我遵循thistutorial对包含单个单词的列表执行K-Means聚类。这是一个基于板球的项目,所以我选择了K=3,这样以后我就可以将这三个群集区分为[击球,保龄球,防守]。但是,编译代码后,结果3个集群中的元素都相同,但顺序不同。我试着把最初的列表弄清楚,但也不能解决

发布:2022-10-16 标签:pythondata-miningcluster-analysisk-means