关于优化K-Means算法的更多问题
问题描述我想写一篇题为《K-Means聚类算法的优化版本》的论文。本文在此链接中:https://fedcsis.org/proceedings/2014/pliks/258.pdf。这篇论文并不明显。我在Stackoverflow中看到@VPPMan被问到一些关于这方面问题(O
发布:2022-12-11 标签:optimizationalgorithmmachine-learningk-means
用R编写自己的KMeans算法
问题描述我正在尝试用R编写我自己的第一个KMeans算法。我在这个领域是新手,所以请不要因为我看不到明显的东西而评判我。在当前状态下,该算法取两个向量x,y,计算每个数据点到簇中心的距离,并分配从其中心到数据点距离最小的簇。当分配没有变化,因此聚类中心没有变化时,算法停止。#Sa
发布:2022-10-16 标签:algorithmrmachine-learningdata-miningk-means
如何执行K-medoid
问题描述我花了很长时间试图弄清楚如何(在纸上)执行K-medoids算法,但我不能理解如何开始和迭代。例如:我有6个点、k、c1和c2之间的距离矩阵。如果有人能教我如何在这个例子上执行K-medoid算法,我会很高兴的。如何开始和迭代?谢谢推荐答案更多细节:将K设置为所需的簇数,
发布:2022-10-16 标签:data-miningcluster-analysisk-means
从word2vec模型获取距离矩阵和特征矩阵
问题描述我已经使用gensim为一个巨大的语料库生成了word2vec模型,我需要使用k均值聚类来对词汇表进行聚类,以满足我的需要:余弦距离矩阵(字对字,因此矩阵的大小为字数x字数)要素矩阵(字对要素,因此矩阵的大小是字数x要素数(200))对于特征矩阵,我尝试使用x=Model
发布:2022-10-16 标签:pythonk-meansword2vecgensim
用序列请求的数组设置数组元素在%1维后具有不均匀形状检测到的形状是(2,)+不均匀部分
问题描述importosimportnumpyasnpfromscipy.signalimport*importcsvimportmatplotlib.pyplotaspltfromscipyimportsignalfrombrainflow.board_shimimportBo
发布:2022-10-16 标签:pythonarrayspython-3.xnumpyk-means
来自KMeans&Quot;的3D散点图图例错误找不到要放入图例中的标签的句柄
问题描述我为用于RFM分析的KMeans模型绘制了3D散点图。我使用了KMeans模型标签来表示"颜色"组。当我使用Legend()时,它弹出一个错误,"找不到带标签的句柄放入图例"frommpl_toolkits.mplot3dimportAxes3D%matplotlibno
发布:2022-10-16 标签:pythonlegendscatter3dk-means
证明k-均值总是收敛的吗?
问题描述我了解k-Means算法的步骤。然而,我不确定算法是否总是收敛?或者,观察结果是否总是可以从一个质心切换到另一个质心?推荐答案算法始终收敛(根据定义),但不一定收敛到全局最优。算法可以从质心切换到质心,但这是算法的一个参数(precision或delta)。这有时被称为"
发布:2022-10-16 标签:k-means
K均值簇中节点和质心之间的距离?
问题描述用于提取k均值群集中节点和质心之间距离的任何选项。我对一个嵌入文本的数据集进行了KMeans聚类,我想知道每个集群中哪些节点远离质心,以便我可以检查各个节点的功能是否有所不同。提前谢谢!推荐答案KMeans.transform()返回每个样本到群集中心的距离数组。impo
发布:2022-10-16 标签:scikit-learnpython-3.xeuclidean-distancek-means
KMeans表示使用Python进行集群
问题描述我有一个数据集NameSystemAAZANaNBAZBNaNBNaNCAYCAYDAZEAYEAYENaNFAZFAZFNaN使用此数据集时,我需要根据";系统&为特定";名称&Quot;重复的次数对数据集进行群集。在上面的示例中,名称A、B和D有一个子
发布:2022-10-16 标签:pythonk-meansknnhierarchical-clustering
K-Means聚类-输出聚类包含相同数量的元素,但顺序不同[Python]
问题描述我遵循thistutorial对包含单个单词的列表执行K-Means聚类。这是一个基于板球的项目,所以我选择了K=3,这样以后我就可以将这三个群集区分为[击球,保龄球,防守]。但是,编译代码后,结果3个集群中的元素都相同,但顺序不同。我试着把最初的列表弄清楚,但也不能解决
发布:2022-10-16 标签:pythondata-miningcluster-analysisk-means