云环境下的高效K-Medoids并行算法
DOI:
CSTR:
作者:
作者单位:

常州大学 信息科学与工程学院,常州大学 信息科学与工程学院,常州大学 信息科学与工程学院,

作者简介:

通讯作者:

中图分类号:

TP311

基金项目:

国家自然科学(11271057,51176016);江苏省自然科学(BK2009535)


Highly efficient parallel algorithm of K-Medoids in cloud environment
Author:
Affiliation:

School of Information Science Engineering,ChangZhou University,School of Information Science Engineering,ChangZhou University,School of Information Science Engineering,ChangZhou University,

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    传统聚类算法K-Medoids对初始点的选择具有随机性,容易产生局部最优解;替换聚类中心时采用的全局顺序替换策略降低了算法的执行效率;同时难以适应海量数据的运算。针对上述问题,提出了一种云环境下的改进K-Medoids算法,该改进算法结合密度法和最大最小原则得到优化的聚类中心,并在Canopy区域内对中心点进行替换,再采用优化的准则函数,最后利用顺序组合MapReduce编程模型的思想实现了算法的并行化扩展。实验结果表明,该改进算法与传统算法相比对初始中心的依赖降低,提高了聚类的准确性,减少了聚类的迭代次数,降低了聚类的时间。

    Abstract:

    Traditional K-Medoids clustering algorithm selects the initial points randomly, which is easy to produce local optimum; when replace the cluster centers, adopted global sequential replacement policy reduces the efficiency of the algorithm; at the same time, it is difficult to adapt to operation of massive data. In response to the above problems, an improved K-Medoids clustering algorithm in cloud environment is proposed. The algorithm combines the density method and Max-Min principle to obtain optimized cluster centers, and replaces centers in the area of Canopy, and adopts optimization criterion function, and finally uses the ideas of sequential composition of MapReduce programming model to achieve the parallel extensions of the algorithm. Result of the experiments shows that the improved method is less dependent on the initial points and reduces the number of iterations and the clustering time.

    参考文献
    相似文献
    引证文献
引用本文

李媛媛,孙玉强,晁亚,刘阳.云环境下的高效K-Medoids并行算法计算机测量与控制[J].,2016,24(12):58.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-07-20
  • 最后修改日期:2016-08-02
  • 录用日期:2016-08-03
  • 在线发布日期: 2017-02-06
  • 出版日期:
文章二维码