ABC_Kmeans聚类算法的MapReduce并行化研究
DOI:
CSTR:
作者:
作者单位:

(四川文理学院 计算机学院,四川 达州 635000)

作者简介:

袁小艳(1982-),女,重庆永川人,硕士,讲师,主要从事软件技术及开发、云教育、知识工程方向的研究。[FQ)]

通讯作者:

中图分类号:

基金项目:

四川省教育厅一般项目(15ZB0318);四川文理学院一般项目(2014Z012Y);四川文理学院智能计算与物联网工程技术中心资助。


Map Reduce Parallel Study of ABC_Kmeans Clustering Algorithm
Author:
Affiliation:

(College of computer,Sichuan University of Arts and Science,Dazhou 635000,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    随着数据的海量增长,数据聚类算法的研究面临着海量数据挖掘和处理的挑战;针对K-means聚类算法对初始聚类中心的依赖性太强、全局搜索能力也差等缺点,将一种改进的人工蜂群算法与K-means算法相结合,提出了ABC_Kmeans聚类算法,以提高聚类的性能;为了提高聚类算法处理海量数据的能力,采用MapReduce模型对ABC_Kmeans进行并行化处理,分别设计了Map、Combine和Reduce函数;通过在多个海量数据集上进行实验,表明ABC_Kmeans算法的并行化设计具有良好的加速比和扩展性,适用于当今海量数据的挖掘和处理。

    Abstract:

    With the massive growth of data, data clustering algorithm research is facing the challenge of mass data mining and processing.For K - means clustering algorithm to the dependence of the initial clustering center is too strong, and poor global search ability shortcomings, will be an improved artificial colony algorithm combined with K - means algorithm, ABC_Kmeans clustering algorithm is proposed, in order to improve the performance of clustering.In order to improve the clustering algorithm’s ability to deal with huge amounts of data, uses the MapReduce model for parallel processing to ABC_Kmeans, design the Map, Combine and Reduce function respectively,Through the experiments on several huge amounts of data collection,show ABC_Kmeans parallel design of algorithm has good speedup and scalability, applicable to today's huge amounts of data mining and processing.

    参考文献
    相似文献
    引证文献
引用本文

袁小艳. ABC_Kmeans聚类算法的MapReduce并行化研究计算机测量与控制[J].,2016,24(1):252-254, 258.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2015-07-22
  • 最后修改日期:2015-09-07
  • 录用日期:
  • 在线发布日期: 2016-07-26
  • 出版日期:
文章二维码