基于云计算的并行K-means聚类算法研究
DOI:
CSTR:
作者:
作者单位:

(南京工程学院 信息化建设与管理办公室,南京 211167) 

作者简介:

谢雪莲(1977-),女,江苏无锡人,工程师,硕士,主要从事数据库安全方向的研究。 [FQ)]

通讯作者:

中图分类号:

TP311

基金项目:

南京工程学院校级科研重点基金(QKJA2011011);江苏省属高校自然科学基金(11KJB510005);国家自然科学基金(61104085)。


Research on Parallel K-means Algorithm Based on Cloud Computing Platform
Author:
Affiliation:

(Information Construction and Management Office, Nanjing Institute of Technology,Nanjing 211167,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    目前数据呈爆炸式增长,海量存储状态,给聚类研究带来了诸如计算复杂性和计算能力不足都很多问题;而云计算平台通过负载均衡,动态配置大量的虚拟计算资源,有效地突破了耗时耗能的瓶颈,在海量数据挖掘中体现出了其独特的优势;文章深入研究了基于云计算平台Hadoop的并行K-means算法,并结合MapReduce分布式计算模型,给出了算法设计的方法和策略,包括MapReduce处理的map、shuffle和Reduce 3个过程,仿真结果表明K-means并行算法的效率较高。

    Abstract:

    Now with the explosive growth of data,there are a lot of problems such as complexity and lack of computing resources in cluster research . The cloud computing platform breaks the state of high energy-consuming and shows the advantages in the massive data mining through load balance and dynamic configuration of virtual computing resources. The parallel K-means algorithm based on Hadoop platform was designed .The algorithm methods and strategies were shown combined with MapReduce distributed computing model including map, shuffle and Reduce. Simulation results show that the parallel K-means algorithm has strong computing efficiency.

    参考文献
    相似文献
    引证文献
引用本文

谢雪莲,李兰友.基于云计算的并行K-means聚类算法研究计算机测量与控制[J].,2014,22(5):1510-1512.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-12-20
  • 最后修改日期:2014-02-20
  • 录用日期:
  • 在线发布日期: 2014-12-16
  • 出版日期:
文章二维码