宁波大红鹰学院信息工程学院 浙江
TP311
School of Electronic and Information Ningbo Dahong ying University Ningbo
随着社交网络的快速发展,海量社交网络的数据挖掘成为一个重要课题。针对海量数据的社交网络分析方法进行研究,以Hadoop的分布式文件系统和Map/Reduce并行方法设计基于Hadoop的分布式数据挖掘框架,在此基础上,通过Map/Reduce的并行方法,将传统数据挖掘算法并行化,以谱聚类的并行为例,阐述转化的过程并对在大数据条件下所面临的内存不足的问题给出相应的算法优化。最后对3个不同量级的数据集进行实验,验证基于Hadoop的社交网络分析平台的框架的合理性和算法并行化的有效性。
李晓蕾.基于Hadoop社交网络分析平台的设计与实现计算机测量与控制[J].,2014,22(12).