异构环境下基于双重预取的Hadoop调度算法
DOI:
CSTR:
作者:
作者单位:

(常州大学 信息科学与工程学院,江苏 常州 213000)

作者简介:

孙玉强(1956-),男,博士,教授,主要从事并行计算、软件工程方向的研究。 通讯作者:顾玉宛,女,博士生,通讯联系人,主要从事并行计算和图像处理方向的研究。 [FQ)]

通讯作者:

中图分类号:

基金项目:

国家自然科学基金项目(11271057);江苏省普通高校研究生科研创新计划项目(SCZ1412800004)。


Scheduling Algorithm Based on Double Prefetching in Heterogeneous Hadoop Clusters
Author:
Affiliation:

(School of Information Science & Engineering, Changzhou University, Changzhou 213000,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    Hadoop处理海量数据时,无论是Map任务还是Reduce任务都需要耗费大量的时间传输数据,故提出一种基于双重预取的调度算法;该算法通过估算节点上任务执行的进度来预测Map任务的执行节点,然后通知节点提前预取所需的数据,并且在Map任务完成的数量达到预定值时,开始为Reduce任务预取部分数据;由于在异构的环境下集群中节点的性能各不相同,为此采取了改进的预测模型,以提高任务进度判断的准确性;实验证明,本算法在作业响应时间等方面优于现有的调度算法。

    Abstract:

    When Hadoop processing huge amounts of data, both in the Map tasks and Reduce tasks requires a lot of time to transfer data. This paper presents a scheduling algorithm based on double prefetching, the algorithm predicts the node which will execute the Map task by estimating the progress of running tasks, so that the node can prefetch required data for Map tasks. Moreover, the system can also prefetch the data for Reduce tasks while Map tasks are running. Due to the performance of the cluster nodes in heterogeneous environment are not identical, the algorithm adopts an improved prediction model to improve the accuracy of the judgment of task progress. Experiments show that the algorithm is superior to the existing scheduling algorithm with less response time.

    参考文献
    相似文献
    引证文献
引用本文

孙玉强,陆勇,王文闻,李媛媛,顾玉宛.异构环境下基于双重预取的Hadoop调度算法计算机测量与控制[J].,2016,24(9):172-175.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-02-29
  • 最后修改日期:2016-04-25
  • 录用日期:
  • 在线发布日期: 2016-09-28
  • 出版日期:
文章二维码