您的位置: 首页 > 文章 > 12,maptask工作机制与maptask并行度与决定机制 12,maptask工作机制与maptask并行度与决定机制 分类: 文章 • 2025-01-06 20:24:10 1.准备数据 200MB 2.提交任务程序drive maptask通过inputformat读取,通过spilt切分了原文件,spilt=blocksize 3.mapper->map(k,v,context)->outputcollector 4.向环形缓冲区写入数据,默认大小为100MB,超过80%开始溢写 5.进行默认的分区排序 6.merge归并排序