CDH5.10.2离线配置hadoop-lzo压缩

CDH-LZO配置

下载和CDH版本对应的hadoop-lzo版本

如下:

 CDH5.10.2离线配置hadoop-lzo压缩

下载地址:http://archive.cloudera.com/gplextras5/parcels/

需要下载如下三个文件:

GPLEXTRAS-5.4.0-1.cdh5.4.0.p0.27-el6.parcel

GPLEXTRAS-5.4.0-1.cdh5.4.0.p0.27-el6.parcel.sha1(使用的时候重命名成.sha)

manifest.json

配置包到cloudera-manager共享目录

因为使用的是parcels安装,首先将下载好的文件放到cloudera-manager共享的目录中,此处为:

 CDH5.10.2离线配置hadoop-lzo压缩

进入到cloudera-manager的控制页面,主机àparcelà位置,在CNNIC(CM集群的名字)选项中目录改为/opt/cloudera-manager/cloudera/parcel-repo。

安装**lzo服务

Cloudera-manager控制页面,主机àparcelà检查新Parcel,如果配置正确,则出现如下界面:

 CDH5.10.2离线配置hadoop-lzo压缩

点击分配,进行到如下界面:

 CDH5.10.2离线配置hadoop-lzo压缩

之后进入**状态中:

 CDH5.10.2离线配置hadoop-lzo压缩

步骤完成后,状态一列会出现“已分配。已**”。

 CDH5.10.2离线配置hadoop-lzo压缩

至此,lzo服务安装工作已经完成。

修改配置集群的lzo服务

修改HDFS配置

在io.compression.codecs属性值中追加如下值:

com.hadoop.compression.lzo.LzoCodec

com.hadoop.compression.lzo.LzopCodec

如下图所示:

 CDH5.10.2离线配置hadoop-lzo压缩

修改YARN配置

将mapreduce.application.classpath的属性值增加一项:/opt /cloudera/parcels/HADOOP_LZO/lib/hadoop/lib/*

如下图所示:

 CDH5.10.2离线配置hadoop-lzo压缩

修改MR应用程序环境

修改mapreduce.admin.user.env的属性值,增加一项:

/opt/cloudera/parcels/GPLEXTRAS/lib/hadoop/lib/native,如下图所示:

 CDH5.10.2离线配置hadoop-lzo压缩

重启集群生效。