MapReduce类型和格式(三) 输出格式

MapReduce类型和格式(三) 输出格式

文本输出

TextOutputFormat

mapreduce.output.textoutputformat.separator 分隔符

TextOutputFormat对应的输入格式使KeyValueTextInputFormat

NullWritable省略输出的键和值


二进制输出

1. SequenceFileOutputFormat

2. SequenceFileAsBinaryOutputFormat

3. MapFileOutputFormat map文件作为输出


多个输出

MultiOutputFormat

1) 数据分割

    可以使用partition,但有时候会有缺点

2) MultipleOutput类

    将数据写入多个文件,文件名称源于输出的键值和任意字符串


延迟输出

LazyOutputFotmat作为封装输出格式,保证指定分区的第一条记录输出时才真正创建文件,不创建空文件

数据库输出

关系型数据库和HBase