MapReduce类型和格式(三) 输出格式
文本输出
TextOutputFormat
mapreduce.output.textoutputformat.separator 分隔符
TextOutputFormat对应的输入格式使KeyValueTextInputFormat
NullWritable省略输出的键和值
二进制输出
1. SequenceFileOutputFormat
2. SequenceFileAsBinaryOutputFormat
3. MapFileOutputFormat map文件作为输出
多个输出
MultiOutputFormat
1) 数据分割
可以使用partition,但有时候会有缺点
2) MultipleOutput类
将数据写入多个文件,文件名称源于输出的键值和任意字符串
延迟输出
LazyOutputFotmat作为封装输出格式,保证指定分区的第一条记录输出时才真正创建文件,不创建空文件
数据库输出
关系型数据库和HBase