hadoop生态图谱

hadoop生态图谱

MapReduce:分布式编程处理模型

HDFS:分布式文件系统

Zookeeper:分布式集群协商服务软件

HBASE:类似BigTable,基于列存储非结构化数据

Hive:数据仓库

Pig:创建mapreduce程序的高级脚本语言

Flume/Chukwa:日志收集系统

Sqoop:关系数据库向HDFS的转移工具

Avro:数据序列化系统

AvatarNode:单namenode的备份解决方案

Cassandra:分布式NoSQL数据库Hama基于块同步并行(Bulk sync parall)的科学计算、图形处理等复杂计算工具

Mashout:机器学习

Ganglia/Hue:监控Nagios告警Scribe日志收集

转载于:https://www.cnblogs.com/cloudma/archive/2012/11/06/hadoop-system.html