CDH
CDH(Cloudera Distribution Hadoop), 是一个大数据平台
Hadoop的发行版本有很多,有华为发行版,Intel发行版,Cloudera发行版(CDH),MapR版本,以及HortonWorks版本等。所有发行版都是基于Apache Hadoop衍生出来的
收费版本:
收费版本一般都会由新的特性。国内绝大多数公司发行的版本都是收费的,例如Intel发行版本,华为发行版本等。
免费版本:
不收费的版本主要有三个(都是国外厂商)。
- Cloudera版本(Cloudera’s Distribution Including Apache Hadoop)简称”CDH“。
- Apache基金会hadoop
- Hontonworks版本(Hortonworks Data Platform)简称“HDP”。
为什么需要CDH?
大致提出一个问题,假如公司要求给500台机器,进行安装hadoop集群。
如果又对于以上集群进行hadoop版本升级,你会选择什么升级方案,最少要花费多长时间?
你在过程中会大大考虑新版本的Hadoop,与Hive、Hbase、Flume、Kafka、Spark等等兼容?
集群的版本限制很重要。