(2019-4-29) 大数据开发-初识hadoop
文章目录
什么是hadoop?
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop是一个专为离线和大规模数据分析而设计的。
更多信息可大数据论坛参查:https://bbs.****.net/forums/hadoop/recommend
在hadoop入门学习中,一般需要一主二从,三台tomcat服务器。如下图红框中表示的就是整个hadoop架构体系。
核心组件有:hadoop、flume(采集系统)、hdfs(文件系统)、hive(存储仓库)