Introduction

Hadoop简介

Apache 公司开发的一款可靠的、可扩展性的、分布式计算的开源软件。以Hadoop分布式文件系统(HDFS)和分布式运算编程框架(MapReduce)为核心,允许在集群服务器上使用简单的编程模型对大数据集进行分布式处理。Hadoop被设计成能够从单台服务器扩展到数以千计的服务器,每台服务器都有本地的计算和存储资源。Hadoop的高可用性并不依赖硬件,其代码库自身就能在应用层侦测并处理硬件故障,因此能基于服务器集群提供高可用性的服务。

目的

在虚拟机上实现Hadoop 完全分布式集群搭建,初步了解Hadoop工作原理。

先决条件:

Flume version : 1.6、Hadoop version : 2.7.3、Hbase version : 1.2.6、Hive version : 0.12.0、

JDK version : 1.7.0_79、Kafka version : 2.10、Zookeeper version : 3.4.8、Centos7 ISO文件、

VNware Workstation16。

results matching ""

    No results matching ""