高可用介绍


Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFS NameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂,故下面先进行讲解:

Zookeeper Hadoop HA 高可用整体架构

https://www.edureka.co/blog/how-to-set-up-hadoop-cluster-with-hdfs-high-availability/

https://www.edureka.co/blog/how-to-set-up-hadoop-cluster-with-hdfs-high-availability/

HDFS 高可用架构主要由以下组件所构成:

基于 QJM 的共享存储系统的数据同步机制分析

目前 Hadoop 支持使用 Quorum Journal Manager (QJM)Network File System (NFS) 作为共享的存储系统。

这里以 QJM 集群为例进行说明: