Hadoop2.2.0中HDFS的高可用性实现原理

　　在任何时候，集群中只有一个NN处于Active 状态是极其重要的。否则，在两个Active NN的状态下NameSpace状态将会出现分歧，这将会导致数据的丢失及其它不正确的结果。为了保证这种情况不会发生，在任何时间，JNs只允许一个NN充当writer。在故障恢复期间，将要变成Active 状态的NN将取得writer的角色，并阻止另外一个NN继续处于Active状态。
　　为了部署HA集群，你需要准备以下事项：
　　（1）、NameNode machines：运行Active NN和Standby NN的机器需要相同的硬件配置；
　　（2）、JournalNode machines：也就是运行JN的机器。JN守护进程相对来说比较轻量，所以这些守护进程可以可其他守护线程（比如NN，YARN ResourceManager）运行在同一台机器上。在一个集群中，最少要运行3个JN守护进程，这将使得系统有一定的容错能力。当然，你也可以运行3个以上的JN，但是为了增加系统的容错能力，你应该运行奇数个JN（3、5、7等），当运行N个JN，系统将最多容忍(N-1)/2个JN崩溃。
　　在HA集群中，Standby NN也执行namespace状态的checkpoints，所以不必要运行Secondary NN、CheckpointNode和BackupNode；事实上，运行这些守护进程是错误的。

本博客文章除特别声明，全部都是原创！
原创文章版权归过往记忆大数据（过往记忆）所有，未经许可不得转载。
本文链接: 【Hadoop2.2.0中HDFS的高可用性实现原理】（https://www.iteblog.com/archives/833.html）

大规模 Hadoop 升级在 Pinterest 的实践

大规模 Hadoop 升级在 Pinterest 的实践

HDFS 在 B 站的探索和实践

HDFS 在 B 站的探索和实践

Uber 如何在 Apache Parquet 中使用 ZSTD 压缩减少大量存储空间实践

Uber 如何在 Apache Parquet 中使用 ZSTD 压缩减少大量存储空间实践

Uber 是如何提高 HDFS I/O 利用率的

Uber 是如何提高 HDFS I/O 利用率的

LinkedIn 是如何将 Hadoop YARN 集群扩展到超过一万个节点

LinkedIn 是如何将 Hadoop YARN 集群扩展到超过一万个节点

汽车之家离线计算平台的演进之路

汽车之家离线计算平台的演进之路

Apache Hadoop 基础设施容器化在 Uber 的实践

Apache Hadoop 基础设施容器化在 Uber 的实践

字节跳动十万节点 HDFS 集群多机房架构演进之路

字节跳动十万节点 HDFS 集群多机房架构演进之路

下面文章您可能感兴趣

通过spark-redshift工具包读取Redshift上的表

一篇文章搞清楚什么是分布式系统 CAP 定理

Spark北京Meetup第十次活动－－Spark实践主题

欢迎加入阿里云 Dala Lake Analytics 团队

使用Ganglia监控Spark

Spark Summit 2017 SanFrancisco全部PPT下载[共143个]

Apache Avro使用入门指南

Apache Flume 1.7.0正式发布

C++怎么设计只能在堆或者栈分配空间的类

如何快速判断正整数是2的N次幂

Apache Kafka-0.8.1.1源码编译

Apache Spark 自定义优化规则：Custom Strategy

Scala正则表达式替换

Apache Kylin在美团数十亿数据OLAP场景下的实践

HDFS 块和 Input Splits 的区别与联系

could not find implicit value for evidence parameter of type org.apache.flink.api.common.typeinfo.TypeInformation[Int]

Flink Forward 201904 PPT资料下载

Kafka 是如何保证数据可靠性和一致性

Apache Spark相比Hadoop的优势

Spark多文件输出(MultipleOutputFormat)