【赵渝强老师】基于ZooKeeper实现Hadoop HA

🕗 发布于 2024-09-22 12:25 zookeeper hadoop 分布式 大数据

在这里插入图片描述

由于在HA架构中包含的节点比较多，在进行实际部署的时候需要做好集群的规划。图14.9一共使用了4个节点来部署HDFS HA，它们分别是：bigdata112、bigdata113、bigdata114和bigdata115。由于Hadoop默认包含了HDFS和Yarn，因此在部署HDFS HA的时候，也可以同时部署Yarn的HA。每个节点上部署的服务如下表所示：
在这里插入图片描述
视频讲解如下：

基于ZooKeeper实现Hadoop HA

【赵渝强老师】HDFS的HA高可用架构

基于已经部署好的ZooKeeper集群的部署，这里直接从Hadoop HA的部署开始。
（1）在每个节点增加以下环境变量。

export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root
export HDFS_DATANODE_USER=root
export HDFS_DATANODE_SECURE_USER=root
export HDFS_NAMENODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

（2）修改bigdata112节点上的hadoo-env.sh文件。

export JAVA_HOME=/root/training/jdk1.8.0_181

（3）修改bigdata112节点上的core-site.xml文件。

<configuration>
<!-- 指定hdfs的nameservice为ns1 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://ns1</value>
</property>

<!-- 指定hadoop临时目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/root/training/hadoop-3.1.2/tmp</value>
</property>

<!-- 指定zookeeper地址 -->
<property>
<name>ha.zookeeper.quorum</name>
<value>bigdata112:2181,bigdata113:2181,bigdata114:2181</value>
</property>
</configuration>

（4）修改bigdata112节点上的hdfs-site.xml文件。

<configuration> 
<!--指定hdfs的nameservice为ns1，需要和core-site.xml中的保持一致 -->
<property>
<name>dfs.nameservices</name>
<value>ns1</value>
</property>

<!-- ns1下面有两个NameNode，分别是nn1，nn2 -->
<property>
<name>dfs.ha.namenodes.ns1</name>
<value>nn1,nn2</value>
</property>

<!-- nn1的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>bigdata112:9000</value>
</property>
<!-- nn1的http通信地址 -->
<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>bigdata112:9870</value>
</property>

<!-- nn2的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>bigdata113:9000</value>
</property>
<!-- nn2的http通信地址 -->
<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>bigdata113:9870</value>
</property>

<!-- 指定NameNode的日志在JournalNode上的存放位置 -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://bigdata112:8485;bigdata113:8485;/ns1</value>
</property>
<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/root/training/hadoop-3.1.2/journal</value>
</property>

<!-- 开启NameNode失败自动切换 -->
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>

<!-- 配置失败自动切换实现方式 -->
<property>
<name>dfs.client.failover.proxy.provider.ns1</name>           
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<!-- 配置隔离机制方法，多个机制用换行分割，即每个机制暂用一行-->
<!--如果没有隔离机制，会造成DataNode脑裂的问题-->
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>

<!-- 使用sshfence隔离机制时需要ssh免登陆 -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>

<!-- 配置sshfence隔离机制超时时间 -->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>

（5）修改bigdata112节点上的mapred-site.xml文件。

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

（6）修改bigdata112节点上的yarn-site.xml文件。

<configuration>
<!-- 开启RM高可靠 -->
<property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
</property>

<!-- 指定RM的cluster id -->
<property>
   <name>yarn.resourcemanager.cluster-id</name>
   <value>yrc</value>
</property>

<!-- 指定RM的名字 -->
<property>
   <name>yarn.resourcemanager.ha.rm-ids</name>
   <value>rm1,rm2</value>
</property>

<!-- 分别指定RM的地址 -->
<property>
   <name>yarn.resourcemanager.hostname.rm1</name>
   <value>bigdata112</value>
</property>
<property>
   <name>yarn.resourcemanager.hostname.rm2</name>
   <value>bigdata113</value>
</property>

<!-- 指定zk集群地址 -->
<property>
   <name>yarn.resourcemanager.zk-address</name>
   <value>bigdata112:2181,bigdata113:2181,bigdata114:2181</value>
</property>

<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>
</configuration>

（7）修改bigdata112节点上的workers文件。

bigdata114
bigdata115

（8）将bigdata112上配置好的hadoop拷贝到其他节点。

scp -r /root/training/hadoop-3.1.2/ root@bigdata113:/root/training/
scp -r /root/training/hadoop-3.1.2/ root@bigdata114:/root/training/
scp -r /root/training/hadoop-3.1.2/ root@bigdata115:/root/training/

（9）在bigdata112、bigdata113和bigdata114上启动Zookeeper集群。
（10）在bigdata112和bigdata113上启动JournalNode。

hadoop-daemon.sh start journalnode

（11）在bigdata112上格式化HDFS。

hdfs namenode -format

（12）将bigdata112上$HADOOP_HOME/tmp拷贝到bigdata113的对应目录下。

scp -r /root/training/hadoop-3.1.2/tmp/dfs/  root@bigdata113:/root/training/hadoop-3.1.2/tmp

（13）格式化zookeeper。

hdfs zkfc -formatZK

# ZooKeeper格式化成功后，将看到如下的日志输出：
# 20/07/13 00:34:33 INFO ha.ActiveStandbyElector: 
# Successfully created /hadoop-ha/ns1 in ZK.

（14）在bigdata112上启动Hadoop集群。

start-all.sh

（15）下面展示了整个集群在启动过程中输出的日志：

Starting namenodes on [bigdata112 bigdata113]
Last login: Fri Sep 27 00:18:38 CST 2020 on pts/0
Starting datanodes
Last login: Fri Sep 27 00:19:37 CST 2020 on pts/0
Starting journal nodes [bigdata112 bigdata113]
Last login: Fri Sep 27 00:19:40 CST 2020 on pts/0
bigdata113: journalnode is running as process 1297.  Stop it first.
bigdata112: journalnode is running as process 1294.  Stop it first.
Starting ZK Failover Controllers on NN hosts [bigdata112 bigdata113]
Last login: Fri Sep 27 00:19:50 CST 2020 on pts/0
Starting resourcemanagers on [ bigdata112 bigdata113]
Last login: Fri Sep 27 00:19:52 CST 2020 on pts/0
Starting nodemanagers
Last login: Fri Sep 27 00:20:00 CST 2020 on pts/0

# 通过打印输出的日志可以看到，在bigdata112和bigdata113上启动了两个NameNode、
# 两个JournalNode和两ResourceManager。

（16）通过jps命令查看每个节点上的后台进程，如下图所示。
在这里插入图片描述

在部署好了HDFS HA的架构后，便可以进行一个简单的测试以确定是否能够基于ZooKeeper实现主节点的自动切换。

原文地址：https://blog.csdn.net/zhaoyuqiang/article/details/142339076

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：AI绘制调整虚线教程
下一篇：输电线路绝缘子红外检测数据集

美团一面-2
在父组件中定义一个回调函数，该函数会在子组件的DOM元素被挂载或卸载时被调用。React的事件合成机制通过创建统一的SyntheticEvent对象、使用事件委托、批量更新和跨浏览器兼容性处理，提供了
阅读更多2024-09-25
WebRTC中的维纳滤波器实现详解：基于决策导向的SNR估计
维纳滤波器是语音增强领域中常用的工具，它能够根据信噪比动态地调整增益，从而在保留语音信号的同时抑制背景噪声。在WebRTC的噪声抑制模块中，通过决策导向的SNR估计方法，维纳滤波器得以实时地调整其频率
阅读更多2024-09-25
JMeter与大模型融合应用之JMeter菜单栏中切入大模型交互详解
本文开始，我们就具体针对JMeter与大模型之间的具体功能实现进行详细介绍。在具体介绍之前，这里需要说明几点：第一：本文所有开发的特性都是基于JMeter 5.1.1版本进行开发。第二：针对JMete
阅读更多2024-09-25
使用java实现ffmpeg的各种操作
以实现如下功能1、支持音频文件转mp3；2、支持视频文件转mp4；3、支持视频提取音频；4、支持视频中提取缩略图；5、支持按时长拆分音频文件；
阅读更多2024-09-25
为什么会出现电话机器人？语音电话机器人的出现起到了什么作用？
随着经济的发展和消费模式的转变，客户对服务的期望不断提高。在未来，随着技术的进一步发展，电话机器人的应用将会更加普遍，成为企业运营中不可或缺的一部分。智能电话机器人能快速为企业搭建起集销售、客服、品牌
阅读更多2024-09-25
智能Ai语音机器人的应用价值有哪些？
随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交融，成为人们无法拒绝，无法失去的一个重要存在。这些价值使得智
阅读更多2024-09-25
AndroidLogger插件使用技巧
AndroidLogger 插件不仅提供了日志高亮和实时获取的功能，还提供了截屏和文件管理的功能，本文介绍一些它的隐藏功能。
阅读更多2024-09-25
康养为松，智能为鹤：华为全屋智能画出的松鹤长春图
在道家文化中，喜欢将松与鹤并举，以其长寿与仙逸表达对老年人的美好祝愿。松鹤延年、松龄鹤寿等成语皆出于此。松鹤长春图，也成为国画当中的经久不衰的题材。当我们迎来老龄化时代，“松鹤长春”则成为了整个社会的
阅读更多2024-09-25
使用umy-ui 优化带有大量输入框、下拉框的ElementUI el-table
ElementUI el-table 在数据量大或表格内嵌大量输入框、下拉框时，会出现首次加载时间很长，更改输入框、下拉框值后，页面显示需要2秒左右才能更新，体验非常不友好。umy-ui是兼容Elem
阅读更多2024-09-25
cmake--file
需要指定文件后缀。
阅读更多2024-09-25

【赵渝强老师】基于ZooKeeper实现Hadoop HA

相关文章