1.
2.集群搭建
(1) hadoop-2.2.0/etc/hadoop/hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_79 |
(2) hadoop-2.2.0/etc/hadoop/core-site.xml
<configuration> <!-- 指定hdfs的nameservice为ns1 --> <property> <name>fs.defaultFS</name> <value>hdfs://ns1</value> </property> <!-- 指定hadoop临时目录 --> <property> <name>hadoop.tmp.dir</name> <value>/usr/hc/hadoop-2.2.0/tmp</value> </property> <!-- 指定zookeeper地址,注意多个之间用英文逗号分隔 --> <property> <name>ha.zookeeper.quorum</name> <value>nameNode:2181,dataNode01:2181,dataNode02:2181</value> </property> </configuration> |
(3) hadoop-2.2.0/etc/hadoop/hdfs-site.xml
<configuration> <!-- 指定hdfs的nameservice为ns1,需要和core-site.xml里面保持一致 --> <property> <name>dfs.nameservcies</name> <value>ns1</value> </property> <!-- ns1下面的NameNode,是nn1 --> <property> <name>dfs.ha.namenodes.ns1</name> <value>nn1</value> </property> <!-- ns1下面的NameNode,是nn1 --> <property> <name>dfs.ha.namenodes.ns1</name> <value>nn1</value> </property> <!-- nn1的RPC通信地址 --> <property> <name>dfs.namenode.rpc-address.ns1.nn1</name> <value>nameNode:9000</value> </property> <!-- nn1的http通信地址 --> <property> <name>dfs.namenode.http-address.ns1.nn1</name> <value>nameNode:50070</value> </property> <!-- 指定NameNode的元数据在JournalNade上的存放 --> <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://nameNode:</value> </property> <!-- 指定JournalNode在本地磁盘存放数据 --> <property> <name>dfs.namenode.shared.edits.dir</name> <value>/usr/hc/hadoop-2.2.0/jour</value> </property> <!-- 开启NameNode失败自动切换 --> <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property> <!-- 配置失败自动切换实现方式 --> <property> <name>dfs.client.failover.proxy.provider.ns1</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property> <!-- 配置隔离机制方法,多个机制用换行分隔 --> <property> <name>dfs.ha.fencing.methods</name> <value> sshfence shell(/bin/true) </value> </property> <!-- 使用sshfence隔离机制时需要ssh免登陆 --> <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/root/.ssh/id_rsa</value> </property> <!-- 配置sshfence隔离机制超时时间 --> <property> <name>dfs.ha.fencing.ssh.connect-timeout</name> <value>3000</value> </property> </configuration> |
(4) hadoop-2.2.0/etc/hadoop/mapred-site.xml.template 重命名为mapred-site.xml
<configuration> <!-- 指定mr框架为yarn方式 --> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> |
(5) hadoop-2.2.0/etc/hadoop/yarn-site.xml
<configuration> <!-- 指定resourcemaneger地址--> <property> <name>yarn.resourcemaneger.hostname</name> <value>nameNode</value> </property> <!-- 指定nodemanager启动时加载server --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration> |
(6) hadoop-2.2.0/etc/hadoop/slaves
dataNode01 dataNode02 |
六个配置文件修改完了,请严格按照顺序,首先启动zookeeper
(7) 在hadoop-2.2.0/sbin下面有hadoop-daemon.sh和hadoop-daemons.sh分别启动单个进程和多个进程。
启动journalnode
./hadoop-daemon.sh start journalnode |
(8)格式化hdfs
hdfs namenode -fromat |
(9)格式化ZK
hdfs zkfs -formatZK |
(10)分别启动hdfs和yarn再进行测试
相关推荐
基于Centos7下的hadoop2.7集群的搭建。(在vmware中的2台虚拟机。)
hadoop集群环境的搭建
Hadoop集群环境搭建,实战篇
hadoop单机和集群搭建过程,一共三个节点,很详细,每一步都有截图
在一台虚拟机上安装多台linux服务机,并搭建Hadoop集群环境
Linux Info: Ubuntu 16.10 x64 Docker 本身就是基于 Linux 的,所以首先以我的一台服务器做实验。虽然最后跑 wordcount 已经由于内存不足而崩掉,但是之前的过程还是可以参考的。 连接服务器 使用 ssh 命令连接远程...
HADOOP快速入门及搭建集群环境,可以进行搭建试试,文档比较详细
此文档在hadoop集群搭建完毕之后,在集群之外搭建一个hadoop集群的开发环境,用于编写hadoop实际处理程序,还包括了如何提交任务等。整体非常详细,如需要其他hadoop集群搭建资源可以联系我,免费给q:1487954071
脚本搭建hadoop集群 可以自定义主机名和IP地址 可以自定义安装jdk和hadoop(格式为*tar.gz) 注意事项 1、安装完jdk和hadoop请手动source /etc/profile 刷新环境变量 2测试脚本环境为centOS6,其他操作系统会有些...
Hadoop集群架构搭建分析
全程跟着安装配置的一般不会出现问题,jdk版本尽量选择和Hadoop版本相容的,Hadoop版本可以选择较低版本,2.7版本较为稳定,Linux系统版本没有多大要求,一般将Hadoop和jdk版本选择好就行,这个作业较为简单,在安装...
要想深入的学习Hadoop数据分析技术,首要的任务是必须要将hadoop集群环境搭建起来,可以将hadoop简化地想象成一个小软件,通过在各个物理节点上安装这个小软件,然后将其运行起来,就是一个hadoop分布式集群了。...
!
!
hadoop 全套环境搭建指南,三台虚拟机环境准备 linux基础及shell增强 大数据集群环境准备 zookeeper介绍及集群操作 网络编程
3.1 生成密匙 3.2 免密登录 3.3 验证免密登录 3.1 下载并解压 3.2 配置环境变量 3.3 修改配置 3.4 分发程序 3.5 初始化 3.6
大数据技术基础实验报告-Linux环境下hadoop集群的搭建与基本配置