`
weitao1026
  • 浏览: 990880 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

使用3个节点来部署完全分布式集群

阅读更多

介绍了Hadoop基于单机模式下的伪分布式的部署,那么今天我们来看下Hadoop完全分布式的部署,其实只要伪分布式部署的会了,那么完全分布式的相对来说就很简单了,只要我们在一台机器上部署好,然后远程拷贝给其他的子节点就可以了。

散仙用的是Centos6.4的版本,hadoop1.2.1的版本,其他的一些linux系统都是大同小异,关于SSH的配置及一些准备工作,在这里就不多说了,不会的可以参照散仙的上两篇博客进行配置
下面进入正题,散仙总共使用3个节点来部署完全分布式集群,下面是机器的ip地址,以及机器名

 

 

 

IP地址 节点名 10.2.143.5 Master 10.2.143.36 Slave 10.2.143.37 Slave2

 


我们只在Master节点上配置,然后拷贝给其他节点,下面是master的详细配置。
1,首先,我们需要配置的是在conf文件夹下找到hadood-env.sh这个文件,然后使用命令vi  hadood-env.sh编辑此文件并取消注释的JAVA HOME,然后配上我们自己的的JDK路径,截图如下

,

2,第二我们需要配置的是conf下的core.site.xml这个文件
,添加
<property>
<name>fs.default.name</name>
<value>hdfs://10.2.143.5:9000</value>
</property>
截图如下:



3,第三我们需要配置的是hdfs.site.xml这个文件,因为散仙机器的有2个Slave,所以
节点数写2就可以了,注意默认是3
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
截图如下


4,第四我们需要配置conf下的mapred-site.xml文件
<property>
<name>mapred.job.tracker</name>
<value>10.2.143.5:9001</value>
</property>
截图如下:



5,第五我们需要配置conf下的master文件,直接把主节点的IP,加入其中即可,截图如下:


6,第六我们需要配置conf下的slave文件,直接把子节点的IP,加入其中即可,截图如下:


配置完成之后,我们在主节点上,执行bin/hadoop namenode -format 进行格式化,格式化完毕之后,就可以通过scp进行远程拷贝到子节点了,截图如下:


然后就可以在master节点上,执行启动命令了,
bin/start-all.sh,启动成功之后,可以使用jps命令在各个节点上,查看端口情况。
截图如下:





最后,我们执行service iptables stop命令关闭,各个节点上的防火墙,就可以在Win下访问50030,以及50070端口查看web页面了,截图如下:




注意一点,如果这个Browse the filesystem这个链接不能正常使用,截图如下


需要配置在win上的C:\Windows\System32\drivers\etc下面的hosts文件,linux则不需要,添加内容和linux上的master节点的hosts文件的内容一致即可,截图如下:

然后,我们就可以打开此链接了,截图如下:


至此,我们的完全分布式集群部署,已经搭建完毕,停掉集群的命令是bin/stop-all.sh。我们可以上传几个文件做个测试,散仙的配置默认会有2个副本,在这里就不给出具体的操作了,后面的博客,会介绍一下管理操作hadoop的几种shell。写了这么长,配了这么多图,其实只要操作熟练,5分钟之内,就可以搭建完毕,当然前提是我们环境搭建已经很熟练了。

分享到:
评论

相关推荐

    部署Hadoop3.0高性能集群.docx

    部署Hadoop3.0高性能集群,Hadoop完全分布式模式: Hadoop的守护进程分别运行在由多个主机搭建的集群上,不同 节点担任不同的角色,在实际工作应用开发中,通常使用该模式构建企业级Hadoop系统。 在Hadoop环境中,所有...

    Hadoop完全分布式配置.txt

    Hadoop的安装分为单机方式、伪分布式方式和完全分布式方式。 a. 单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件...

    zookeeper+hadoop+hbase+hive(集成hbase)安装部署教程(超详细).docx

    3.集群能正常运行的条件是集群可节点宕机数应保证有超过集群机器总数一半的机器在运行,因此从经济和实用性来说,集群的节点一般是奇数个,本文部署4台机器,其容灾能力与部署3台机器一致,即只能宕机1台

    Spark实验:Standalone模式安装部署(带答案)1

    1. 解压Spark安装包 2. 配置Spark环境变量 2. 修改 spark-env.sh 文件,完成以下设置: 1. 设置运行master进程的节点, e

    Hadoop大数据平台构建、规划大数据平台集群教学课件.pptx

    在一台服务器上使用虚拟机软件虚拟所有的节点,也属于完全分布模式,在一些数据量比较少的公司集群就是这样部署的。 完全分布模式Hadoop大数据平台集群 - 服务器角色规划 Master (IP:192.168.128.128) Slave1 ...

    Fourinone分布式计算框架

    “农民工”为一个计算节点,可以部署在多个机器,它由开发者自由实现,计算时,“农民工”到“手工仓库”获取输入资源,再将计算结果放回“手工仓库”返回给“包工头”。“包工头”负责承包一个复杂项目的一部分,...

    Fourinone分布式并行计算四合一框架

    我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为...

    还在为搭建集群的期末作业发愁吗?最简单的搭建hadoop+spark+hive大数据集群搭建文档.docx

    最简单的Hadoop+Spark大数据集群搭建方法,看这一篇就够啦,给出一个完全分布式hadoop+spark集群搭建完整文档,从环境准备(包括机器名,ip映射步骤,ssh免密,Java等)开始,包括zookeeper,hadoop,hive,spark,...

    IoT DC3 是一个基于 Spring Cloud 的 100% 完全开源的、分布式的物联网(IoT)平台,用于快速开发物联网

    容错:没有单点故障弱,集群中的每个节点是相同的; 健壮和高效:单一服务器节点可以处理甚至数百成千上万的设备根据用例; 可定制:添加新的设备协议,并注册到服务中心; 跨平台:使用 Java 环境可异地、分布式多...

    Redis 集群解决方案 Codis.zip

    Codis 是一个分布式 Redis 解决方案, 对于上层的应用来说, 连接到 Codis Proxy 和连接原生的 Redis Server 没有明显的区别 (不支持的命令列表), 上层应用可以像使用单机的 Redis 一样使用, Codis 底层会处理请求的...

    集群好书《高性能Linux服务器构建实战》 试读章节下载

    12.3.1 分布式集群管理器(CMAN) 12.3.2 锁管理(DLM) 12.3.3 配置文件管理(CCS) 12.3.4 栅设备(Fence) 12.3.5 高可用性服务管理器 12.3.6 集群配置和管理工具 12.3.7 Redhat GFS 12.4 安装...

    Linux下Nutch分布式配置和使用.rar

    这是本人在完全分布式环境下在Cent-OS中配置Nutch-1.1时的总结文档,但该文档适合所有Linux系统和目前各版本的nutch。 目 录 介绍 ............................................................... 2 0 集群...

    nosql cassandra学习教程

    以Amazon专有的完全分布式的Dynamo为基础,结合了Google BigTable基于列族(Column Family)的数据模型。P2P去中心化的存储。很多方面都可以称之为Dynamo 2.0。 功能  Cassandra的主要特点就是它不是一个数据库,...

    Java高并发高性能分布式框架从无到有微服务架构设计.doc

    还有CDN就是用来加速 用户访问的:即用户首先访问到全国各地的CDN节点(使用如ATS、Squid实现),如果C DN没命中,会回源到中央nginx集群,该集群如果没有命中缓存(该集群的缓存不是必须 的,要根据实际命中情况等...

    fourinone-3.04.25

    我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为...

    漫谈大数据第四期-storm

    Storm有一个“本地模式”,可以在处理过程中完全模拟Storm集群。这让你可以快速进行开发和单元测试。 Storm集群由一个主节点和多个工作节点组成。主节点运行了一个名为“Nimbus”的守护进程,用于分配代码、布置任务...

    新版Hadoop视频教程 段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发

    第五天 hadoop2.x中HA机制的原理和全分布式集群安装部署及维护 01-zookeeper.avi 02-zookeeper2.avi 03-NN高可用方案的要点1.avi 04-hadoop-HA机制的配置文件.avi 05-hadoop分布式集群HA模式部署.avi 06-hdfs...

    共享分布式基础架构上的拓扑感知局部虚拟集群映射算法

    新型的虚拟化HPC中心在共享的分布式基础架构上提供隔离和可配置的虚拟集群(VC),作为并行和分布式应用程序的执行环境。 这些VC通常是在运行时针对每个作业进行定制和部署的。 为VC分配物理资源称为虚拟群集映射...

    hadoop 1.2.1 api 最新chm 伪中文版

    Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。 一个Map/Reduce 作业(job) 通常会把输入的...

    maestro-java:Maestro分布式性能测试工具

    作为主要用于大规模性能测试执行和自动化的分布式性能测试工具,Maestro默认情况下专注于多节点部署。 尽管如此,完全有可能在单个节点上运行Maestro,并简化了默认情况下随代码提供的实用程序。 有两种方法可以...

Global site tag (gtag.js) - Google Analytics