hadoop121与habase分布式搭建.docx

资源描述

hadoop121与habase分布式搭建.docx

《hadoop121与habase分布式搭建.docx》由会员分享，可在线阅读，更多相关《hadoop121与habase分布式搭建.docx（25页珍藏版）》请在冰豆网上搜索。

hadoop121与habase分布式搭建.docx

hadoop121与habase分布式搭建

Hadoop与habase分布式搭建

1、搭建环境

本次搭建环境：

CentOS6.564位+JDK1.7+hadoop-1.2.1+zookeeper-3.4.5+hbase-0.94.20+hive-0.12.0+sqoop-1.4.4.bin__hadoop-1.0.0.tar.gz

2、搭建环境软件下载地址

Centos6.5:

http:

//mirror.centos.org/centos/6.5/isos/x86_64/CentOS-6.5-x86_64-bin-DVD1to2.torrent

系统安装参考文档：

Jdk1.7下载地址:

Hadoop下载地址：

Zookeeper下载地址：

Hbase下载地址：

Hive下载地址:

3、安装系统

Centos6.5系统安装略

Ip配置：

vi/etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE=eth0#物理设备名

IPADDR=10.190.200.180#IP地址

NETMASK=255.0.0.0#掩码值

NETWORK=192.168.1.0#网络地址（可不要）

BROADCAST=10.190.200.255#广播地址（可不要）

GATEWAY=10.190.200.1#网关地址

ONBOOT=yes#[yes|no]（引导时是否激活设备）

USERCTL=no#[yes|no]（非root用户是否可以控制该设备）

HWADDR=00:

1B:

78:

38:

FF:

TYPE=Ethernet

UUID=088c53ce-94c9-4c48-86fc-109d817c3ff3

NM_CONTROLLED=yes

DNS1=61.139.2.69

DNS2=8.8.8.8

IPV6INIT=yes

IPV6_AUTOCONF=yes

重启网络配置

Servicenetworkrestart

静止使用IP6

serviceip6tablesstop#停止IPV6服务

chkconfigip6tablesoff#禁止IPV6开机启动

配置网络主机名

vi/etc/sysconfig/network#编辑配置文件

Vi/etc/hosts

4、安装wget

yum-yinstallwget

5、安装JDK

输入命令java-version查看是否默认已经安装jdk

如果默认已经安装jdk，则卸载自带版本

Rpm-qa|grepjdk查看默认版本

yumremovejava-1.6.0-openjdk-devel-1.6.0.0-1.45.1.11.1.el6.x86_64（删除java-1.6.0-openjdk-devel-1.6.0.0-1.45.1.11.1.el6.x86_64）

在home下创建java目录

Mkdir/home/java

进入/home/java

Cd/home/java

下载jdk

Wget

解压jdk

tarzxvfjdk-7u60-linux-x64.tar.gz

配置jdk环境变量

Vi/etc/profile

新增如下内容：

#setjavaenvironment

exportJAVA_HOME=/home/java/jdk1.7.0_60

exportJRE_HOME=$JAVA_HOME/jre

exportCLASSPATH=.:

$JAVA_HOME/lib:

$JAVA_HOME/jre/lib:

$CLASSPATH

exportPATH=$JAVA_HOME/bin:

$PATH

重启/etc/profile

Source/etc/profile

6、配置master和slave

机器名

作用

master

10.20.200.217

Namenode、master、jobtracker

slave1

10.20.200.217

Datanode、slave、tasktracker

Slave2

10.20.200.217

Datanode、slave、tasktracker

修改各服务器的/etc/hosts配置

vi/etc/hosts

内容为：

10.20.200.217mastermaster

10.20.200.217slave1slave1

10.20.200.217slave2slave2

修改各服务器/etc/sysconfig/network

vi/etc/sysconfig/network

内容为：

NETWORKING=yes

HOSTNAME=master（master为各服务器名称master/slave1/slave2）

7、配置无密码ssh

查看有没有安装openssh-clients

Rpm-qa|grepopenssh-clients

如果没有就安装

yum-yinstallopenssh-clients

创建hadoop文件夹

Mkdir/usr/hadoop

把hadoop文件夹下配置ssh无密码登陆

ssh-keygen-trsa-f~/.ssh/id_rsa这里会提示输入passphrase，一定不要输入任何字符，回车即可

cat~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys

测试ssh

sshlocalhost

如果还是提示需要输入密码,请修改：

chmod600~/.ssh/authorized_keys

还可以用rsa认证方式：

使用root登陆所有机器后，所有的机器都创建hadoop用户。

使用以下命令：

useraddhadoop--创建hadoop用户

passwdhadoop--设置hadoop用户密码

把/home/hadoop中hadoop文件夹授权给hadoop账号，首先到/home目录命令：

cd/home

授权命令：

chown -R hadoop.hadoop hadoop/

用root账户登陆所有节点，修改linux系统安全配置。

命令:

vi/etc/selinux/config按键盘小写i进行编辑，设置SELINUX=disabled

按键盘Esc退出编辑，输入命令：

wq保存退出文件

用hadoop账号登陆master，进入hadoop文件夹，命令:

cd/hadoop

生成其无密码秘钥对，命令：

ssh-keygen-trsa-P''

对/home/hadoop/.ssh的.ssh文件夹授权，命令：

chmod755~/.ssh

在master节点进入.ssh目录，命令：

cd.ssh

执行把id_rsa.pub追加到授权key里面命令：

cat/home/hadoop/.ssh/id_rsa.pub>>/home/hadoop/.ssh/authorized_keys

用root账号登陆master节点，进入.ssh目录，命令：

cd/home/hadoop/.ssh

安全设置，会让RSA功能生效，命令：

chmod644/home/hadoop/.ssh/authorized_keys（备注：

如果不进行设置，在验证时，仍提示你输入密码。

）

用root用户登录master修改SSH配置文件"/etc/ssh/sshd_config"的下列内容。

RSAAuthenticationyes#启用RSA认证

PubkeyAuthenticationyes#启用公钥私钥配对认证方式

AuthorizedKeysFile.ssh/authorized_keys#公钥文件路径（和上面生成的文件同）

命令：

vi/etc/ssh/sshd_config

按键盘小写的i进入编辑，对照上面的配置进行编辑，编辑完成后按键盘Esc退出编辑，然后数据命令：

wq退出保存文件

重启ssh,使其配置生效，命令：

servicesshdrestart

验证是否是无密码登陆，命令：

suhadoop

命令：

cd/home/hadoop

命令：

sshlocalhost

效果如下图：

把公钥从master节点复制所有的Slave机器上，

复制到192.168.1.27命令：

scp/home/hadoop/.ssh/id_rsa.pubhadoop@192.168.1.27:

/home/hadoop/.ssh/

复制到192.168.1.26命令：

scp/home/hadoop/.ssh/id_rsa.pubhadoop@192.168.1.26:

/home/hadoop/.ssh/

复制到192.168.1.25命令：

scp/home/hadoop/.ssh/id_rsa.pubhadoop@192.168.1.25:

/home/hadoop/.ssh/

用hadoop账号登陆各slave节点把Master.Hadoop的公钥追加到各个slave.Hadoop的授权文件"authorized_keys"中去，命令：

cat/home/hadoop/.ssh/id_rsa.pub>>/home/hadoop/.ssh/authorized_keys

追加并修改"authorized_keys"文件权限，命令：

chmod644/home/hadoop/.ssh/authorized_keys

把所有节点下的"/home/hadoop/.ssh"目录下的"id_rsa.pub"文件删除掉。

命令：

rm/home/hadoop/.ssh/id_rsa.pub-rf

退出所有slave节点hadoop登陆，命令：

exit

用root用户在各个slave节点上修改SSH配置文件"/etc/ssh/sshd_config"的下列内容。

RSAAuthenticationyes#启用RSA认证

PubkeyAuthenticationyes#启用公钥私钥配对认证方式

AuthorizedKeysFile.ssh/authorized_keys#公钥文件路径（和上面生成的文件同）

命令：

vi/etc/ssh/sshd_config

按键盘小写的i进入编辑，对照上面的配置进行编辑，编辑完成后按键盘Esc退出编辑，然后数据命令：

wq退出保存文件

重启ssh,使其配置生效，命令：

servicesshdrestart

用hadoop账号所有slave节点，进入hadoop文件夹，命令:

cd/home/hadoop

生成其无密码秘钥对，命令：

ssh-keygen-trsa-P''

执行把id_rsa.pub追加到授权key里面命令：

cat/home/hadoop/.ssh/id_rsa.pub>>/home/hadoop/.ssh/authorized_keys

把所有slave数据节点的秘钥分别（注意：

要一个配置完成后，删除拷贝到master节点上的id_rsa.pub文件后，再继续下一个）拷贝到master节点，命令：

scp/home/hadoop/.ssh/id_rsa.pubhadoop@192.168.1.28:

/home/hadoop/

用hadoop账号登陆master节点，把slave数据节点的秘钥追加到master的授权key里面，命令：

cat/home/hadoop/id_rsa.pub>>/home/hadoop/.ssh/authorized_keys

删除id_rsa.pub文件，直到把所有slave数据节点的秘钥追加到master节点为止：

删除id_rsa.pub文件命令：

rm/home/hadoop/id_rsa.pub

8、安装hadoop

进入hadoop文件夹

Cd/usr/hadoop

下载hadoop

Wget

解压hadoop

tarzxvfhadoop-1.2.1.tar.gz

配置hadoop环境变量

vi/etc/profile

内容为：

#sethadooppath

exportHADOOP_HOME=/usr/hadoop/hadoop-1.2.1

exportPATH=$PATH:

$HADOOP_HOME/bin

重新执行配置文件，命令：

source/etc/profile

创建hadoop运行时的临时目录

Mkdir/usr/hadoop/hadoop-1.2.1/tmp

进入hadoop/conf目录

Cd/user/hadoop/hadoop-1.2.1/conf

修改"/user/hadoop/hadoop-1.2.1/conf/hadoop-env.sh"命令：

vi/usr/hadoop/hadoop-1.2.1/conf/hadoop-env.sh

添加JAVA_HOME,命令:

#setjavaenvironment

exportJAVA_HOME=/home/java/jdk1.7.0_60

修改修改Hadoop核心配置文件core-site.xml，这里配置的是HDFS的地址和端口号

core-site.xml：

fs.default.name

hdfs:

//hadoop.cd.test:

9000

hadoop.tmp.dir

/usr/hadoop/tmp

备注：

如没有配置hadoop.tmp.dir参数，此时系统默认的临时目录为：

/tmp/hadoo-hadoop。

而这个目录在每次重启后都会被干掉，必须重新执行format才行，否则会出错。

修改hdfs-site.xml:

　　dfs.replication

　　dfs.support.append

　　true

　　dfs.permissions

　　false

　　dfs.datanode.max.xcievers

　　4096

备注：

replication第一项设定了文件系统备份的个数，默认为3，salve少于3台就会报错，第二项允许对文件的append操作，是为HBase设置的，第三项关闭权限检查，方便以后的远程的hadoop-eclipse插件访问hdfs，第四项设置DataNode同时可供访问的文件数上限，由于HBase需要同时操作大量的文件，该项至少要设置为4096。

修改Hadoop中MapReduce的配置文件，配置的是JobTracker的地址和端口。

mapred-site.xml：

mapred.job.tracker

hadoop.cd.test:

9001

配置masters，配置masters文件有两种方案：

一种是修改localhost为Master.Hadoop；另一种是去掉"localhost"，加入Master机器的IP：

192.168.1.28，为保险起见，启用第二种，因为万一忘记配置"/etc/hosts"局域网的DNS失效，这样就会出现意想不到的错误，但是一旦IP配对，网络畅通，就能通过IP找到相应主机。

配置hadoop的master

vimasters

内容为：

192.168.1.28

配置slaves文件（Master主机特有）也有两种方案：

一种是去掉"localhost"，每行只添加一个主机名，把剩余的Slave主机名都填上；另一种是去掉"localhost"，加入集群中所有Slave机器的IP，也是每行一个。

这里采用第二种，原因和添加"masters"文件一样，选择第二种方式。

命令：

vislaves

192.168.1.27

192.168.1.26

用hadoop账号登陆master节点，把hadoop安装及配置拷到各Slave节点，命令：

Scp-r/usr/hadoop/hadoop-1.2.1/hadoop@192.168.1.27:

/usr/hadoop/hadoop-1.2.1/

scp-r/usr/hadoop/hadoop-1.2.1/hadoop@192.168.1.26:

/usr/hadoop/hadoop-1.2.1/

格式化，命令：

./bin/hadoopnamenode–format

启用hadoop，命令：

./bin/start-all.sh

9、安装zookeeper

登陆master节点,在hadoop目录下创建zookeeper目录

Cd/usr/hadoop/hadoop-1.2.1

mkdirzookeeper

进入zookeeper目录

cdzookeeper/

下载zookeeper-3.4.5.tar.gz

wget

在zookeeper目录下创建zookeeper日志文件目录，命令：

mkdir/usr/hadoop/hadoop-1.2.1/zookeeper/zookeeper-3.4.5/data

mkdir/usr/hadoop/hadoop-1.2.1/zookeeper/zookeeper-3.4.5/logs

解压zookeeper-3.4.5.tar.gz，命令:

tarzxvfzookeeper-3.4.5.tar.gz

解压后，将conf目录下的zoo-example.cfg文件重命名为zoo.cfg,命令：

cdzookeeper-3.4.5/conf/

mvzoo-example.cfgzoo.cfg

#新建myid文件

~echo"1">/home/conan/zoo/zk1/myid

新建myid文件

Echo“1”/usr/hadoop/hadoop-1.2.1/zookeeper/zookeeper-3.4.5/data/myid

修改配置文件，命令;vizookeeper-3.4.5/conf/zoo.cfg

dataDir=/usr/hadoop/hadoop-1.2.1/zookeeper/zookeeper-3.4.5/data

dataLogDir=/usr/hadoop/hadoop-1.2.1/zookeeper/zookeeper-3.4.5/logs

server.1=10.20.200.217:

2888:

3888

server.2=10.20.200.217:

2888:

3888

dataDir默认在/tmp下，系统重启会导致数据丢失。

后面的三行在文件的末尾，每行描述一个节点。

然后将配置好的Zookeeper分发到server.1/2/3上的/usr/hadoop/hadoop-1.2.1/zookeeper/zookeeprt-3.4.5下，并在每一个节点的dataDir，即/usr/hadoop/hadoop-1.2.1/zookeeper/data下创建一个myid文件，其中包含一个该节点对应的数字，即server.1/2/3中'.'后面的数字，该数字应该在1-255之间。

把master节点配置好的zookeeper拷贝到所有slave节点，命令：

scp-r/usr/hadoop/hadoop-1.2.1/zookeeper/*hadoop@192.168.1.27:

/usr/hadoop/hadoop-1.2.1/zookeeper/

scp-r/usr/hadoop/hadoop-1.2.1/zookeeper/*hadoop@192.168.1.26:

/usr/hadoop/hadoop-1.2.1/zookeeper/

在各个slave节点的启动zookeeper，命令：

./zookeeper-3.4.5/bin/zkServer.shstart

查看各个slave节点zookeeper状态，命令：

./zookeeper-3.4.3/bin/zkServer.shstatus

停止zookeeper，命令：

./zookeeper-3.4.5/bin/zkServer.shstop

10、安装hbase

登陆master服务器，创建hbase目录

Cd/usr/hadoop/hadoop-1.2.1

mkdirhbase

进入hbase

展开阅读全文