hadoop2.7.3在centos7上部署安装（单机版）

服务近2000家企业，依托一系列实践中打磨过的技术和产品，根据企业的具体业务问题和需求，针对性的提供各行业大数据解决方案。

hadoop2.7.3在centos7上部署安装（单机版）
来源：未知　时间：2018-28-17　浏览次数：342次

hadoop单机版运行环境搭建，相对于分布式版本而言单机版相对简单，适合于初学者学习使用

（1）hadoop2.7.3下载

(前提：先安装java环境)

下载地址：http://hadoop.apache.org/releases.html

（注意是binary文件，source那个是源码）

（2）解压tar.gz 

（3）配置hadoop

1.修改/usr/hadoop/hadoop-2.7.3/etc/hadoop/hadoop-env.sh 文件的java环境，将java安装路径加进去：

[sql] view plain copy

export JAVA_HOME=/alidata/server/java-1.7.0

export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_HOME}/lib/native 

export HADOOP_OPTS="-Djava.library.path=${HADOOP_HOME}/lib/native" 

注意，不加此配置会导致部分hadoop命令运行时找不到native lib

#export HADOOP_ROOT_LOGGER=DEBUG,console //查看hadoop日志，一般报错上语句为报错原因，需要调试时开启

配置hadoop环境变量

vi /etc/profile

[plain] view plain copy

export HADOOP_HOME=/usr/hadoop/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin

有的安装介绍中说是vi ~/.bash_profile，其实也可以用这个，2个命令在不同系统用户的环境配置的作用域不一样。参考：

http://blog.csdn.net/caiwenfeng_for_23/article/details/44242961

使之生效：

[sql] view plain copy

source /etc/profile

2.修改/usr/hadoop/hadoop2.7.3/etc/hadoop/core-site.xml 文件，

[plain] view plain copy

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop/tmp</value>
</property>
</configuration>

fs.defaultFS直接用localhost就行，如果重命名了主机名，也可以用重命名的。

3.修改/usr/hadoop/hadoop2.7.3/etc/hadoop/hdfs-site.xml 

[plain] view plain copy

<configuration>
<property>
<name>dfs.name.dir</name>
<value>/usr/hadoop/hdfs/name</value>
<description>namenode上存储hdfs名字空间元数据 </description>
</property>
<property>
<name>dfs.data.dir</name>
<value>/usr/hadoop/hdfs/data</value>
<description>datanode上数据块的物理存储位置</description>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

4.SSH免密码登录

[plain] view plain copy

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

5.hdfs启动与停止

第一次启动hdfs需要格式化，之后启动就不需要的：

[plain] view plain copy

cd /usr/hadoop/hadoop-2.7.3
./bin/hdfs namenode -format

启动命令：

./sbin/start-dfs.sh

停止命令：

[plain] view plain copy

./sbin/stop-dfs.sh

从图中看，会启动namenode,datanode,secondarynamenode

浏览器输入：http://119.29.174.43:50070     查看效果：

6.接下来配置yarn文件. 配置/usr/hadoop/hadoop-2.7.3/etc/hadoop/mapred-site.xml    。这里注意一下，hadoop里面默认是mapred-site.xml.template 文件，如果配置yarn，把mapred-site.xml.template   重命名为mapred-site.xml 。如果不启动yarn，把重命名还原。

[sql] view plain copy

mv mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

[plain] view plain copy

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

7.配置/usr/hadoop/hadoop-2.7.3/etc/hadoop/yarn-site.xml文件，

[plain] view plain copy

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

8.启动yarn

启动：

[plain] view plain copy

./sbin/start-yarn.sh

停止：

./sbin/stop-yarn.sh

如图：

会启动resourcemanager，nodemanager

可以用jps命令查看启动了什么进程：

浏览器输入：http://119.29.174.43:8088      (8088是默认端口，如果端口占用，先把占用的端口杀掉 netstat -ano)

上一篇: QT客户端开发之创建并使用Qt自定义控件
下一篇: Hadoop之完全分布式环境搭建

hadoop2.7.3在centos7上部署安装（单机版） 来源：未知 时间：2018-28-17 浏览次数：342次

hadoop2.7.3在centos7上部署安装（单机版）
来源：未知　时间：2018-28-17　浏览次数：342次