Hadoop伪分布式搭建

 

6. 初始化namenode

hdfs namenode -format

yarn: 主节点 ResourceManager  

4. 更改mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

找到并更改

<configuration>

         <property>

                   <name>mapreduce.framework.name</name>

                   <value>yarn</value>

        </property>

</configuration>

            从节点 DataNode   SecondaryNameNode

2. 更改core-site.xml

vim core-site.xml

找到并更改以下内容

<configuration>

        <property>

                <name>fs.defaultFS</name>

               <value>hdfs://hadoop:9000</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

               <value>/home/hadoop/hadoopdata</value>

        </property>

</configuration>

tools和training是于定义目录

3. 更改hdfs-site.xml

找到并转以下内容

<configuration>

        <property>

               <name>dfs.namenode.name.dir</name>

             
 <value>/home/hadoop/hadoopdata/tmp/dfs/name</value>

        </property>

        <property>

                 <name>dfs.datanode.data.dir/<name>

               
 <value>/home/hadoop/hadoopdata/tmp/dfs/data</value>

        </property>

       <property>

               <name>dfs.replication/name>

              <value>1/value>

       </property>

</configuration>

  1. 将Hadoop包上传到Linux服务器上,如~/tools目录下图片 1

     

  2. 解压该滑坡包及~/training目录下           
      图片 2

     

  3. 在~/.bash_profile里设置环境变量,增加红色框内容。 vi
    ~/.bash_profile,按 【i】 登编辑模式,按【esc】退出编辑模式,输入冒号:wq回车保存
     图片 3

     

  4. 执行source ~/.bash_profile  使环境变量生效

  5. 布局jdk路径,找到Hadoop的布置文件hadoop-env.sh,vi 
    /root/training/hadoop-2.7.3/etc/hadoop/hadoop-env.sh回车,加入红色部分,JAVA_HOME就是jdk的路径图片 4

     

  6. 接着安排hdfs-site.xml,加入红色框内容

    <!–配置数据块的冗余度–>
    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>

    图片 5

     

  7. 安排core-site.xml,加入如下内容

    <!–配置NameNode地址–>
    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://本机IP:9000</value>
    </property>

    <!–配置数据以Linux上保存的职位–>
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/root/training/hadoop-2.7.3/tmp</value>
    </property>

    图片 6

     

  8. 布置mapred-site.xml,添加如下

    <!–MR运行的框架–>
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>                                         
     图片 7

     

  9. 配置yarn-site.xml,添加如下

    <!–yarn的主节点 RM–>
    <property>
    <name>yarn.resouremanager.hostname</name>
    <value>IP地址</value>
    </property>

    <!–NodeManager运行MR程序方法–>
    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>                               
     图片 8

     

  10. 起步start-all.sh,表示启动所有服务,但发现而输入四潮密码图片 9

     

  11. 悬停所有服务,执行stop-all.sh,也要输入四不善密码,从启动至已服务,一共输入8糟糕密码。如果开行多玉服务器,那怎么不是广大密码图片 10

    伪分布式环境到这个就是搭建配置好。基于输入多次密码,可以配备免密登录,下一致省以会晤教

5. 更改yarn-site.xml

vim yarn-site.xml

<configuration>

         <property>

                   
 <name>yarn.nodemanager.aux-services</name>

                   <value>mapreduce_shuffle</value>

        <property>

                 
<name>yarn.resourcemanager.hostname</name>

                   <value>hadoop</value>

          </property>

           </property>

</configuration>

当单机上模仿分布式环境

  1. 下载jdk

           从节点 NodeManager

1. 更改hadoop-env.sh

vim hadoop-env.sh

找到export JAVA_HOME,更改为友好的JAVA_HOME目录

export JAVA_HOME=/usr/local/java/jdk

HDFS:主节点 NameNode

工具:SecureCRT6.5.0

搭建伪分布式环境,只待一致玉Linux服务器,一般开发测试用

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图