linux hadoop完全分散式叢集搭建圖文詳解

阿新 • • 發佈：2018-12-31

一.前期準備

1.1 Win7官網下載hadoop包

本文使用版本hadoop-2.6.5.tar.gz

1.2 配置jdk

1.3 centos7叢集伺服器

主機名    系統          IP地址
master    centos7    192.168.32.128
slave01   centos7    192.168.32.131
slave02   centos7     192.168.32.132

1.4 多伺服器ssh免密碼登陸

由於Hadoop啟動以後，namenode是通過SSH（Secure Shell）來啟動和停止各個節點上的各種守護程序的，這就需要在節點之間執行指令的時候是不需要輸入密碼的方式，故我們需要配置SSH使用無密碼公鑰認證的方式。

1.5 叢集伺服器名稱配置

本文預設使用root使用者登入，未新建hadoop專用登入名。

1.5.1 配置各個伺服器ip地址對應的別名

vi /etc/hosts
#配置ip對應名
192.168.32.128 master
192.168.32.131 slave01
192.168.32.132 slave02

ip別名配置

1.5.2 本地主機名配置

vi /etc/hostname
master

本地主機名稱

三臺伺服器依次修改，並重啟。

二.hadoop完全分散式叢集搭建

以下操作只針對master主機伺服器，其他主機伺服器類似。

2.1 上傳hadoop包至 /opt/software目錄

2.2 解壓和拷貝hadoop至 /usr/local/hadoop

cd /opt/software
tar -zxvf hadoop-2.6.5.tar.gz
cp -r hadoop-2.6.5 /usr/local/hadoop

hadoop解壓和拷貝

hadoop解壓和拷貝完成

三.hadoop完全分散式叢集配置

3.1 系統檔案profile配置

配置系統環境變數

vi /etc/profile
#hadoop
export HADOOP_HOME=/usr/local/hadoop
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

系統環境配置

退出儲存，重啟配置

source /etc/profile

3.2 hadoop-env.sh檔案配置

cd /usr/local/hadoop/etc/hadoop

vi hadoop-env.sh
#export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/usr/local/jdk
export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_HOME}/lib/native
export HADOOP_OPTS="-Djava.library.path=${HADOOP_HOME}/lib/native/"

退出儲存

hadoop-env.sh環境配置

3.3 新增namenode和datanode存放，臨時目錄tmp

定位：

cd /usr/local/hadoop
mkdir -p dfs/data
mkdir -p dfs/name
mkdir -p tmp

新建目錄

3.4 修改hdfs-site.xml檔案

vi hdfs-site.xml

<configuration>
<property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>master:50090</value>
        </property>
        <property>
                <name>dfs.replication</name>
                <value>3</value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/usr/local/hadoop/dfs/name</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/usr/local/hadoop/dfs/data</value>
        </property>
</configuration>

hdfs-site.xml檔案

3.5 修改core-site.xml檔案

vi core-site.xml

<configuration>
<property>
   <name>fs.defaultFS</name>
   <value>hdfs://master:9000</value>
</property>
<property>
   <name>hadoop.tmp.dir</name>
   <value>/usr/local/hadoop/tmp</value>
</property>
</configuration>

core-site.xml檔案

3.6 修改mapred-site.xml檔案

目錄預設只有mapred-site.xml.template檔案，複製生成mapred-site.xml檔案

cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

<configuration>
<property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>

mapred-site.xml檔案

3.7 修改yarn-site.xml檔案

vi yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
<property>
                <name>yarn.resourcemanager.hostname</name>
                <value>master</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
</configuration>

yarn-site.xml檔案

3.8 修改slaves檔案

vi slaves

slaves檔案

3.9 slave01和slave02伺服器修改

3.9.1 hadoop檔案複製

複製master中hadoop檔案到slave01和slave02伺服器的/usr/local目錄

scp -r /usr/local/hadoop [email protected]:/usr/local/hadoop
scp -r /usr/local/hadoop [email protected]:/usr/local/hadoop

3.9.2 系統環境profile配置

類似3.2 分別在salve01和slave02配置系統環境

3.9.3 目錄檔案新建

類似3.3 分別在slave01和slave02新建檔案目錄

3.9.4 配置檔案修改

修改core-site.xml檔案

將fs.defaultFs對應的value中master修改slave02

core-site.xml檔案

salve01修改類似。

四.hadoop叢集測試

4.1 測試命令

#啟動
start-all.sh start
#停止
stop-all.sh start
#格式化節點
hadoop namenode -format
或者hdfs namenode -format

4.2 叢集測試

在master伺服器執行啟動命令

進入/usr/local/hadoop目錄

4.2.1 格式化namenode

4.2.2 啟動各個節點

sbin/start-all.sh start

start-all.sh啟動所有節點

4.2.3 檢視節點狀態

jps檢視節點程序

master程序

slave程序

檢視節點狀態

http://192.168.32.128:50070/dfshealth.html#tab-overview

節點狀態

叢集節點使用

http://192.168.32.128:8088/cluster/nodes

叢集節點使用

至此，hadoop完成分散式叢集搭建完畢。

linux hadoop完全分散式叢集搭建圖文詳解

一.前期準備 1.1 Win7官網下載hadoop包本文使用版本hadoop-2.6.5.tar.gz 1.2 配置jdk 1.3 centos7叢集伺服器主機名系統

史上最簡單詳細的Hadoop完全分散式叢集搭建

一.安裝虛擬機器環境 Vmware12中文官方版連結：https://pan.baidu.com/s/1IGKVfaOtcFMFXNLHUQp41w 提取碼：6rep 啟用祕鑰：MA491-6NL5Q-AZAM0-ZH0N2-AAJ5A 這個安裝就十分的簡單了，只需要不斷點選下

大資料學習系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive叢集搭建圖文詳解

引言在之前的大資料學習系列中，搭建了Hadoop+Spark+HBase+Hive 環境以及一些測試。其實要說的話，我開始學習大資料的時候，搭建的就是叢集，並不是單機模式和偽分散式。至於為什麼先寫單機的搭建，是因為作為個人學習的話，單機已足以，好吧，

hadoop完全分散式叢集搭建全部流程之四：ssh和指令碼補充

SSH無密碼登入 1）配置ssh：配置ssh無密碼登入主要是為了方便叢集之間進行通訊，方便運算。（1）基本語法 ssh 另一臺電腦的ip地址（2）ssh連線時出現Host key verif

Hadoop完全分散式叢集搭建

Hadoop的執行模式 Hadoop一般有三種執行模式，分別是：單機模式（Standalone Mode），預設情況下，Hadoop即處於該模式，使用本地檔案系統，而不是分散式檔案系統。，用於開發和除錯。偽分散式模式（Pseudo Distrubuted Mode），使用的是分散式檔案系統，守護程序執行

大資料環境搭建之Kafka完全分散式環境搭建步驟詳解

文章目錄環境準備解壓安裝配置檔案服務啟動 1、啟動分散式叢集的zookeeper 2、啟動Kafka服務偽分散式搭建完畢之後，只要稍作修改就

Hadoop完全分散式叢集的搭建

如果前一章的內容你看懂了，那麼請先刪除之前搭建的三個新伺服器重新克隆三個！！！(博主絕對不是故意為之，真的只是忘記了？) Hadoop完全分散式叢集的搭建 1.分散式叢集搭建規劃 2.叢集的配置（許可權問題，命令執行位置問題請自行注意） 2.1

Hadoop-3.1.1完全分散式叢集搭建

一、工作準備 1.虛擬機器安裝Vmware 安裝CentOs虛擬機器三臺 master 192.168.33.101 slave1 192.168.33.102 slave2 192.168.33.103 2.虛擬機器配置

CentOS6.5搭建hadoop完全分散式叢集

搭建完全分散式叢集-------------------------------前提條件：已經按照之前的步驟搭建完偽分散式。https://blog.csdn.net/weixin_42006411/article/details/80500217搭建hadoop偽分散式連結

centos7搭建hadoop完全分散式叢集

搭建步驟 1.安裝centos7，並進行準備工作（可以安裝一個之後然後克隆） 2.修改各個centos7的hostname和hosts 3.建立使用者和使用者組 4.配置centos7網路，是centos7系統之間以及和hosts主機之間可以通過互相ping通

ubuntu18.04 搭建hadoop完全分散式叢集（Master、slave1、slave2）共三個節點

一、硬體配置以及作業系統：所需要的機器以及作業系統：一臺mac os筆記本、一臺window筆記本（CPU雙核四執行緒，記憶體8G），其中mac os用於遠端操作，window筆記本裝有虛擬機器，虛擬出3個ubuntu18.04系統（配置CPU1個執行緒2個，記憶體1.5G，硬碟分配每個7

VM+CentOS+hadoop2.7搭建hadoop完全分散式叢集

寫在前邊的話：最近找了一個雲端計算開發的工作，本以為來了會直接做一些敲程式碼，處理資料的活，沒想到師父給了我一個課題“基於質量資料的大資料分析”，那麼問題來了首先要做的就是搭建這樣一個平臺，毫無疑問，底層採用hadoop叢集，在此之上，進行一些其他元件的安裝和二

hadoop學習第二天~Hadoop2.6.5完全分散式叢集搭建和測試

環境配置：系統 centos7 節點 192.168.1.111 namenode 192.168.1.115 datanode2 192.168.1.116 datanode3 java 環境 :

Hadoop cdh版本分散式叢集搭建圖文教程

有很多想學習大資料的朋友，但苦於找不到系統的學習資料，搭建一個hadoop叢集都要耽擱很多時間。下面我給大家一個搭建大資料的圖文教程。教程中需要用到的軟體和資料我已經準備好了，下面是分享連結，直接下載即可。連結：http://pan.baidu.com/s/1c1PW

阿里雲ECS伺服器部署HADOOP叢集（一）：Hadoop完全分散式叢集環境搭建

準備：兩臺配置CentOS 7.3的阿里雲ECS伺服器； hadoop-2.7.3.tar.gz安裝包； jdk-8u77-linux-x64.tar.gz安裝包； hostname及IP的配置：更改主機名：由於系統為CentOS 7，可以直接使用‘hostnamectl set-hostname 主機

超級無敵詳細使用ubuntu搭建hadoop完全分散式叢集

## 一、軟體準備 1. 安裝VMware 2. 下載ubuntu映象（[阿里源ubuntu下載地址](http://mirrors.aliyun.com/ubuntu-releases/)）選擇自己適合的版本，以下我使用的是18.04-server版就是沒有桌面的。安裝桌面版如果自己電腦配置不行的

【hadoop】hadoop完全分散式叢集安裝

文章目錄前言裝備 Core 總結前言後面準備更新hdfs操作（shell命令版本），hbase，hive的操作。所以這裡先更新一下hadoop叢集安裝。裝備 1.hadoop-2.6.5.tar.gz

大資料之Hadoop學習（環境配置）——Hadoop偽分散式叢集搭建

title: Hadoop偽分散式叢集搭建 date: 2018-11-14 15:17:20 tags: Hadoop categories: 大資料點選檢視我的部落格: Josonlee’s Blog 文章目錄前言準備偽分

一、Hadoop2.x完全分散式叢集搭建

實驗環境規劃 192.168.1.101 cmaster0 192.168.1.102 cslave0 192.168.1.103 cslave1 三臺伺服器都是安裝的CentOS6.8作業系統配置/etc/hosts [[email protected] ~]#

hadoop偽分散式叢集搭建及配置記錄

如果已經走到了需要搭建hadoop偽分散式的環境了，那說明你至少做好了以下三點建立好了自己的虛擬機器，ip、本機名對映、防火牆、安全子系統都已經配置好了下載jdk1.7及以上版本，並配置好了java環境下載hadoop2.7.0及以上版本，並解壓到、opt/modules（自

linux hadoop完全分散式叢集搭建圖文詳解

一.前期準備

1.1 Win7官網下載hadoop包

1.2 配置jdk

1.3 centos7叢集伺服器

1.4 多伺服器ssh免密碼登陸

1.5 叢集伺服器名稱配置

1.5.1 配置各個伺服器ip地址對應的別名

1.5.2 本地主機名配置

二.hadoop完全分散式叢集搭建

2.1 上傳hadoop包至 /opt/software目錄

2.2 解壓和拷貝hadoop至 /usr/local/hadoop

三.hadoop完全分散式叢集配置

3.1 系統檔案profile配置

3.2 hadoop-env.sh檔案配置

3.3 新增namenode和datanode存放，臨時目錄tmp

3.4 修改hdfs-site.xml檔案

3.5 修改core-site.xml檔案

3.6 修改mapred-site.xml檔案

3.7 修改yarn-site.xml檔案

3.8 修改slaves檔案

3.9 slave01和slave02伺服器修改

3.9.1 hadoop檔案複製

3.9.2 系統環境profile配置

3.9.3 目錄檔案新建

3.9.4 配置檔案修改

四.hadoop叢集測試

4.1 測試命令

4.2 叢集測試

4.2.1 格式化namenode

4.2.3 檢視節點狀態

相關推薦