Hadoop的偽分散式的安裝及部署

阿新 • • 發佈：2018-11-10

文章目錄

需要的軟體及原始碼包
安裝JDK
Hadoop的部署安裝
Hadoop的配置
Hadoop的使用

做Hadoop的偽分散式我們分為一下幾個步驟

需要的軟體及原始碼包

FileZilla ——（https://filezilla-project.org）
SecureCRT ——（https://download.csdn.net/download/xujingran/10775969）
jdk-7u80-linux-x64.gz ——（https://download.csdn.net/download/xujingran/10775975

）
hadoop-2.6.0.tar.gz（[http://archive.apache.org/dist/hadoop/core ）

安裝JDK

下載完成JDK和Hadoop的原始碼包
利用FileZilla把檔案複製到/root資料夾下
配置JDK，在/usr下建立Java安裝資料夾

   	 mkdir /usr/java

執行ls命令，檢視檔案是否存在，
解壓jdk-7u80-linux-x64.gz到本地的/usr/java

	 tar -zxvf jdk-7u80-linux-x64.gz -C /usr/java

進入cd /usr/java

執行ls命令檢視是否安裝成功並修改環境變數

和Windows裡安裝完JDK進行計算機—>屬性—>高階屬性—>環境變數的步驟一樣

	1.vim /etc/profile 
	2.在unset -f pathmunge後面（也就是在最後一行後面）加入
		export JAVA_HOME=/usr/java/jdk1.7.0_80（需要和上面安裝的版本相同）
		export PATH=$PATH:$JAVA_HOME/bin

修改完成後不會立即生效，需要執行source命令來讓它生效。

	source / 
etc/profile

輸入java會有回顯資訊，輸入java- version命令會有版本的顯示則表示JDK安裝成功
輸入jps會有jps的顯示，若沒有則需要配置並安裝yum源，配置方法檢視https://blog.csdn.net/xujingran/article/details/83905273
配置完yum源執行 yum grep|list openjdk來查詢java包，找到後執行 yum install java-1.7.0-openjdk-devel.x86_64來安裝java包

Hadoop的部署安裝

進入/root，執行ls檢視是否有hadoop的檔案
執行tar -zxvf hadoop-2.6.0.tar.gz -C /usr/local（將hadoop-2.6.0.tar.gz解壓到/usr/local）
執行ls檢視是否有這個檔案，並執行mv hadoop-2.6.0/ hadoop（注意空格將名字改為hadoop）
進入cd /usr/local/hadoop/，輸入vim ~/.bashrc（編輯~/.bashrc檔案）
配置hadoop的環境變數

與前面配置的JDK的環境變數不同


    在alias rm=”rm -i”前面加入需要的變數資訊
    export JAVA_HOME=/usr
    export PATH=/usr/local/hadoop/bin/:/usr/local/hadoop/sbin/:$PATH
    export HADOOP_HOME=/usr/local/hadoop
    export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

修改完成後不會立即生效，需要執行source命令來讓它生效。

	source ~/.bashrc

（1）輸入echo $JAVA_HOME來檢驗變數值，
（2）輸入java -version檢視java是否配置成功
（3）輸入hadoop version檢視hadoop是否可用，不可用需要檢查配置檔案是否正確

Hadoop的配置

我們做的都是在一臺虛擬機器裡做的實驗，所以我們是做的偽分散式的實驗，偽分散式的實驗是需要修改兩個檔案，core-site.xml和hdfs-site.xml，這兩個檔案都是位於/usr/local/hadoop/etc/hadoop資料夾下

（1）修改core-site.xml檔案


    <configuration>
   		 <property>
    		<name>hadoop.tmp.dir</name>
    		<value>file:/usr/local/hadoop/tmp</value>
    		<description>Abase for other temporary directories.</description>
    	</property>
    	<property>
    		<name>fs.defaultFS</name>
    		<value>hdfs://localhost:9000</value>
    	</property>
    </configuration>

（2）修改hdfs-site.xml檔案

    <configuration>
   		 <property>
    		<name>dfs.replication</name>
    		<value>1</value>
    	</property>
    	<property>
    		<name>dfs.namenode.name.dir</name>
    		<value>file:/usr/local/hadoop/tmp/dfs/name</value>
    	</property>
    	<property>
    		<name>dfs.datanode.data.dir</name>
    		<value>file:/usr/local/hadoop/tmp/dfs/data</value>
    	</property>
    </configuration>

將NameNode格式化，執行hdfs namenode -format命令
如果顯示successfully formatted或者Exitting with status 0則顯示配置成功，如果顯示Exitting with status 1則配置失敗（不同版本的hadoop顯示會有不同，請大家注意一下）
接下來要開啟NameNode程序和DataNode程序，命令為：start-dfs.sh（此時需要輸入三次密碼）。
輸入jps命令，如果有jps，SecondaryNameNode，NameNode，DataNode則說明配置成功。
若沒有SecondaryNameNode，需要stop-dfs.sh關閉程序重新開啟，
如果沒有NameNode，DataNode，則需要檢查前面的檔案是否有配置錯誤
成功啟動後在瀏覽器的web介面輸入http://localhost:50070，此時會彈出分散式檔案系統的提示介面。

Hadoop的使用

在命令列輸入hdfs dfs –mkdir –p /usr/hadoop建立目錄，執行完成後去web頁面的utilities頁面去驗證是否成功
輸入

 ./bin/hdfs dfs –mkdir –p input./bin/hdfs dfs –mkdir –p input
 ./bin/hdfs dfs –put /etc/hadoop/*.xml input

將hadoop資料夾下的所有.xml檔案上傳到分散式檔案系統，進入web頁面的utilities頁面去驗證是否成功

輸入

  mkdir ./output
./bin/hdfs dfs –get hdfs-site.xml ./output

  cat ./output/ hdfs-site.xml

在分散式檔案系統中下載hdfs-site.xml 到output資料夾）進入output資料夾下執行ls檢視是否成功。

實驗結束。

hadoop 偽分散式安裝

0. 關閉防火牆重啟後失效 service iptables start ;#立即開啟防火牆，但是重啟後失效。 service iptables stop ;#立即關閉防火牆，但是重啟後失效。重啟後生效 chkconfig iptables on ;#開啟防火牆，重啟後生效 chkconfig

Hadoop的偽分散式的安裝及部署

文章目錄需要的軟體及原始碼包安裝JDK Hadoop的部署安裝 Hadoop的配置 Hadoop的使用做Hadoop的偽分散式我們分為一下幾個步驟需要的軟體及原始碼包 FileZil

5.大資料學習之旅——hadoop-簡介及偽分散式安裝

Hadoop簡介是Apache的頂級專案，是一個可靠的、可擴充套件的、支援分散式計算的開源專案。起源創始人：Doug Cutting 和Mike 2004 Doug和Mike建立了Nutch - 利用通用爬蟲爬取了網際網路上的所有數據，獲取了10億個網頁資料 - 1

java大資料最全課程學習筆記(1)--Hadoop簡介和安裝及偽分散式

> 目前[CSDN](https://blog.csdn.net/weixin_42208775),[部落格園](https://home.cnblogs.com/u/gitBook/),[簡書](https://www.jianshu.com/u/da41700fde04)同步發表中,更多精彩歡迎訪問

linux下安裝hadoop偽分散式叢集

1. 在虛擬機器上安裝了centos7，下載hadoop。http://hadoop.apache.org/releases.html 這裡選擇2.7版本而不是3.0版本不選3.0版本的理由，檢視版本更新日誌

Hadoop偽分散式環境搭建之Linux作業系統安裝

Hadoop偽分散式環境搭建之Linux作業系統安裝本篇文章是接上一篇《超詳細hadoop虛擬機器安裝教程（附圖文步驟）》，上一篇有人問怎麼沒寫hadoop安裝。在文章開頭就已經說明了，hadoop安裝會在後面寫到，因為整個系列的文章涉及到每一步的截圖，導致文章整體很長。會分別先對虛擬機器

Hadoop單機式偽分散式安裝詳解

Ubuntu、centos7、6叢集搭建：https://blog.csdn.net/qq_40938267/article/details/83476896 遇到的問題以及解決方法： 1.在./bin/hdfs namenode –format時載入不出class 檢視配置的

偽分散式安裝Hadoop

Hadoop簡單介紹 Hadoop：適合大資料分散式儲存與計算的平臺。 Hadoop兩大核心專案： 1、HDFS：Hadoop分散式檔案系統　　HDFS的架構：主從結構：　　　　　　　　　　主節點，只有一個：namenode 　　　　　　　　　　　　　　　　　　　　　　1、接收

hadoop偽分散式元件安裝

一、版本建議 Centos V7.5 Java V1.8 Hadoop V2.7.6 Hive V2.3.3

Hadoop偽分散式的安裝!!

軟江的安裝目錄: /opt/modules/ 安裝前的準備 1、關閉和禁用SELinux # systemctl stop firewalld # service iptables stop # vim /etc/sysconfig/selinux 設定SELIN

hadoop在centos系統上的偽分散式安裝

建立hadoop使用者建立hadoop使用者可以使不同使用者之間有明確的許可權區別，也可使針對hadoop的配置操作不影響其他使用者的使用。 >>su root //切換到超級系統管理員,需要輸入密碼 >>useradd -

單點偽分散式安裝HADOOP

安裝建立檔案儲存目錄先切換到hadoopAdmin，然後建立資料夾儲存Hadoop的臨時檔案 $su hadoopAdmin $sudo mkdir -p /app/hadoop/tmp $sudo mkdir -p /app/hadoop/data/na

CentOS7環境下偽分散式安裝配置hadoop

(一) 設定靜態IP地址 cd /etc/sysconfig/network-scripts vim ifcfg-ens33 修改IPADDR,NETMASK,GATEWAY為對應的值修改BOOTPROTO為none 儲存並退出重啟網絡卡 servi

hadoop偽分散式叢集搭建及配置記錄

如果已經走到了需要搭建hadoop偽分散式的環境了，那說明你至少做好了以下三點建立好了自己的虛擬機器，ip、本機名對映、防火牆、安全子系統都已經配置好了下載jdk1.7及以上版本，並配置好了java環境下載hadoop2.7.0及以上版本，並解壓到、opt/modules（自

安裝Hadoop偽分散式踩過的坑

折騰了好幾天的問題，終於解決了。雖然這次遇到的問題沒在網路上找到答案，不過，解決問題的過程或多或少受到了網上一些答案的啟發。下面我將分享自己遇到的問題，並提供解決方法。（一）、相關資料 http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html　　#官

Hadoop偽分散式模式安裝

環境資訊作業系統：Ubuntu 17.04 64bit安裝步驟1. 安裝配置JDK1.1 複製到/opt/bigdata/目錄下，解壓cp ~/Downloads/jdk-8u161-linux-x64.tar.gz /opt/bigdata/ cd /opt/bigdata

Hadoop 2.7 偽分散式安裝配置 Error: JAVA_HOME is not set and could not be found.

問題：如果你明明安裝配置了 JAVA_HOME 卻還是報錯如果遇到 Error: JAVA_HOME is not set and could not be found. 的錯誤，而你明

大資料平臺入門--hadoop虛擬機器偽分散式安裝

裡面我遇到的幾個問題： 1、因為沒有配置主機名，所以文中所有涉及到配置主機名的地方“bigdata-senior01.chybinmy.com”均應修改成“localhost”，否則啟動namenode的時候會報錯： Failed to start namenode.

hadoop偽分散式下無法啟動datanode的原因及could only be replicated to > 0 nodes, instead of 1的錯誤

目前發現一個原因是因為datanode無法啟動從而導致在hadoop上 put資料出現 could only be replicated to > 0 nodes, instead of 1的錯誤。輸入jps發現唯獨只有datanode程序沒有起來。所以我們要想

mac安裝hadoop偽分散式

目錄一、下載jdk 二、配置hadoop 三、配置ssh，無密碼登入四、啟動hadoop 五、環境配置 java version "1.8.0" Java(TM) SE Runtime Environment (build 1.

Hadoop的偽分散式的安裝及部署

文章目錄

需要的軟體及原始碼包

安裝JDK

Hadoop的部署安裝

Hadoop的配置

Hadoop的使用

相關推薦