1. 程式人生 > >windows下搭建hadoop工程(一)

windows下搭建hadoop工程(一)

這裡是接著之前的一篇 《hadoop在windows下的環境搭建 》來的~~~

二、啟動hadoop
1、修改hadoop配置檔案,在conf目錄下,修改mapred-site.xml、core-site.xml和hdfs-site.xml三個檔案。
mapred-site.xml

<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>
    </property
>
</configuration>

core-site.xml:

<configuration>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

hdfs-site.xml:

<configuration>
    <property>
        <name
>
dfs.replication</name> <value>1</value> </property> <property> <name>dfs.permissions</name> <value>false</value> </property> </configuration>

在Windows環境下,還需要在hadoop-env.xml中新增

export JAVA_HOME=D:/hadoop/Java/jdk1
.6.0_45

2、設定免密碼登入
由於在使用啟動hadoop和停止hadoop指令碼過程中需要通過ssh傳送命令,因此每次傳送命令都需要輸入密碼進行驗證。
開啟cygwin,進入D:\hadoop\cygwin\zhangmanyi\hadoop-1.0.0\目錄下

ssh –keygen –t rsa

過程中需要輸入儲存id_rsa的檔案,其中需要輸入檔案的位置,如果只輸入檔名,那麼不會儲存到.ssh目錄下。後面需要輸入使用金鑰的密碼,設定為空。
這裡寫圖片描述
進入~/.ssh目錄
這裡寫圖片描述

cat id_rsa.pub >> authorized_keys

這裡寫圖片描述
3、啟動hadoop
進入hadoop安裝目錄
首先格式化HDFS:

bin/hadoop namenode –format

啟動hadoop

bin/start-all.sh
bin/stop-all.sh

前面MapReduce沒有啟動成功是由於datanode沒有啟動起來。
這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

啟動成功。但是這裡點選Browse the filesystem會出現問題:
這裡寫圖片描述
由於網頁轉向的地址用的是hadoop叢集的某一個datanode的主機名,客戶端的瀏覽器無法解析這個主機名,因此該頁無法顯示。
因此需要在客戶端的hosts檔案里加入hadoop叢集的ip地址與對應的主機名,這樣就能解決問題了。(待解決)

三、hadoop eclipse外掛製作
問題1。
這裡寫圖片描述
進入%Hadoop_HOME%\src\contrib\目錄下
編輯build-contrib.xml
加入

<property name="version" value="1.0.0"/>
<property name="eclipse.home" location="D:/hadoop/eclipse"/>

問題2。針對直接編譯程式碼後生成的jar包缺少依賴的lib檔案
這裡寫圖片描述
需要對配置檔案進行修改,包含src/contrib/eclipse-plugin/目錄下的build.xml和META-INF/MANIFEST.MF。
build.xml:
在後面加入:

<copy file="${hadoop.root}/lib/commons-configuration-1.6.jar"  todir="${build.dir}/lib" verbose="true"/>
<copy file="${hadoop.root}/lib/commons-lang-2.4.jar"  todir="${build.dir}/lib" verbose="true"/>
<copy file="${hadoop.root}/lib/jackson-core-asl-1.0.1.jar"  todir="${build.dir}/lib" verbose="true"/>
<copy file="${hadoop.root}/lib/jackson-mapper-asl-1.0.1.jar"  todir="${build.dir}/lib" verbose="true"/>
<copy file="${hadoop.root}/lib/commons-httpclient-3.0.1.jar"  todir="${build.dir}/lib" verbose="true"/>

這裡寫圖片描述

MANIFEST.MF:

Bundle-ClassPath: classes/,lib/hadoop-core.jar,lib/commons-cli-1.2.jar,lib/commons-httpclient-3.0.1.jar,lib/jackson-core-asl-1.0.1.jar,lib/jackson-mapper-asl-1.0.1.jar,lib/commons-configuration-1.6.jar,lib/commons-lang-2.4.jar

問題3。針對hadoop中檔案許可權的問題 Failed to set permissions of path: \tmp\hadoop-zhangmanyi\mapred\staging\zhangmanyi-1980807403.staging to 0700
需要修改src\core\org\apache\hadoop\fs\FileUitl.java
註釋掉三行程式碼:

private static void checkReturnValue(boolean rv, File p, 
                                       FsPermission permission
                                       ) throws IOException {
    if (!rv) {
    //  throw new IOException("Failed to set permissions of path: " + p + 
    //                        " to " + 
    //                        String.format("%04o", permission.toShort()));
    }
}

上面問題都是在實踐中遇到了的,但是問題2在改正並重新編譯後還是不正確,因此選擇重新來,將所有檔案修改好後再進行編譯。

1、 編譯生成eclipse外掛
先在hadoop安裝目錄下,執行命令

ant eclipse

然後在hadoop-1.0.0/src/contrib/eclipse-plugin/目錄下執行命令

ant -Dversion.home=D:\hadoop\eclipse -Dversion=1.0.0

執行成功後會在%Hadoop_HOME%\build\contrib\eclipse-plugin\目錄下生成hadoop-eclipse-plugin-1.0.0.jar檔案。

2、 安裝eclipse外掛
將生成的hadoop-eclipse-plugin-1.0.0.jar複製到eclipse目錄中的plugin資料夾中。
新建java project專案,hadoop-1.0.0,使用jdk為1.6的版本
並在Project——Properties——Java Build Path(右邊選擇Libraries)——Add External JARs
選擇匯入hadoop-eclipse-plugin-1.0.0.jar
工程建立完成

3、 測試安裝
在選單欄中依次單擊windows——show view——other…——MapReduce Tools——Map/Reduce Locations。

這裡寫圖片描述

設定完成後可以顯示hdfs的目錄內容,說明eclipse外掛安裝成功。

這裡寫圖片描述

相關推薦

windows搭建hadoop工程

這裡是接著之前的一篇 《hadoop在windows下的環境搭建 》來的~~~ 二、啟動hadoop 1、修改hadoop配置檔案,在conf目錄下,修改mapred-site.xml、core-site.xml和hdfs-site.xml三個檔案。

從零搭建Hadoop叢集——離線安裝YUM源搭建

概述 Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,簡稱“CDH”),基於Web的使用者管理介面,支援大部分Hadoop元件,包括HDFS、YARN、Hive、 Hbase、Zookeep

AWS上搭建Hadoop叢集——單機安裝Hadoop

課堂專案中實現了在AWS上搭建Hadoop叢集進行資料分析,過程中間不免遇到眾多問題,在此總結以供各位參考。 建立EC2例項 亞馬遜AWS服務想必大家都有所瞭解,這裡略過註冊過程(為了拿student credit還是花了一番功夫)。在EC2的介面上,

團隊合作---使用Gitblit在Windows搭建Git ServerHTTP

用過Git之後再使用Svn是很頭疼的事情 於是就讓向老大要了一塊Windows伺服器的地址空間,來搭建Git Server 一、下載Gitblit 二、下載完解壓 (1)解壓之後我的gitblit檔案的路徑: D:\gitblitserver\gitb

windows搭建Git伺服器

以下兩篇文章是在安裝Git伺服器時借鑑的文章,不錯,轉載在此: 1、所需的軟體下載及安裝 所需工具下載地址: 若只要使用git,只需要安裝msysgit就行了。copssh是一個ssh伺服器軟體。 msysgit的安裝: 我把安裝中關鍵的幾步截圖說明,其餘直接點

WindowsGit的用法

時間 and 過程 directory https 倉庫 clean img car 準備: 第一步:下載Git 註意:除非想改變安裝目錄,否則安裝過程一直默認下一步即可。 第二步:新建文件夾,如新建一個 learngit 文件夾 第三步:右鍵 learngit 文件

Windows配置Hadoop環境全過程

首先到官方下載官網的hadoop2.7.7,連結如下 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 找網盤的hadooponwindows-master.zip 連結如下 htt

solr在windows的安裝使用

首先,solr是基於java開發的,所以使用的話需要先進行java環境的配置,在Java環境配置好之後就可以去http://www.apache.org/dyn/closer.lua/lucene/solr/7.0.1這裡下載solr了,我是在Windows下使用的。

使用Angular CLI快速搭建Angular2工程

建立工程 上圖就是建立的過程,此時在建立中,npm也在下載相關的包,耐心等待;從控制檯中可以看到建立的內容; 建立結束 工程結構圖如下: 建立後的工程結構 就這樣,最簡單的angular2工程建立好了; 工程結構熟悉一下:angular-cli.json 是angular-cli的配置檔案,測試配置

【轉】談談使用VFW在windows程式設計控制攝像頭。 【孫濤】

原文:http://blog.csdn.net/suntaoznz/default.aspx?PageNumber=2 3.2使用視訊捕獲 3.2.1建立捕獲窗體 下面的例子通過使用capCreateCaptureWindow函式來建立一個捕獲窗體 hWndC = ca

Ubuntu 搭建Qt Webkit

Building the Qt port on Linux These instructions apply to Linux in general with source packages. Dependencies The code should be easily built on any Li

windows如何使用git

1.你需要下載git並安裝; 2.新建一個檔案放要提價的檔案,並右擊選擇git bash here; 3.自己新建一個檔案命名readme.txt; 4 git add readme.txt

php手動搭建wamp環境--之 Windows系統PHP環境搭建

1、PHP環境搭建的前提是 Apache HTTP Server (Apache 伺服器)已經安裝部署成功,並可以正常訪問到伺服器的主頁面。Apache HTTP Server 的安裝部署已經在上一篇講解的很詳細了,不清楚的可以點選“ Apache HTTP Servcer-Apache伺服器下載與

WindowsRed5流媒體伺服器搭建及使用

前段時間把red5伺服器搭建好了,現在記錄下是如何搭建的。 1,下載對應版本的red5 https://github.com/Red5/red5-server/releases 2,如果沒有安裝JAVA環境的安裝JDK並設定環境變數(該步驟自行搜尋) 3,解壓red5

Windows Server 2008 R2搭建jsp環境-Tomcat的下載安裝

流行 ext 協議 解壓縮 需要 繼續 bsp shutdown 電腦系統 1.百度搜索“Tomcat官網”,點擊有標誌的官網進入,準備下載官方正版Tomcat。 2.進入Tomcat官網之後,在左邊我們看到,Tomcat的有6,7,8這三個最流行的版本,我們可以點

Hadoop學習搭建Hadoop的分布式集群

例子程序 eve work 鍵盤 規劃 shuffle 系統變量 p s har 搭建Hadoop的分布式集群 Hadoop集群搭建的準備操作: 1、準備四臺服務器   四臺服務器的主機名分別是:potter2、potter3、potter4、potter5。   對以上四

windows伺服器使用nginx 基礎

windows nginx 安裝 nginx 手機端訪問 https 問題:為什麼使用windows伺服器,因為不會linux。為什麼使用node做伺

搭建一個windows的蜜罐系統

挺好玩的。 原文:https://blog.csdn.net/deux/article/details/199757?utm_source=blogxgwz0 包子@鄭州大學網路安全園 http://secu.zzu.edu.cn  搭建一個基於*nix系統的蜜罐網路

ubuntu 18.04greenplum安裝筆記Linux基礎環境的搭建

背景 需要構建一個用於資料倉庫的分散式資料庫叢集。 每一個節點暫時不需要進行備份,同時也不考慮壞掉的情況。 每一個數據節點最好都不用進行過多的配置,安裝起來方便。 Greenplum的Shared-Nothing的設計思路很適合我目前的業務場景。 物理環境 4檯安裝了Linux的主機,安裝的作業系統的版本均為

基於Anaconda在windows搭建TensorFlow環境cpu版本安裝

                          安裝TensorFlow CPU版本過程 目錄: 一.定義:TensorFlow是谷歌基於DistBelief進行研發的第二代人工智慧學習系統 一.定義: TensorFlow是谷歌基於DistBelie