第四課：Yarn和Map/Reduce配置啟動和原理講解

阿新 • • 發佈：2018-08-07

data 程序 jar sheet 編輯 datanode 示例數據說過

前三節課主要講了hdfs，hdfs就是一個分魚展的大硬盤

分：分塊

魚：冗余

展：動態擴展

接下來講雲計算，也可以理解為分布式計算，其設計原則：

移動計算，而不是移動數據

前面說過，hadoop由hdfs，yarn，map/reduce組成，

而yarn（Yet Another Resource Negotiator）是資源調度系統，yarn調配的是內存和cpu，不參入計算。

map/reduce是計算引擎。

（1）配置yarn

yarn由一臺resourceManager和n臺dataManager組成，resourceManager管理著n臺dataManager，

resourceManager原則上應該和namenode分開，單獨在一個節點上，現在是在做實驗，為了演示方便，

才放在一起的，而dataManager可以和datanode放在一起，這樣dataManager和數據離的近一點，

當然也可以不放在一起。

要啟動yarn系統，需要先配置一些參數：

a）配置yarn-size.xml

resourceManager和dataManager每一個節點都需要配置yarn-size.xml，配置如下：

<?xml version="1.0"?>
<configuration>
 <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>master</value>
 </property>
 
 <property>  
    <name>yarn.nodemanager.aux-services</name>  
    <value>mapreduce_shuffle</value>  
 </property>  
 
 <property>
    <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
 </property>  
</configuration>

b) 配置mapred-site.xml

只需要在master的/usr/local/hadoop/etc/hadoop目錄下，

復制mapred-site.xml.template，即執行命令

[root@master hadoop]# cp mapred-site.xml.template mapred-site.xml

編輯mapred-site.xml,vim mapred-site.xml:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

這是配置map/reduce在哪個系統上運行，這裏配置的yarn，也可以配置其他的。

（2）啟動yarn

[root@master hadoop]# start-yarn.sh

使用jps查看啟動情況

技術分享圖片

啟動成功後，可在瀏覽器上查看web界面

（3）運行一個map/reduce示例程序

要先把hdfs也啟動起來：

[root@master hadoop]# start-dfs.sh

上傳一個文件到hdfs的/input目錄上

#在namenode的根目錄上創建input目錄
[root@master hadoop]# hadoop fs -mkdir /input
#上傳一個測試文件到hadoop的/input目錄上
[root@master hadoop]# hadoop fs -put /root/input.txt  /input

input.txt的內容如下：

技術分享圖片

find /usr/local/hadoop -name *example*.jar 查找示例程序文件

通過hadoop jar xxx.jar wordcount /input /output來運行示例程序

執行結果為：

技術分享圖片

第四課：Yarn和Map/Reduce配置啟動和原理講解

data 程序 jar sheet 編輯 datanode 示例數據說過前三節課主要講了hdfs，hdfs就是一個分魚展的大硬盤分：分塊魚：冗余展：動態擴展接下來講雲計算，也可以理解為分布式計算，其設計原則：移動計算，而不是移動數據前面說過，hadoo

hadoop第五課：java開發Map/Reduce

pla tool @override val code 項目 ssp ava ram 配置系統環境變量HADOOP_HOME，指向hadoop安裝目錄（如果你不想招惹不必要的麻煩，不要在目錄中包含空格或者中文字符）把HADOOP_HOME/bin加到PATH環境變量（非必要

第四課：通過配置文件獲取對象（Spring框架中的IOC和DI的底層就是基於這樣的機制）

ted const dex generate stat clas name 必須 nbsp 首先在D盤創建一個文件hero.txt，內容為：com.hero.Hero（此處必須是Hero的完整路徑）接下來是Hero類 package com.hero; publi

java8第四課：方法引用和構造器引用

這節課我們開始講方法引用和構造器引用，直接看程式碼 public class MethodReference { /** * 方法引用:一種lambda表示式的簡寫方

第四課：vi編輯器和c語言

vi編輯器 vi編輯器的三種模式：命令模式：1，從命令模式切換至插入模式 &nbs

第四課：單用戶及救援模式(一)

單用戶及救援模式.有時候當我們密碼忘記了，需要遠程修改密碼，可以進入單用戶模式來修改密碼，如下：1、首先重啟服務器，然後按a鍵，進入當用戶模式：選擇第一項，按e編輯：如下：2、然後定位到ro這裏，修改ro為rw init=/sysroot/bin/sh，完成之後按crtl+X重啟：3、修改後如下：4、此時可以

第四課：linux克隆及服務器之間登錄(二)

linux克隆及服務器之間登錄1、linux服務器下可以克隆虛擬機，這樣兩臺方便操作，克隆步驟如下：打開虛擬機---右擊-管理==克隆：到如下界面：克隆虛擬機的當前狀態：創建完整克隆即可，方便以後操作：3、顯示克隆進度：4、此時克隆完成：5、克隆後需要修改IP地址才可以登錄。2、linux服務器之間登錄：比如

第四課：APK的一些操作

style apk play mage activit display img get tmg 1：查看包名類工具 http://www.yxdown.com/azs/119034.html2 查看ZT包類名包名： com.tencent.t

C#程式設計基礎第四課：c#中的邏輯運算子、多重if語句、巢狀if語句的使用

知識點：邏輯運算子、多重if語句、巢狀if語句 1、邏輯運算子練習1：邏輯或、邏輯與運算子的使用本次計算機考試成績規定：筆試成績等於100分且機試成績大於等於60分，或筆試成績大於等於60分且機試成績等於100分，輸出“成績優秀”，&

HTML+CSS第四課：表單標籤的使用-製作登錄檔單

知識點：表單標籤、表單元素表單在網頁中應用比較廣泛，如申請qq賬號、電子郵箱等，使用者需要首先填寫註冊資訊，然後才能提交；通俗講，表單就是一個將使用者資訊組織起來的容器，將使用者填寫的內容放置在表單容器中，當用戶單擊提交按鈕的時候，表單會將資料統一發送給伺服器！表單的作用

bobo老師機器學習筆記-第四課：KNN演算法

自己參考Bobo老師寫得程式碼：主要分為四個檔案： knn.py中實現KNN演算法、model_selection.py封裝了樣本資料的一些工具方法，比如切分為訓練集和測試集； metrics用來對模型進行評估、client用來呼叫演算法進行執行 # -*- encoding:

Matlab第四課：基礎繪圖

目標：基礎繪圖繪圖的物件一、基礎繪圖 plot()函式： plot(x, y)：根據座標（x，y）畫出圖形 plot(y)：只給出y，這樣畫圖的時候，x軸就是x=[1...n], n = length(y) 但我們想要在畫布上使用兩個plot(

人工智慧第四課：機器學習的數學基礎

我斷斷續續利用在家休假的時間，完成了這門課程《Essential Math for Machine Learning: Python Edition》的學習，並且得到了總分91分。這門課程的主要內容如下，雖然我們以前都學過數學，但大部分真的都還給老師了。學習這門課程中，

第四課：兩種監聽器方法（基於AndroidStudio3.2）

一、佈局在主程式介面上新增新按鈕，如以前一樣。建立一個 Activity，名字為MeventActivity 新增一個三個Button控制元件。新增呼叫該視窗程式給按鈕“多事件” Button btn2 = (Button) findViewByI

第四課：js物件

這節課來講js物件 //這個用來寫js物件相關的教學 /** * js物件的建立: * * var a = { * 屬性名: 屬性值, * 屬性名: 屬性值,

第67課：Spark SQL下采用Java和Scala實現Join的案例綜合實戰（鞏固前面學習的Spark SQL知識）

內容： 1.SparkSQL案例分析 2.SparkSQL下采用Java和Scala實現案例一、SparkSQL下采用Java和Scala實現案例學生成績： {"name":"Michael","score":98} {"name":"Andy"

吳恩達深度學習第四課：卷積神經網路（學習筆記2）

前言 1.之所以堅持記錄，是因為看到其他人寫的優秀部落格，內容準確詳實，思路清晰流暢，這也說明了作者對知識的深入思考。我也希望能儘量將筆記寫的準確、簡潔，方便自己回憶也方便別人參考； 2.昨天看到兩篇關於計算機視覺的發展介紹的文章：[觀點|朱鬆純：初探計算機

第91課：SparkStreaming基於Kafka Direct案例實戰和內幕原始碼解密 java.lang.ClassNotFoundException 踩坑解決問題詳細內幕版本

第91課：SparkStreaming基於Kafka Direct案例實戰和內幕原始碼解密 /* * *王家林老師授課http://weibo.com/ilovepains */ 每天晚上20：00YY頻道現場授課頻道68917580 1、作業內容：SparkS

Android學習第四課：Java程式碼實現XML佈局

權重屬性layout_height 在佈局控制元件中（如LinearLayout），子控制元件可以根據權重值（預設為0）來分配所佔據的空間，這需要結合layout_width或layout_height的值進行分類： 1）如果子控制元件layout_weight都為“ma

CODING DevOps 系列第四課：DevOps 中的質量內建實踐

## 什麼是質量內建隨著時間的推移，我們專案的開發效率會逐漸降低，直到幾年之後整個專案可能就無法維護，只能推倒重來。具體的表現首先就是隨著時間推移，我們會發現整個需求列表裡面能做的需求越來越少，因為每當我們增加一個新特性，需要改動的程式碼就非常多，所以最後每提出一個新的需求，團隊評估出來的改動成本都非常高

第四課：Yarn和Map/Reduce配置啟動和原理講解

相關推薦