Spark學習（二）win10部署Hadoop+Spark

阿新 • • 發佈：2020-07-14

1.Hadoop

（1）安裝配置

基礎只需要配置core-site.xml和hdfs-site.xml就行。

參考：

https://www.jianshu.com/p/aa8cfaa26790【這個教程的core-site.xml和hdfs-site.xml的內容弄反了，交換一下就行】

http://dblab.xmu.edu.cn/blog/install-hadoop/【這是Linux的】

https://blog.csdn.net/Sylarjyd/article/details/91038732【這是包括yarn的配置】

（2）開啟Hadoop

命令列：hadoop namenode -format

啟動：進入sbin目錄，雙擊start-dfs.cmd【僅啟動dfs】或者start-all.cmd【啟動所有，包括yarn】

命令列：jps檢視程序

（3）檢視

通過http://127.0.0.1:8088/即可檢視叢集所有節點狀態

訪問http://localhost:9870/即可檢視Hadoop檔案管理頁面。

2.Spark

（1）安裝

https://blog.csdn.net/u011513853/article/details/52865076

檢視：http://localhost:4040/jobs/

（2）執行Spark自帶的例子：run-example SparkPi

（3）啟動master和slave

我一個單機win10怎麼弄另外一個master？！！！百度TMD兩天，不如Google一下，我也是醉了！！我發誓，一定養成Google習慣，不是非要英語，而是搜尋引擎不行！！

ps：spark提交作業，支援多種cluster manage型別：Standalone，Apache Mesos，Hadoop YARN，Kubernetes，這裡採用Standalone的偽分散式。

後來才發現，官方文件https://spark.apache.org/docs/1.6.0/submitting-applications.html也有一丟丟提示，卻沒給怎麼設定！

原答案：http://damn.amsterdam/sparkonwindows/

沒有master，新開一個cmd視窗，造一個master，系統會給你分配一個master IP和埠

效果：

再開一個cmd視窗，造一個slave

檢視spark master的web ui：http://localhost:8080/

Spark學習（三）Spark實驗部分

Spark學習（二）win10部署Hadoop+Spark

1.Hadoop （1）安裝配置基礎只需要配置core-site.xml和hdfs-site.xml就行。參考： https://www.jianshu.com/p/aa8cfaa26790【這個教程的core-site.xml和hdfs-site.xml的內容弄反了，交換一下就行】

Spark學習（二）Spark 版本 WordCount

一、環境準備今天我們看下Spark 版本的 wordcount，IDEA 新建 Maven 專案引入依賴:使用 spark 3.0.0，對應scala 版本2.12

Spark學習（三）Spark 分散式部署

一、Yarn 部署簡介　　Spark自身提供計算資源，無需其他框架提供資源。But 這種方式降低了和其他第三方資源框架的耦合性，獨立性非常強。請注意：Spark主要是計算框架，而不是資源排程框架，所以本身提供的資源排程

微服務設計學習（二）關於服務的整合

前言微服務之間如何整合應該可以說是微服務相關技術中最重要的知識之一。具體可以表示成服務之間的呼叫方式、通訊協議、序列化協議等。

OpenGL學習（二）-- Xcode 搭建 OpenGL 環境

我的 OpenGL 專題學習目錄，希望和大家一起學習交流進步！ OpenGL學習（一）-- 術語瞭解

Spark 系列（二）—— Spark開發環境搭建

一、安裝Spark 1.1 下載並解壓官方下載地址：spark.apache.org/downloads.h… ，選擇 Spark 版本和對應的 Hadoop 版本後再下載：

關於Shiro框架的學習（二）

前言接上篇，關於Shiro框架的學習（一），這篇會記錄下Shiro整合Web、整合SSM的過程，之後就可以直接應用在專案的安全控制上。

演算法學習（二）選擇排序

一、引言　　上一篇學習了氣泡排序，還是比較簡單的一種排序，這一篇學習一下選擇排序，也是基礎排序的其中一種，手寫一遍，加上自己的註釋，理解以後寫圖例，其實演算法也不是很高深的東西，記錄一下~~

基於C++程式碼的UE4學習（二）—— 碰撞體

在Unreal Engine中簡單的碰撞體分為box,sphere和capsule。今天以box碰撞體舉例，其他的倆種構建方法都是相同的。

Hadoop基礎（二）：從Hadoop框架討論大資料生態

1Hadoop是什麼 2Hadoop三大發行版本 Hadoop三大發行版本：Apache、Cloudera、Hortonworks。

keras學習（二）分類

這一次是通過keras對官方的手寫資料集mnist進行訓練，是訓練出來的模型能準確分別手寫數字mnist手寫資料集，裡面都是28*28的圖片（這個圖片是來自https://www.cnblogs.com/xianhan/p/9145966.html）：

Shell語言學習（二）——變數和基本資料型別

參考部落格： [1]LinuxShell指令碼——變數和資料型別 [2]shell只讀變數刪除一、變數

Zookeeper學習（二）

一、Znode節點屬性 dataVersion 資料版本, 每次當 Znode 中的資料發生變化的時候, dataVersion都會自增一下cversion 節點版本, 每次當 Znode 的節點發生變化的時候,cversion 都會自增aclVersion ACL(Access Control

angular學習（二）

資料雙向繫結和管道 NgModules用於配置注入器和編譯器，並幫你把那些相關的東西組織在一起。NgModule 是一個帶有@NgModules裝飾器的類。用來實現資料雙向繫結

Kernel Linux學習（二）——驅動編寫（部分轉載）

Kernel Linux學習——驅動編寫 2020-08-0814:46:20hawkJW 　　　　前面已經完成了Kernel Linux的環境配置部分，下面我們就熟悉一下Kernel Linux重要的部分，即驅動的編寫

mmdetection3d學習（二）：訓練流程

訓練流程從 tools/train.py 開始：一通讀取 cfg ，初步設定一些基本引數，log 引數；

kubernetes學習（二）

kubernetes學習（二）關於cfssl工具： cfssl：證書籤發的主要工具 cfssl-json：將cfssl生成的證書（json格式）變為檔案承載式證書【轉換格式】

vue學習（二）

一、元件中的data為什麼必須是一個函式？　　一個元件被複用多次的話，就會建立多個例項。本質上，這些例項用的都是同一個建構函式。如果data是物件的話，物件屬於引用型別，會影響到所有的例項。所以為了保證元件不

CSS學習（二）—— 樣式

此部分將介紹前端開發中常用的一些css樣式。 1.　height 高度 & width 寬度在html中如果想要給標籤設定高度和寬度的話，需要使用height和width屬性，並且在設定時有兩種單位：

MySql儲存過程學習（二）

轉載於：https://blog.csdn.net/machenic/article/details/97622032 前邊已經對儲存過程有了大概認識，現在根據教程學習儲存過程。前邊已經說到，他是一個function，類似於Java的方法。那麼就類比Java方法學習。變數

Spark學習（二）win10部署Hadoop+Spark

1.Hadoop

（1）安裝配置

（2）開啟Hadoop

（3）檢視

2.Spark

（1）安裝

（2）執行Spark自帶的例子：run-example SparkPi

（3）啟動master和slave

沒有master，新開一個cmd視窗，造一個master，系統會給你分配一個master IP和埠

再開一個cmd視窗，造一個slave

檢視spark master的web ui：http://localhost:8080/

下一節：

Spark學習（三）Spark實驗部分

相關推薦