在windows 7中安裝部署spark(python版)

阿新 • • 發佈：2018-11-24

一、搭建的環境

windows7

spark-2.3.2

python-3.6.5

Java8

二、安裝部署

1、安裝Java/Jdk

下載jdk-8u152-windows-x64.exe，根據安裝指南進行安裝，配置環境變數JAVA_HOME，在Path中新增%JAVA_HOME%\bin和%JAVA_HOME%\jre\bin，在CLASSPATH中新增%JAVA_HOME%\lib;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar。

配置完成後，在CMD中執行java -version檢查是否安裝成功。

2、安裝Spark

下載spark-2.3.2-bin-hadoop2.7.tgz，http://apache.communilink.net/spark/spark-2.3.2/spark-2.3.2-bin-hadoop2.7.tgz。解壓到指定路徑，新增環境變數SPARK_HOME到該路徑，並在Path中新增%SPARK_HOME%\bin和%SPARK_HOME%\sbin

3、安裝Python

下載python-3.6.5-amd64.exe，https://www.python.org/ftp/python/3.6.5/python-3.6.5-amd64.exe。根據安裝指南進行安裝。安裝完成後，在CMD中執行python --version檢查安裝是否成功。

將spark\python\pyspark整個資料夾複製到Anaconda3\Lib\site-packages資料夾中。

另外，需要在python中安裝py4j。

pip install py4j

4、安裝Hadoop

根據下載的Spark版本，下載相應版本的hadoop2.7.7，http://mirror-hk.koddos.net/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz 。解壓到指定路徑，新增環境變數HADOOP_HOME為該路徑，並在Path中新增%HADOOP_HOME%\bin。將hadoop.dll，winutils.exe拷貝到%HADOOP_HOME%\bin目錄。

ps：可自行在windows7 中編譯hadoop原始碼已得到相應的hadoop.dll，winutils.exe等，具體操作比步驟可參考https://blog.csdn.net/LiuQQu/article/details/83825304。

三、驗證

開啟IDLE，執行以下命令：

from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("local[*]").setAppName("test")
sc = SparkContext(conf=conf)

這時，彈出一個dos視窗。

在IDLE中繼續輸入：

data = sc.parallelize(range(10))
sum = data.reduce(lambda x, y: x + y)
print(sum)

輸出45。

驗證成功，按Ctrl+D退出Spark shell。

參考文章：https://blog.csdn.net/hjxinkkl/article/details/57083549

在windows 7中安裝部署spark(python版)

一、搭建的環境 windows7 spark-2.3.2 python-3.6.5 Java8 二、安裝部署 1、安裝Java/Jdk 下載jdk-8u152-windows-x64.exe，根據安裝指南進行安裝，配置環境變數JAVA_HOME，在Path中新增%JAVA

在Windows 7 中安裝部署Mysql

一、環境準備在Window中安裝Mysql，需要先安裝Visual C++ Redistributable Packages for Visual Studio 2013，否則報錯“缺少MSVCR120.dll檔案”。在官網下載進行安裝，https://download.microsof

Windows 7中安裝SQL2005提示IIS未安裝解決辦法

在Windows 7系統中安裝SQL Server 2005時，可能會收到一個警告：提示IIS未安裝或者未啟用。在通過“控制面板”的“開啟或關閉Windows功能”按預設設定安裝IIS後，發現仍有這

如何解決 Windows 7 中安裝印表機驅動程式時，出現錯誤資訊"找不到指定模組"或"XXX.dll 檔案丟失"

文章簡介在Windows7中安裝驅動程式時，出現錯誤資訊“找不到指定模組”或“XXX.dll 檔案丟失”，您可以參考本文的步驟嘗試解決問題應用軟體執行時一般都是優先從自己的安裝目錄中呼叫所需的模組（.dll）檔案，如沒有所需檔案再到 Windows\System

點滴記錄——Windows 7中安裝Sublime Text 3、cynwin、SublimeClang

import urllib.request,os,hashlib; h = '7183a2d3e96f11eeadd761d777e62404' + 'e330c659d4bb41d3bdf022e94cab3cd0'; pf = 'Package Control.sublime-package'; ipp

【原創 Spark動手實踐 1】Hadoop2.7.3安裝部署實際動手

dmi 遠程 nag proc host 一個 error img 連接目錄：第一部分：操作系統準備工作：　　1. 安裝部署CentOS7.3 1611 　　2. CentOS7軟件安裝（net-tools, wget, vim等）　　3. 更新CentOS

windows 64bit 中安裝python

windows 64bit python 1.在python官網下載自己所需要的安裝包：https://www.python.org/downloads/（裏面有兩個版本）2.下載版本為python-2.7.3amd64.msi,在windows中安裝後需要在系統環境中配置變量的路徑：進圖系統屬性

windows linux中安裝python並設定為環境變數

windows 雙擊開啟後，選中Customize installaion, 要記得勾上add python to Path 選項，意思是把Python的安裝路徑新增到系統環境變數的Path變數中。下一步按照預設的進行勾選在下一步記得勾選第一項install

Windows下Anaconda3中安裝雙版本Python和Spyder

來源：https://blog.csdn.net/hczhcz0905/article/details/80084492 首先，我個人電腦上安裝的是Anaconda3整合環境，Python3.5版本，由於

在anaconda中安裝、切換python的版本：2.7~3.6

1如果安裝的是anaconda2，那麼python3的就要在conda中建立一個名為python36的環境，並下載對應版本python3.6，然後執行如下語句，應該就可以在anaconda2\envs\下建立一個python36的目錄，裡面就是建立python36環境必要檔

【HP 印表機】安裝 Windows 7 中的網路印表機時收到錯誤訊息："0x0000052e"

症狀: 當試圖在執行 Windows 7 的計算機上安裝網路印表機時收到以下錯誤訊息： Windows 無法連線到該印表機（詳細資訊：操作失敗，出現錯誤 0x0000052e）原因：如果在 Windows 7 客戶端憑據與列印伺服器上儲存的憑據不匹配，則會發

Windows 7(32bits)安裝oracle 10g ODAC時檢查作業系統版本報錯

網上搜索了一下，這是由於vista,windows 2008的系統內部版本是6.0，而win 7 和windows 2008 R2 的內部版本是6.1而造成的。啟動檢查： 1、修改ODAC1020221執行後新解壓到同一目錄下的\install\oraparam.ini檔案找到如下內容 Windows=

Centos 7中安裝Python包管理工具——Pip

pip 是一個常用的Python包管理工具，主要是用於安裝 PyPI 上的軟體包，可以替代 easy_install 工具。在Centos 7中安裝Python包管理工具—Pip時，使用 sudo yum install python-pip 時無法安裝，是由於Cen

物理機在windows 7 下安裝redhat 7（雙系統）

物理機在windows 7 下安裝redhat 7（雙系統）linux 物理機掛載真實機掛載紅帽7 老唐安裝之前，我們先把紅帽7的鏡像文件刻入U盤，用於後面在物理機上安裝linux。刻入工具我們用UltraISO 這個軟件。UltraISO 軟件大家可以在百度下載!!!打開軟件選擇紅帽7

如何在 CentOS 7 中安裝、配置和安全加固 FTP 服務

cte success fire lease 註意 tps tran sub linux 步驟 1：安裝 FTP 服務器 1、安裝 vsftpd 服務器很直接，只要在終端運行下面的命令。 # yum install vsftpd 2、安裝完成後，服務先是被禁用的，因

CentOS-7中安裝與配置Tomcat8.5

ane dsc 配置 pub add ted tar.gz 分享 cal 第一步：下載Tomcat8.5,通過地址：http://tomcat.apache.org/download-80.cgi下載最後得到下載文件 apache-tomcat-8.5.15.tar.g

[書接上一回]在Oracle Enterprise Linux (v5.7) 中安裝DB - (4/4)

學習查詢 src log 成功尋找 image 需要密碼選擇自己創建的安裝數據庫路徑。 Sample Schemas 打鉤。調整內存大小。選擇官方建議的字符集編碼。是否創建創建的腳本，如需要請

[書接上一回]在Oracle Enterprise Linux (v5.7) 中安裝DB - (3/4)

www 數據庫 splay spl x86-64 width .html nbsp eight 安裝p10404530_112030_Linux-x86-64_6of7.zip解壓下的example。修改軟件路徑，為dbhome_1.

在centos 7中安裝phpmyadmin

sys 3.2 管理系 https art start ges 數據庫管理系統執行安裝phpmyadmin數據庫管理系統//1.下載phpmyadmin包wget https://files.phpmyadmin.net/phpMyAdmin/4.7.0/phpMyA

windows 7系統安裝相關說明

裝系統ISP網絡服務供應商：如：100Mbps 上行和下行的速率是 12.5MB/s分為家庭和企業兩種：家庭的網速達不到，企業的準確。測速用SpeedTest ，不要用360，因為它測的是主機到運營商服務器之間的網絡，沒有到骨幹網絡。常用的分區軟件：老毛桃Mbps= Mbit/s,兆比特每秒Million b

在windows 7中安裝部署spark(python版)

一、搭建的環境

二、安裝部署

1、安裝Java/Jdk

2、安裝Spark

3、安裝Python

4、安裝Hadoop

三、驗證

相關推薦