spark(2.1.0) 操作hbase(1.0.2)

阿新 • • 發佈：2017-11-19

hadoop mon per bsp trac 事先 com maker scala

1、spark中引入外部jar包

　　1）創建/usr/software/spark_jars目錄，放入spark操作hbase的jar包：hbase-annotations-1.0.2.jar，hbase-client-1.0.2.jar，hbase-common-　　　　 1.0.2.jar，hbase-server-1.0.2.jar

　　2）修改spark-default.conf文件,加入以下兩行：　

　　　　spark.executor.extraClassPath=/usr/software/spark_jars/*
　　　　spark.driver.extraClassPath=/usr/software/spark_jars/*

2、進入hbase事先創建好表

　　　　create ‘test‘,‘f1‘

2、進行spark-shell或用scala進行操作hbase。

3、代碼部分：

import org.apache.hadoop.hbase.{HBaseConfiguration, TableName}
import org.apache.hadoop.hbase.client.{ConnectionFactory, Put}
import org.apache.hadoop.hbase.io.ImmutableBytesWritable
import org.apache.hadoop.hbase.mapred.TableOutputFormat
import org.apache.hadoop.hbase.util.Bytes
import org.apache.hadoop.mapred.JobConf
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.streaming.{Seconds, StreamingContext}

val conf = HBaseConfiguration.create()
var jobConf = new JobConf(conf)
jobConf.set("hbase.zookeeper.quorum", "localhost")
jobConf.set("zookeeper.znode.parent", "/hbase")
jobConf.set(TableOutputFormat.OUTPUT_TABLE, "test")
jobConf.setOutputFormat(classOf[TableOutputFormat])
val rdd = sc.makeRDD(Array(1)).flatMap(_ => 0 to 100000)
rdd.map(x => {
var put = new Put(Bytes.toBytes(x.toString))
put.addColumn(Bytes.toBytes("f1"), Bytes.toBytes("c1"), Bytes.toBytes(x.toString))
(new ImmutableBytesWritable, put)
}).saveAsHadoopDataset(jobConf)

spark(2.1.0) 操作hbase(1.0.2)

hadoop mon per bsp trac 事先 com maker scala 1、spark中引入外部jar包　　1）創建/usr/software/spark_jars目錄，放入spark操作hbase的jar包：hbase-annotations-1.0.2.

【轉載】Hadoop 2.7.3 和Hbase 1.2.4安裝教程

啟動運行 property new rop net 文本文 .tar.gz cor 轉載地址：http://blog.csdn.net/napoay/article/details/54136398 目錄(?)[+] 一、機器環境

Spark2.0操作Hbase

讀寫Hbase的方法，這裡是通過Spark的RDD來操作的方法，通過Hbase API的方式是另一種，這裡不涉及。首先配置pom，新增hbase依賴，一般Spark平臺不包含hbase的jar包，所以這些依賴不新增<scope>provided</scope> maven相關部分

Spark 下操作 HBase（1.0.0 新 API）

HBase經過七年發展，終於在今年2月底，釋出了 1.0.0 版本。這個版本提供了一些讓人激動的功能，並且，在不犧牲穩定性的前提下，引入了新的API。雖然 1.0.0 相容舊版本的 API，不過還是應該儘早地來熟悉下新版API。並且瞭解下如何與當下正紅的 Spark 結合，進

Hadoop-2.6.0+Zookeeper-3.4.6+Spark-1.5.0+Hbase-1.1.2+Hive-1.2.0叢集搭建

前言本部落格目的在於跟大家分享大資料平臺搭建過程，是筆者半年的結晶。在大資料搭建過程中,希望能給大家提過一些幫助，這也是本部落格的

Git系統從0到1的完整學習歷程（第四節(2) Git分支操作）

主要跟著https://gitee.com/progit/index.html來學習的，知識點來自這裡，新增自己的理解和標記。分支的新建與合併現在讓我們來看一個簡單的分支與合併的例子，實際工作中大體也會用到這樣的工作流程：開發某個網站。為實現某個新的需求，建立一個

spark-2.2.0-bin-2.6.0-cdh5.12.1.tgz 編譯方法總結！

菜雞一隻，如果有說錯的地方，還請見諒和指出批評！！事情是這樣的，想在自己本地部署一個hadoop2.6.0-cdh5.12.1，hive1.1.0-cdh5.12.1，spark-2.2.0-bin-2.6.0-cdh5.12.1的環境，前兩個還是很好找到哪裡下載和部署的！ c

Spark 2.1.0整合CarbonData 1.1.0

1.新建專案 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http:

Spark 2.4.0 整合Hive 1.2.1

Spark 2.4.0 整合Hive 1.2.1 更多資源 github: https://github.com/opensourceteams/spark-scala-maven-2.4.0 apache-hive-1.2.1-bin 安裝: https://gith

Spark on YARN模式的安裝（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推薦）

說白了　　Spark on YARN模式的安裝，它是非常的簡單，只需要下載編譯好Spark安裝包，在一臺帶有Hadoop YARN客戶端的的機器上執行即可。　　Spark on YARN分為兩種： YARN cluster（YARN standalone，0.9版本以前）和 YA

【HBase-1.2.0】1000-HBase1.2.0 的安裝

JDK版本和HBASE對應關係 HBase Version JDK 6 JDK 7 JDK 8 2 Not Supported Not Supported yes 1.3 Not Supported yes yes 1.2 Not Supported yes yes

Spark bind on port 0. Attempting port 1 問題解決

spark 大數據 hadoopLinux 下運行spark local bind on port 0. Attempting port 1 問題2016-11-01 16:04:56 [org.apache.spark.util.Utils]-[WARN] - Service ‘sparkDriver‘ c

tengine2.1.0RPM包制做 tengine-2.1.0.spec配置

c-c malloc con file tar.gz 3.6 release 1.2 attr [[email protected]/* */ SPECS]# cat tengine-2.1.0.spec Name: tengine Version: 2.1.

面試題3：在一個長度為n的數組裏的所有數字都在0到n-1的範圍內。數組中某些數字是重復的，但不知道有幾個數字是重復的。也不知道每個數字重復幾次。請找出數組中任意一個重復的數字。例如，如果輸入長度為7的數組{2,3,1,0,2,5,3}，那麽對應的輸出是第一個重復的數字2。

length value 如果 while 返回 sys public ret || package siweifasan_6_5; /** * @Description:在一個長度為n的數組裏的所有數字都在0到n-1的範圍內。 * 數組中某些數字是重復的，

spark(2.1.0) 操作hbase(1.0.2)

spark(2.1.0) 操作hbase(1.0.2)

【轉載】Hadoop 2.7.3 和Hbase 1.2.4安裝教程

Spark2.0操作Hbase

Spark 下操作 HBase（1.0.0 新 API）

Hadoop-2.6.0+Zookeeper-3.4.6+Spark-1.5.0+Hbase-1.1.2+Hive-1.2.0叢集搭建

Git系統從0到1的完整學習歷程（第四節(2) Git分支操作）

spark-2.2.0-bin-2.6.0-cdh5.12.1.tgz 編譯方法總結！

Spark 2.1.0整合CarbonData 1.1.0

Spark 2.4.0 整合Hive 1.2.1

Spark on YARN模式的安裝（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推薦）

【HBase-1.2.0】1000-HBase1.2.0 的安裝

Spark bind on port 0. Attempting port 1 問題解決

tengine2.1.0RPM包制做 tengine-2.1.0.spec配置

ValueError: Cannot feed value of shape (2,) for Tensor u'Placeholder_2:0', which has shape '(1, 2)'

SpringBoot 2.0入門（1）

pytorch 0.4.1+ubuntu18.04 +python3.67+cuda9.2 安裝

postgis-2.0.dll": %1 is not a valid Win32 application解決方案

藍芽協議4.0、4.1、4.2的比較

給定陣列a[0:n-1]試設計一個演算法，在最壞情況下用[3n/2 -2 ] 次比較找出a[0:n-1]中元素的最大值和最小值；教材2-15

spark(2.1.0) 操作hbase(1.0.2)

相關推薦