Hive入門（2）

阿新 • • 發佈：2018-12-30

1.Hive DDL

1.1 database DDL

（1）建立資料庫

CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name //生產中if not exists都帶上

[COMMENT database_comment] //可以增加註釋

[LOCATION hdfs_path] //存的路徑不寫預設的就是/user/hive/warehouse

[WITH DBPROPERTIES (property_name=property_value,

...)]; //新增一些屬性，key，value

練習：

 create database  if not exists hive2 comment 'this is test databaes' with DBPROPERTIES("cretor"='yunfei','teacher'='ruoze');


 desc database extended hive2;
//不加這個extended看不到自己新增的屬性

（2）刪除資料庫

use database hive2;

drop table xxx;

drop database hive2;
//這是生產中的正常操作，因為資料庫下有表是不能刪除的
強制的不學

（3）修改資料庫

ALTER (DATABASE|SCHEMA) database_name SET DBPROPERTIES (property_name=property_value, ...);   -- (Note: SCHEMA added in Hive 0.14.0)
 
ALTER (DATABASE|SCHEMA) database_name SET OWNER [USER|ROLE] user_or_role;   -- (Note: Hive 0.13.0 and later; SCHEMA added in Hive 0.14.0)
  
ALTER (DATABASE|SCHEMA) database_name SET LOCATION hdfs_path; -- (Note: Hive 2.2.1, 2.4.0 and later)




hive> alter database hive2 set dbproperties('teacher'='jepson');
OK
Time taken: 0.076 seconds
hive> desc database extended hive2;
OK
hive2	this is test databaes	hdfs://192.168.137.251:9000/user/hive/warehouse/hive2.db	root	USER	{teacher=jepson, cretor=yunfei}
Time taken: 0.021 seconds, Fetched: 1 row(s)

1.2 table DDL

（1）建立表

create table hive2.ruozeperson (id int comment 'this is id',name string comment 'this is name') comment 'this is test table' row format delimited fields terminated by '\t';



create table person(id int,name string) comment 'this is a table' row format delimited fields terminated by '\t'

（2）查看錶的詳細資訊

desc formatted ruozeperson；

（3）載入資料到表裡面去

LOAD DATA LOCAL INPATH '/home/hadoop/data/emp.txt' OVERWRITE INTO TABLE ruozedata_emp; 

local: 從本地檔案系統載入資料到hive表
非local：從HDFS檔案系統載入資料到hive表
LOAD DATA INPATH 'hdfs:192xxx/home/hadoop/data/emp.txt' OVERWRITE INTO TABLE ruozedata_emp; 

OVERWRITE: 載入資料到表的時候資料的處理方式，覆蓋
非OVERWRITE：追加

（4）第二種建立表的方式

create table emp_test as select * from emp;


這是將整個表複製了一遍


create table emp_test like emp;

這種只複製表的結構！！

（5）改表名

alter table emp_test3 rename to emp_test4;

（6）修改表的欄位名和型別

 alter table emp_test change column at empno string;


將at 列改為empno string型別

（7）快速檢視建立表的資訊

show create table emp;

倆個都是查看錶的結構，但上面這個能快速看錶是如何建立的。

desc formatted emp;

（8）第三種建立表的方式

create table ruozedata_emp4 like ruozedata_emp;

INSERT OVERWRITE TABLE ruozedata_emp4
select * FROM ruozedata_emp;
 
overwrite 是覆蓋， to 是追加

（9）到處Hive處理的資料

這是匯入到本地，匯入HDFS換成HDFS的路徑就好了

insert overwrite local directory '/home/hadoop/data'  row format delimited  fields terminated by '\t' select * from emp;

2.Hive的資料儲存在哪?

分倆部分：

（1）真是資料存放在HDFS之上。

（2）元資料存放在RDBMS之上。

3.Hive的資料儲存結構

（1）傳統的關係型資料庫，有database，但是Hive中的database，在HDFS之上，就是HDFS之上的一個頂層資料夾。

（2）傳統的關係型資料庫，有tables，Hive中的table就相當於第二層資料夾。

（3）Hive中還有一個更小的單位Partitions，一個表可以有多個partition，partition就是存放在資料夾之下。

（4）最後就是bucket，這是最底層的了，這就是具體的檔案資料了。

4.Hive中常用的資料型別

（1）int bigint long float string double boolean（這個也不建議用，可以用01表示更加省位元組） decimal（精度非常高的，很少用）

（2）常用的分隔符

行：\n

列：\001 tab ，空格，$$$ 就這些常用的

5.內外部表的不同

建立表預設使用的是MANAGED_TABLE：內部表
   ruozedata_emp_managed
   drop：hdfs+meta

EXTERNAL：外部表
create EXTERNAL table ruozedata_emp_external
(empno int, ename string, job string, mgr int, hiredate string, salary double, comm double, deptno int)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LOCATION "/ruozedata/external/emp" ;
   drop: drop meta

內部表刪除表會將hdfs上的資料和MySQL中的meta資訊都刪除，外部表則只刪除meta資訊。

6.操作出了問題，例如欄位名字反了

只有重跑，別想著花裡胡哨的回滾操作。

重跑：必須要要保證冪等性（就是執行n次結果是一樣的！）

Hive入門（2）

1.Hive DDL 1.1 database DDL （1）建立資料庫 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name //生產中if not exists都帶上 [COMMENT d

maven入門（2）settings.xml

file option 一個 keyword files 合並遠程倉庫 pac nbsp 一、簡介 settings.xml對於maven來說相當於全局性的配置，用於所有的項目，當Maven運行過程中的各種配置，例如pom.xml，不想綁定到一個固定的project或者

zuul入門（2）zuul 的關鍵組件和用途

ice cti -s -1 life 處理有一個之間類別 1、ContextLifecycleFilter 2、ZuulServlet 接收請求 ZuulServlet類似SpringMvc的DispatcherServlet，所有的Request都要經過Zuul

hive入門（一）、什麽是hive

作業 strong 包括麻煩倉庫離線享元 tor 減少 1、Hive 基本概念 Hive是基於Hadoop的一個數據倉庫工具，可以將結構化的數據文件映射成一張表，並提供類SQL查詢功能； Hive是構建在Hadoop 之上的數據倉庫；使用HQL作為查詢接口；使

關於neo4j初入門（2）

結果 esc 添加刪除節點 comm 瀏覽器 rom 關於標記 DELETE刪除刪除節點及相關節點和關系。 DELETE <node-name-list> DELETE <node1-name>,<node2-name>,&

SpringBoot 2.0入門（2）

SpringBoot 資料訪問 1.springboot整合使用JdbcTemplate 1.1 pom檔案引入 <parent> <groupId>org.springframework.boot</groupId> <arti

pytorch入門（2）-------神經網路的構建

https://blog.csdn.net/broken_promise/article/details/81174760 一、神經網路的構建：激勵函式的選擇，如果層數較少的神經網路，激勵函式有多種選擇，在影象卷積神經網路中，激勵函式選擇ReLu，在迴圈神經網路中，選擇ReL或者Tanh。所有的層結

Entity Framework Core 入門（2）

安裝 EF Core 將 EF Core 新增到不同平臺和常用 IDE 中的應用程式的所需步驟彙總。分步入門教程無需具備 Entity Framework Core 或任何特定 IDE 的原有知識，即可學習這些入門教程。這些教程將逐步介紹如何建立用於查詢和儲存資料庫中資料的簡單應用程式。

大資料入門（2）安裝linux的jdk

1、上傳檔案到linux alt+p 進入ftp傳檔案 sftp> put E:\soft\jdk-7u71-linux-x64.tar.gz 2、建立資料夾解壓檔案（root使用者許可權） mkdir /usr/java tar -zxvf jdk-7u71-

PHP入門（2）WampServer的安裝及使用

安裝一直點選next即可。如何檢驗環境配置成功（1）開啟WampServer，會有一個cmd視窗一閃而過。（2）桌面右下角工作列中WampServer圖示變為綠色，若一直為橙色或紅色則表示服務沒有完全開啟。（3）左鍵單擊右下角工作列中WampServer圖示，單擊Lo

MVVM Light 新手入門（2）：ViewModel / Model 中定義屬性，並在View中呼叫利刃 MVVMLight

今天學習MVVM架構中“屬性”的新增並呼叫，特記錄如下，學習資料均來自於網路，特別感謝翁智華的利刃 MVVMLight系列。一個視窗的基本模型如下： View（檢視） -> ViewModel （檢視模型）-> 多個Model（模型）注：檢視是使用者在螢幕上看到

STM32 嵌入式學習入門（2）——STM32的GPIO介紹

STM32的GPIO介紹 GPIO：General Purpose Input Output ，即通用輸入/輸出，簡稱為GPIO。 GPIO應該是學習微控制器、學習嵌入式、學習STM32的第一個知識點了。在介紹GPIO相關的內容前，這裡先總得說一下自己對GPIO的理解。

STM32 嵌入式學習入門（2）——STM32的GPIO介紹 STM32 嵌入式學習入門（3）——STM32F103 按鍵輸入控制LED燈

STM32簡介及STM32學習方法簡介 STM32是新的基於ARM核心的32位MCU系列，該核心為ARM公司為要求高效能、低成本、低功耗的嵌入式應用專門設計的Cortex-M核心，該核心採用標準的ARM架構。該核心具有超前的體系結構以及高效能、低電壓、低功耗，且

Linux作業系統入門（2）

vim的常用功能 vim的模式普通模式瀏覽檔案插入模式

Linux快速入門（2）===》檔案的打包壓縮

之前買了伺服器，linux系統，伺服器正在備案中，這段時間學學linux 檔案的打包壓縮與我們平時所說的打包不一樣。我們平時說的打包是打包後壓縮。而在Linux下，打包的意思是指只打包不進行檔案壓縮。壓縮的意思是把檔案進行壓縮。打包壓縮

Linux快速入門（2）

檔案的打包壓縮與我們平時所說的打包不一樣。我們平時說的打包是打包後壓縮。而在Linux下，打包的意思是指只打包不進行檔案壓縮。壓縮的意思是把檔案進行壓縮。 .tar命令，檔案的打包，解包

DFS深搜入門（2）

Lake Counting(Poj 2386) 園子有多少水窪。 #include<iostream> #include<cstdio> #include<stack> #include<queue> using

SpringBoot入門（2）

第二節 spring擴充套件分析獲取上下文方法，三種注入ApplicationContext的方法自動裝配 ApplicationContext 實現介面 ApplicationContextAware Bean的構

Java 入門（2）

public class demo1 { public static void main(String args[]){ // 定義一個int型別的變數a int a; //給變數a賦值 a=1;

閱讀：ECMAScript 6 入門（2）

修飾器 decorator 英[ˈdekəreɪtə(r)] 美[ˈdɛkəˌretɚ] n.裝飾器，室內裝飾師，油漆匠; 感覺類似Java的註解 Module 的語法概述歷史上，JavaScript 一直沒有模組（module）體系，無法將一個大程式拆分成互相依賴的小檔案，

Hive入門（2）

1.Hive DDL

1.1 database DDL

1.2 table DDL

2.Hive的資料儲存在哪?

3.Hive的資料儲存結構

4.Hive中常用的資料型別

5.內外部表的不同

6.操作出了問題，例如欄位名字反了

相關推薦