Pandas基礎（二）：DataFrame的行、列與資料型別

阿新 • • 發佈：2018-12-21

建立DataFrame資料：

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2001, 2002, 2003],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data)

輸出：

	state	year	pop
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2

1.DataFrame的資料型別
用dtypes方法，可以查看錶中各列的資料型別

df.dtypes

輸出：

state     object
year       int64
pop      float64
dtype: object

2.檢視所有列名

df.columns

輸出：

Index(['state', 'year', 'pop'], dtype='object')

3.查看錶中列的總數

df.shape[1]		#列數
df.columns.size #列數

4.查看錶中行的總數

df.shape[0]		#行數
len(df)			#行數

5.shape方法
shape方法查看錶規模（行，列）

df.shape

輸出：

(6, 3)

6.按照指定的列順序重新排列

df.columns = ['year','state', 'pop' ]

輸出：

	year	state	pop
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2

7.重新命名列

df.rename(columns={ df.columns[2]: "new name" }, inplace=True)

輸出：

	year	state	new name
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2

df = df.rename(columns={'col_1': 'col_a'})

輸出：

	col_a	state	new name
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2

重新命名所有列

df.columns = ['one','two','three']

輸出：

	one		two		three
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2

8.檢視行資訊

df.index

輸出：

RangeIndex(start=0, stop=6, step=1)

9.檢視某一列的取值種類
展示該列的所有種類

df['state'].unique()

輸出:

array(['Ohio', 'Nevada'], dtype=object)

計算所有種類數目

df['state'].nunique()

輸出：

10.檢視某列每個取值出現的次數

df['state'].value_counts()

輸出：

Ohio      3
Nevada    3
Name: state, dtype: int64

Pandas基礎（二）：DataFrame的行、列與資料型別

建立DataFrame資料： data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 2002, 2003],

Pandas入門基礎（二）：DataFrame的行、列與資料型別

建立DataFrame資料： data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 20

Spark SQL筆記整理（二）：DataFrame編程模型與操作案例

代碼最重要的 ssi func nbu 產生 michael array image DataFrame原理與解析 Spark SQL和DataFrame 1、Spark SQL是Spark中的一個模塊，主要用於進行結構化數據的處理。它提供的最核心的編程抽象，就是Data

SQL夯實基礎（二）：連接操作中使用on與where篩選的差異

img 範圍 ins name -s insert 如何篩選條件 utf 一、on篩選和where篩選　　在連接查詢語法中，另人迷惑首當其沖的就要屬on篩選和where篩選的區別了，如果在我們編寫查詢的時候，篩選條件的放置不管是在on後面還是where後面，查出來

PHP面試（二）：程序設計、框架基礎知識、算法與數據結構、高並發解決方案類

表設計工作原理結構單一入口 php 能力高並發解決方案數據表缺點一、程序設計 1、設計功能系統——數據表設計、數據表創建語句、連接數據庫的方式、編碼能力二、框架基礎知識 1、MVC框架基本原理——原理、常見框架、單一入口的工作原理、模板引擎的理解 2、常見框

Windows核心基礎（二）：虛擬記憶體空間佈局

32位Windows作業系統支援32位定址，因此2的32次方就等於4GB，每個程式在執行時都會被對映進4GB空間的記憶體空間，這4GB空間不全是使用者可以使用的，其中0x7fffffff-0xffffffff是2GB的核心空間，這部分用來儲存核心的資料，使用者程式是無法直接訪問的。

Python基礎（二）：List型別和Tuple型別、

List型別： List型別的定義： List是Python的內建型別，List是一種有序的集合。list構造簡單，直接用一對“[]”把list所用的元素括起來，並以“，”做間隔即可。list的元素並不要求必須是同類型的，一個list物件可以同時包含多個型別的元素。 L

Pandas基礎（四）：分組groupby的用法

首先採用kesci的第三套練習作為groupby的初步用法介紹，後面有什麼收穫或者心得再補充。原文連結： kesci資料分析練習題匯入庫和資料： import pandas as pd drinks = pd.read_csv('/drinks.csv') 用head方法檢視下

Pandas基礎（三）：資料的篩選

匯入pandas庫後，初始一個DataFrame： data = pd.DataFrame(np.arange(16).reshape((4, 4)), index=['Ohio', 'Colorado', 'Utah', 'New York

Pandas基礎（一）：資料的存取和檢視

使用pandas做資料分析，首先匯入pandas庫： import pandas as pd pandas的資料結構有兩種：Series和DataFrame。前者可以理解為陣列，後者可以理解為表格。我們主要講解DataFrame。 1.建立DataFrame：由等長列表構成。

java基礎（二）：一些簡單的固定方法

1.不通過第三個變數交換2個變數值 a = a+b; b = a-b; a = a-b; 2.列印正三角 for(int

java基礎（二）：深入理解String

一、String類 public final class String implements java.io.Serializable, Comparable<String>, CharSequence { /** Th

JDBC基礎（二）：Statement和Preparement

Statement物件是用來執行SQL語句的 PreparedStatement：預編譯的Statement物件，是Statement的子介面。一.效能和程式碼編寫的簡潔程度方面它允許資料庫預編譯SQL語句（這些SQL語句通常有帶有引數），以後每次只需

java基礎（二）：談談Java基本資料結構

資料結構是計算機儲存，組織資料的方式。資料結構是指相互之間存在一種或多種特定關係的資料元素的集合。通常情況下，精心選擇的資料結構可以帶來更高的執行或儲存效率。資料結構往往同高效的檢索演算法和索引技術有關 java中常見的幾種資料結構（也是初級工程師常見面試題）主要是一些常見的容器，它們主要來自於Collec

python知識梳理-基礎（二）：資料型別

python3 pycharm 一、字串用單引號、雙引號、三引號引用起來 a='test,abc' b="quit,wer" c='''i love_you,name！''' print(a,b,c) print(type(a),type(b),type(c))--------

linux網路程式設計之TCP/IP基礎（二）：利用ARP和ICMP協議解釋ping命令

一、MTU 乙太網和IEEE 802.3對資料幀的長度都有限制，其最大值分別是1500和1492位元組，將這個限制稱作最大傳輸單元（MTU，Maximum Transmission Unit）。如果I

Servlet基礎（二）：Servlet與JSP

詳情請檢視個人部落格Servlet基礎（二） JSP是一種指令碼語言，包裝了Java Servlet系統的介面，簡化了Java和Servlet的使用難度，同時通過擴充套件JSP標籤(TAG)提供

SQL夯實基礎（一）：inner join、outer join和cross join的區別

創建 color varchar mage bubuko where 是你 cross http 一、數據構建先建表，再說話 create database Test use Test create table A ( AID int identity(1

ElasticSearch筆記整理（二）：CURL操作、ES插件、集群安裝與核心概念

大數據 ElasticSearch ELK [TOC] CURL操作 CURL簡介 curl是利用URL語法在命令行方式下工作的開源文件傳輸工具，使用curl可以簡單實現常見的get/post請求。簡單的認為是可以在命令行下面訪問url的一個工具。在centos的默認庫裏面是有curl工具的，如

C#.網路程式設計 Tcp基礎（二） TCP組包、粘包、拆包的原理

一、TCP粘包，拆包及解決方法轉https://blog.csdn.net/scythe666/article/details/51996268 以下是轉發的部分內容我們都知道TCP屬於傳

Pandas基礎（二）：DataFrame的行、列與資料型別

相關推薦