DataFrame對行列的基本操作實戰

阿新 • • 發佈：2017-06-22

int32 from imp [1] object num 所有 col 三種

1、pandas對行列的基本操作命令：

import numpy as np
import pandas as pd
from pandas import Sereis, DataFrame

ser = Series(np.arange(3.))

data = DataFrame(np.arange(16).reshape(4,4),index=list(‘abcd‘),columns=list(‘wxyz‘))

data[‘w‘]  #選擇表格中的‘w‘列，使用類字典屬性,返回的是Series類型

data.w    #選擇表格中的‘w‘列，使用點屬性,返回的是Series類型

data[[ 
‘w‘]]  #選擇表格中的‘w‘列，返回的是DataFrame類型

data[[‘w‘,‘z‘]]  #選擇表格中的‘w‘、‘z‘列

data[0:2]  #返回第1行到第2行的所有行，前閉後開，包括前不包括後

data[1:2]  #返回第2行，從0計，返回的是單行，通過有前後值的索引形式，
       #如果采用data[1]則報錯

data.ix[1:2] #返回第2行的第三種方法，返回的是DataFrame，跟data[1:2]同

data[‘a‘:‘b‘]  #利用index值進行切片，返回的是**前閉後閉**的DataFrame, 
        #即末端是包含的  
data.irow(0)   # 
取data的第一行
data.icol(0)   #取data的第一列

data.head()  #返回data的前幾行數據，默認為前五行，需要前十行則data.head(10)
data.tail()  #返回data的後幾行數據，默認為後五行，需要後十行則data.tail(10)

ser.iget_value(0)  #選取ser序列中的第一個
ser.iget_value(-1) #選取ser序列中的最後一個，這種軸索引包含索引器的series不能采用ser[-1]去獲取最後一個，這會引起歧義。

data.iloc[-1]   #選取DataFrame最後一行，返回的是Series
data.iloc[-1:]   # 
選取DataFrame最後一行，返回的是DataFrame

data.loc[‘a‘,[‘w‘,‘x‘]]   #返回‘a’行‘w‘、‘x‘列，這種用於選取行索引列索引已知

data.iat[1,1]   #選取第二行第二列，用於已知行、列位置的選取。

2、對列的操作實戰

import pandas as pd
import numpy as np
# 構建一個3*5的矩陣
data = pd.DataFrame(np.arange(1, 31, 2).reshape(3, 5),
                    index=[‘one‘, ‘two‘, ‘three‘], columns=[‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘])
print(‘index‘, data.index)
print(‘data‘, data)
‘‘‘
index Index([‘one‘, ‘two‘, ‘three‘], dtype=‘object‘)
data         a   b   c   d   e
one     1   3   5   7   9
two    11  13  15  17  19
three  21  23  25  27  29
‘‘‘

# 對列的操作如下：

# 獲取某一列
col_a = data.get(‘a‘)
col_a = data.a
col_a = data[‘a‘]
print(‘col_a‘, type(col_a), col_a)
col_a = data[[‘a‘]]
print(‘col_a‘, type(col_a), col_a)
‘‘‘
col_a <class ‘pandas.core.series.Series‘> 
one       1
two      11
three    21
Name: a, dtype: int32
col_a <class ‘pandas.core.frame.DataFrame‘>         
        a
one     1
two    11
three  21
‘‘‘

cols = data.ix[:, [0, 1, 2]]  # 不知道列名只知道列的位置
print("cols1",cols)
cols = data.ix[1, [0]]  # 選擇第2行第1列的值
print("cols2",type(cols), cols)
cols = data.ix[1, 0]
print("cols3",type(cols), cols)
‘‘‘
cols1         
        a   b   c
one     1   3   5
two    11  13  15
three  21  23  25
cols2 <class ‘pandas.core.series.Series‘> 
a    11
Name: two, dtype: int32
cols3 <class ‘numpy.int32‘> 11
‘‘‘
cols = data.ix[[1, 2], [0]]  # 選擇第2,3行第1列的值
print("cols4",type(cols), cols)
cols = data.ix[0:2, [0, 2]]  # 選擇第1-2行第1、3列的值,不包括2行
print("cols5",type(cols), cols)
cols = data.ix[1:2, 2:4]  # 選擇第2-3行，3-5（不包括5）列的值
print("cols6",type(cols), cols)
cols = data.ix[data.a > 5, 3]  # 第1列中大於5所在的行第4列的值
print("cols7",type(cols), cols)
‘‘‘
cols4 <class ‘pandas.core.frame.DataFrame‘>         
        a
two    11
three  21
cols5 <class ‘pandas.core.frame.DataFrame‘>       
      a   c
one   1   5
two  11  15
cols6 <class ‘pandas.core.frame.DataFrame‘>       
     c   d
two  15  17
cols7 <class ‘pandas.core.series.Series‘> 
two      17
three    27
Name: d, dtype: int32
‘‘‘


cols = data.ix[1:3,[‘a‘,‘b‘]]  # 還可以行數或列數跟行名列名混著用
print("cols8",type(cols), cols)

cols = data.ix[‘one‘:‘two‘,[0,1]]  # 索引跟列用法類似，但包含開始、結束
print("cols9",type(cols), cols)

cols = data.ix[[‘one‘,‘three‘],[2,2]]  # 索引跟列用法類似
print("cols10",type(cols), cols)
‘‘‘
cols8 <class ‘pandas.core.frame.DataFrame‘>         
        a   b
two    11  13
three  21  23
cols9 <class ‘pandas.core.frame.DataFrame‘>       
      a   b
one   1   3
two  11  13
cols10 <class ‘pandas.core.frame.DataFrame‘>         
        c   c
one     5   5
three  25  25
‘‘‘

3、對行的操作實戰

# 對行的操作,對行操作必須采用切片的方式例如data[1:2],而不能data[1]或者data[‘one‘]
rows = data.ix[1]  # 獲取第1行，錯誤用法rows = data[1]  # 獲取第1行
rows = data[1:2]  # 獲取第1行，等價rows = data.ix[1:2]  # 獲取第1行
print("rows1",type(rows), rows)
rows = data[‘one‘:‘two‘]  # 當用已知的行索引時為前閉後閉區間，這點與切片稍有不同。
print("rows2",type(rows), rows)
‘‘‘
rows1 <class ‘pandas.core.frame.DataFrame‘>       
      a   b   c   d   e
two  11  13  15  17  19
rows2 <class ‘pandas.core.frame.DataFrame‘>       
      a   b   c   d   e
one   1   3   5   7   9
two  11  13  15  17  19
‘‘‘
#取DataFrame中最後一行，返回的是DataFrame類型,**註意**這種取法是有使用條件的，
# 只有當行索引不是數字索引時才可以使用，否則可以選用`data[-1:]`--返回DataFrame類型
# 或`data.irow(-1)`--返回Series類型
rows = data.ix[-1:]
print("rows3",type(rows), rows)
rows = data[-1:]  #跟上面一樣，取DataFrame中最後一行，返回的是DataFrame類型
print("rows4",type(rows), rows)
‘‘‘
rows3 <class ‘pandas.core.frame.DataFrame‘>         
        a   b   c   d   e
three  21  23  25  27  29
rows4 <class ‘pandas.core.frame.DataFrame‘>         
        a   b   c   d   e
three  21  23  25  27  29
‘‘‘
rows = data.head(1)   #返回DataFrame中的第一行
print("rows5",type(rows), rows)
rows = data.tail(1)   #返回DataFrame中的最後一行
print("rows6",type(rows), rows)
‘‘‘
rows5 <class ‘pandas.core.frame.DataFrame‘>      
     a  b  c  d  e
one  1  3  5  7  9
rows6 <class ‘pandas.core.frame.DataFrame‘>         
        a   b   c   d   e
three  21  23  25  27  29
‘‘‘

DataFrame對行列的基本操作實戰

int32 from imp [1] object num 所有 col 三種 1、pandas對行列的基本操作命令： import numpy as np import pandas as pd from pandas import Sereis, DataFrame

Python-借助xlsxwriter對Excel基本操作

ring log tle src ima 文件條形圖 def title 1導入第三方包，需單獨下載，安裝pip工具的情況下，可使用CMD下命令：pip install xlsxwriter 1 import xlsxwriter 2創建excel文件，新增一個工作簿

dataframe 對象的操作

python pandas DataFrame是Pandas中的一個表結構的數據結構，包括三部分信息，表頭（列的名稱），表的內容（二維矩陣），索引（每行一個唯一的標記）。一、DataFrame的創建有多種方式可以創建DataFrame，下面舉例介紹。例1：通過list創建復制代碼 >

Nodejs對postgresql基本操作的封裝

基於nodejs平臺對postgresql的增刪改查基本操作進行了封裝，能滿足基本的實際應用，比較複雜的SQL需另外實現。 PG.js檔案如下： var pg = require('pg'); var conString = "postgres://username:[e

對象序列化和反序列化的基本操作

bsp 序列 log png .cn ima images mage alt 對象序列化和反序列化的基本操作

對表數據的基本操作

-1 兩個指定沒有 har 操作 null 之間 pan --對日期的做法insert into wan values (‘ktf‘,5000,to_date(‘1980-08-11 14:40:23 ‘,‘yyyy-mm-dd hh24:mi:ss‘));sele

RDDs基本操作、RDDs特性、KeyValue對RDDs

clas count() cas 類型 cti 遍歷 strong 節點分布式摘要：RDD是Spark中極為重要的數據抽象，這裏總結RDD的概念，基本操作Transformation(轉換)與Action，RDDs的特性，KeyValue對RDDs的Transforma

PDO 對 mysql的基本操作

con ins nsa http array 查詢 pan rom 錯誤 PDO擴展操作 <?php $dsn = ‘mysql:dbname=yii2;host=localhost‘; $user = ‘root‘; $password = ‘123456‘;

redis對key的基本操作

mman sel .com error .net exist flushdb empty flush 　　不忘初心，勵誌前行 del key1 key2 ... Keyn作用: 刪除1個或多個鍵返回值: 不存在的key忽略掉,返回真正刪除的key的數量 rename ke

java對redis的基本操作

pac 同時功能 serve chm 更新程序 bench 模擬 2、安裝　　　　1）解壓後將裏面所有文件拷貝至redis安裝目錄：幾個exe程序的功能：　　　　　　　　　 redis-benchmark.exe：性能測試，用以模擬同時由N個客戶端發

pandas庫介紹之DataFrame基本操作

讀取excel 操作 pyplot 分組寫入 pos ner 結構此外怎樣刪除list中空字符？最簡單的方法：new_list = [ x for x in li if x != ‘‘ ] 今天是5.1號。這一部分主要學習pandas中基於前面兩種數據結構的基

DataFrame基本操作

randn range 在一起 light 百度 column dataframe data 網上這些操作在網上都可以百度得到，為了便於記憶自己再根據理解總結在一起。---------勵誌做一個優雅的網上搬運工 1.建立dataframe （1）Dict to Dataf

C語言對文件的基本操作

file結構體參考 b- https rewind 語言正在 cpp 作文件在C語言中，對於文件的操作是利用FILE結構體進行的。幾個常用的操作文件函數簡介 1：打開文件 FILE *fopen( const char *filename, const char

java 對類型的基本操作小結

() sage PE nor .get eight getname valueof XML 1.json 字符串轉換成對象 SyncCarriageStatusDTO dto= JSON.parseObject(value,SyncCarriageStatusDTO.cla

ubuntu 對拍和基本操作

打開 date CP cpp 生成器 rm -rf 方法 LG names 轉自夏天學長我們在學對拍之前先學一下diff diff my.out right.out; 這樣就能比較兩個文件。建一個check.sh，把上面一句話寫進去就行了。 bash ./check.

DataFrame基本操作 <三> 計算名次，移除重復數據，數據替換，劃分區間，分組統計（變成類）

pla cti 特定但是 afr bin 條件 IV 用法生成一個實例 df5 = DataFrame({‘b‘: [4.3, 7, -3, 2], ‘a‘: [0, 1, 0, 1], ‘c‘: [

Linux下對MySQL/MariaDB數據庫的基本操作以及linux mysql添加用戶，刪除用戶，以及用戶權限的授予

信息查看 let quit mar 普通用戶表名 mys xxxx 文章引用地址:https://www.cnblogs.com/Glory-D/p/7518541.html、https://www.cnblogs.com/zhchoutai/p/6929103.htm

Flask中對MySQL的基本操作

_id onf 使用 info eat offset enter rac 圖片在Flask-SQLAlchemy中，插入、修改、刪除操作，均由數據庫會話管理。會話用 db.session 表示。在準備把數據寫入數據庫前，要先將數據添加到會話中然後調用 commit

Gitlab管理之二–Gitab中創建項目並對項目執行基本操作

bee dsw sam byte 密碼 rep posit -m rand 創建項目（1）Gitlab項目的可見類型有三種級別。 Private project: 該級別是只有項目擁有者或者已經得到授權的人可以訪問該項目，或者這些人是該項目組的成員。Internal p

python對kafka的基本操作

消息 server close trap cor timeout produce posit 拉取 -- coding:utf-8 -- from kafka import KafkaProducerfrom kafka import KafkaConsumerfrom k

DataFrame對行列的基本操作實戰

相關推薦