python學習筆記——(2)pandas中的資料型別
阿新 • • 發佈:2018-11-12
在用python進行資料處理的時候,自帶的五種資料型別使用起來顯然是有侷限性的,python之強大在於各種包,在資料處理中用的最多的就是pandas和numpy。本文章主要介紹pandas的資料結構。
pandas有兩種資料結構
series
dataframe
Series
pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
是一種帶標籤的一維陣列
引數解釋:
data: 陣列或者字典
index:一維索引或者陣列
copy:是否複製data
變數宣告
obj = series([2,9,-10,333]) #通過陣列賦值
dict = {'name':John',score':100}
obj_dict = Series(dict)
屬性
obj.values #可以用list轉化為列表
obj.index #可以用list轉化為列表
建立帶索引的series:
l = [2,9,-10,333]
index = ['a','b','c','d']
obj = pd.Series(l,index,name='score')
按索引取值:
obj['a'] #返回 4
obj[['c','d']] #返回 [-5,3]
返回的型別仍然為series
對series進行運算:
e = obj[obj<0] #返回e仍然為series
f = obj * 10 #返回的f仍然為series
對series進行修改:
obj['a'] = 10 #將a的值修改為10
obj.index = ['f','b','c','d'] #修改索引
DataFrame
pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
DataFrame是一種類似表格的二維資料結構
引數解釋
data: numpy ndarray,字典或者dataframe
index: 索引或者類似索引
columns: 列名
DataFrame建立
從字典建立
從numpy ndarray建立(二維列表)
DataFrame索引
dic = {'name':['john','dick','lucy'],'sex':['man','man','woman'],'score':[100,80,90]}
index = ['first','second','third']
df = pd.DataFrame(dic,index = index)
DataFrame取值
取出某一列
df_name = df['name'] or df_name = df.name #取出name列
df2 = df[['name','score']] #取出兩列
取出某一行
df.ix['first']
df.ix[0]
取出某行某列
df['name']['first']
df.ix['first']['name']
結果都為:john
DataFrame內容修改
df['score'] = 100 #將所有的score修改為100
DataFrame按行遍歷
array = df.values #得到一個二維列表,每一行存在一個列表中
for row in array:
print(row)