Python資料分析重要庫Pandas:資料清洗後的資料整合
阿新 • • 發佈:2020-10-05
本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。
Pandas合併資料
組合或合併資料時,pandas 有幾個不同選項。在 Jupyter的Notebook中,建立兩個新的資料幀併合並資料。可以使用 append() 來合併這些資料幀。【案例】將城市名,人口和麵積的兩組資料合併。
A..append()
import pandas as pd
data = {'city':['London','Manchester','Birmingham','Leeds','Glasgow'],
'population': [9787426, 2553379,2440986,1777934,1209143],
'area':[1737.9,630.3,598.9,487.8, 368.5 ]}
cities = pd.DataFrame(data)
data2 = {'city':['Liverpool','Southampton'],
'population': [864122, 855569],
'area':[199.6, 192.0]}
cities2 = pd.DataFrame(data2)
cities = cities.append(cities2)
cities
其操作是“data1 = data1.append(data2)” 將data2連線到data1的尾部。再賦值給data1。要注意data1和data2應具有相同的結構。
B..concat()
frames = [cities, cities2]
df = pd.concat(frames)
df
像其在ndarray上的同級函式一樣numpy.concatenate(),pandas.concat()採用同類物件的列表或字典。
frames = [cities, cities2]
df = pd.concat(frames, keys=['x', 'y'])
df
加入關鍵字keys引數進行不同資料來源的區分。
然後可以根據資料來源直接檢視定位所需的資料。
df.loc['y']
以上文章來源於源一學園,作者 房媛
轉載地址
https://blog.csdn.net/fei347795790?t=1