1. 程式人生 > 實用技巧 >Python資料分析重要庫Pandas:資料清洗後的資料整合

Python資料分析重要庫Pandas:資料清洗後的資料整合

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Pandas合併資料

組合或合併資料時,pandas 有幾個不同選項。在 Jupyter的Notebook中,建立兩個新的資料幀併合並資料。可以使用 append() 來合併這些資料幀。【案例】將城市名,人口和麵積的兩組資料合併。

A..append()

import pandas as pd
data = {'city':['London','Manchester','Birmingham','Leeds','Glasgow'],
        'population': [9787426,  2553379,2440986,1777934,1209143],
        'area':[1737.9,630.3,598.9,487.8,  368.5 ]}
cities = pd.DataFrame(data)
data2 = {'city':['Liverpool','Southampton'],
        'population': [864122,  855569],
        'area':[199.6,   192.0]}
cities2 = pd.DataFrame(data2)
cities = cities.append(cities2)
cities

其操作是“data1 = data1.append(data2)” 將data2連線到data1的尾部。再賦值給data1。要注意data1和data2應具有相同的結構。

B..concat()

frames = [cities, cities2]
df = pd.concat(frames)
df

像其在ndarray上的同級函式一樣numpy.concatenate(),pandas.concat()採用同類物件的列表或字典。

frames = [cities, cities2]
df = pd.concat(frames, keys=['x', 'y'])
df

加入關鍵字keys引數進行不同資料來源的區分。

然後可以根據資料來源直接檢視定位所需的資料。

df.loc['y']

以上文章來源於源一學園,作者 房媛

轉載地址

https://blog.csdn.net/fei347795790?t=1