1. 程式人生 > >Python之Pandas(1)

Python之Pandas(1)

import numpy as np
import pandas as pd
In [2]:

#Series:一維陣列,與Numpy中的一維array類似。二者與Python基本的資料結構List也很相近,其區別是:List中的元素可以是不同的資料型別,而Array和Series中則只允許儲存相同的資料型別,這樣可以更有效的使用記憶體,提高運算效率。
#Time- Series:以時間為索引的Series。
#DataFrame:二維的表格型資料結構。很多功能與R中的data.frame類似。可以將DataFrame理解為Series的容器。以下的內容主要以DataFrame為主。
#Panel :三維的陣列,可以理解為DataFrame的容器。
In [9]:

#series 是帶有標籤的一維陣列,可以儲存任何的資料型別
#Series 就如同列表一樣,一系列資料,每個資料對應一個索引值。
#Series 就是“豎起來”的 list:
rng = np.random.RandomState(1)
ar = rng.rand(5)
print(ar)
s = pd.Series(rng.rand(5))
print(s)
​
#index 檢視series的索引,型別是RangeIndex
print(s.index)
#values 是series的值,型別是ndarray
print(s.values)
#series 相對於陣列多了一個標籤,類似字典,字典的key就是index,value就是陣列
[4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01
 1.46755891e-01]
0    0.092339
1    0.186260
2    0.345561
3    0.396767
4    0.538817
dtype: float64
RangeIndex(start=0, stop=5, step=1)
[0.09233859 0.18626021 0.34556073 0.39676747 0.53881673]
In [15]:

rng = np.random.RandomState(1)
ar = rng.rand(5)
s = pd.Series(ar)
s.rename("Kobe")
a    99
b    66
c    77
dtype: int64
Out[15]:
0    0.417022
1    0.720324
2    0.000114
3    0.302333
4    0.146756
Name: Kobe, dtype: float64
In [19]:

#字典建立Series
s1 = pd.Series({"Jack":90,"Rose":80,"Tom":70},name = "homework")
print(s1)
Jack    90
Rose    80
Tom     70
Name: homework, dtype: int64
In [21]:

#index建立Series
#series的建立
s = pd.Series([99,66,77],index = ['a','b','c'],name = "homework")
print(s)
a    99
b    66
c    77
Name: homework, dtype: int64

 

import numpy as np
import pandas as pd
In [2]:

#Series:一維陣列,與Numpy中的一維array類似。二者與Python基本的資料結構List也很相近,其區別是:List中的元素可以是不同的資料型別,而Array和Series中則只允許儲存相同的資料型別,這樣可以更有效的使用記憶體,提高運算效率。
#Time- Series:以時間為索引的Series。
#DataFrame:二維的表格型資料結構。很多功能與R中的data.frame類似。可以將DataFrame理解為Series的容器。以下的內容主要以DataFrame為主。
#Panel :三維的陣列,可以理解為DataFrame的容器。
In [9]:

#series 是帶有標籤的一維陣列,可以儲存任何的資料型別
#Series 就如同列表一樣,一系列資料,每個資料對應一個索引值。
#Series 就是“豎起來”的 list:
rng = np.random.RandomState(1)
ar = rng.rand(5)
print(ar)
s = pd.Series(rng.rand(5))
print(s)
​
#index 檢視series的索引,型別是RangeIndex
print(s.index)
#values 是series的值,型別是ndarray
print(s.values)
#series 相對於陣列多了一個標籤,類似字典,字典的key就是index,value就是陣列
[4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01
 1.46755891e-01]
0    0.092339
1    0.186260
2    0.345561
3    0.396767
4    0.538817
dtype: float64
RangeIndex(start=0, stop=5, step=1)
[0.09233859 0.18626021 0.34556073 0.39676747 0.53881673]
In [15]:

rng = np.random.RandomState(1)
ar = rng.rand(5)
s = pd.Series(ar)
s.rename("Kobe")
a    99
b    66
c    77
dtype: int64
Out[15]:
0    0.417022
1    0.720324
2    0.000114
3    0.302333
4    0.146756
Name: Kobe, dtype: float64
In [19]:

#字典建立Series
s1 = pd.Series({"Jack":90,"Rose":80,"Tom":70},name = "homework")
print(s1)
Jack    90
Rose    80
Tom     70
Name: homework, dtype: int64
In [21]:

#index建立Series
#series的建立
s = pd.Series([99,66,77],index = ['a','b','c'],name = "homework")
print(s)
a    99
b    66
c    77
Name: homework, dtype: int64