Numpy對陣列的操作:建立、變形(升降維等)、計算、取值、複製、分割、合併
1. 簡介
NumPy(Numerical Python) 是 Python 語言的一個擴充套件程式庫,支援大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。最主要的資料結構是ndarray陣列。
NumPy 通常與 SciPy(Scientific Python)和 Matplotlib(繪相簿)一起使用, 這種組合廣泛用於替代 MatLab。
SciPy 是一個開源的 Python 演算法庫和數學工具包。SciPy 包含的模組有最優化、線性代數、積分、插值、特殊函式、快速傅立葉變換、訊號處理和影象處理、常微分方程求解和其他科學與工程中常用的計算。
Matplotlib 是 Python 程式語言及其數值數學擴充套件包 NumPy 的視覺化操作介面。
2. 建立
建立一維陣列
(1)直接建立:np.array([1,2,3,4,5,6])
(2)從python的list中建立:np.array(list([1,6]))
建立常量值的一維資料
(1)建立以0為常量值:np.zeros(n,dytpe=float/int)
(2)建立以1為常量值:np.ones(n)
(3)建立一個空陣列:np.empty(4)
建立一個元素遞增的陣列
(1)從0開始增長的遞增陣列:np.arange(8)
(2)給定區間,自定義步長:np.arange(0,1,0.2)
(3)給定區間,自定義個數:np.linspace(-1,50)
建立多維陣列:建立單維陣列,再新增進多維陣列
# 陣列的結構一定是np.array([]) 無論陣列中間存放的是多少“層”資料 # 二維陣列相當於存放的是“兩層”陣列而已 arr1=np.array(list([1,5])) arr2=np.array([arr1,[1,0]]) # 2*5的兩維陣列 arr3=np.array(list([[0,1],0],[2,6]])) # 3*5的兩維陣列 arrx=np.array([arr1,list([1,5],0])]) # 報錯 arry=np.array([list([[ 1,7,11],6]]),5]]) # 報錯
建立常量值的(n*m)維資料
(1)建立以0為常量值:np.zeros((n*m),dytpe=float/int)
(3)建立一個空陣列:np.empty((n*m))
建立隨機數字的陣列
生成隨機數種子:
(1)np.random.seed()
(2)np.random.RandomState()
生成隨機數:
函式 | 取值 | 說明 | |
---|---|---|---|
1 | np.random.rand (d0,d1,…,dn) |
[0,1) | 根據給定維度生成陣列,服從均勻分佈 |
2 | np.random.randint (low,high=None,size=None,dtype='l') |
[0,low)或者[low,high) | 根據size生成離散均勻分佈的整數值 |
3 | np.random.randn (d0,dn) |
根據給定維度生成陣列,服從標準正態分佈 | |
4 | np.random.random_sample(size=None) | [0,1) | 根據給定維度生成隨機浮點數 |
5 | np.random.random(size=None) | [0,1) | 根據給定維度生成隨機浮點數 |
6 | np.random.ranf(size=None) | [0,1) | 根據給定維度生成隨機浮點數 |
7 | np.random.sample(size=None) | [0,1) | 根據給定維度生成隨機浮點數 |
生成有分佈規律的隨機陣列
(1)二項分佈:np.random.binomial(n,p,size)
(2)正態分佈:np.random.normal(loc,scale,size)
將csv檔案轉化成陣列或陣列
使用 np.genfromtxt( ‘csv檔名',delimiter = ‘檔案中的分割符' )函式將檔案轉化成陣列
csv_array = np.genfromtxt('sample.csv',delimiter=',') print(csv_array)
3. 陣列的變形
生成陣列/矩陣轉置的函式,即行列數字交換,使用.T
a = np.array([[32,15,6,9,14],[12,10,23,16,13,40,37]]) print(a.T) ------------------- # 結果如下 [[32 12 2] [15 10 16] [ 6 5 13] [ 9 23 40] [14 1 37]]
改變陣列的形狀:
(1)arr.resize(n,m) :arr.resize(n,m)函式是原地修改陣列,要求:元素的個數必須一致
a=np.arange(8) a.resize(2,4) print(a) --------------------------- [[0 1 2 3] [4 5 6 7]]
(2)arr.reshape(n,m):如果某一個維度的引數為-1,則表示元素總個數會遷就另一個維度來計算
a=np.arange(8).reshape(-1,1) print(a) ----------------- [[0] [1] [2] [3] [4] [5] [6] [7]]
將一維升至二維:np.newaxis
np.newaxis實際上是直接增加維度的意思,我們一般不會給陣列增加太多維度,這裡以一維增加到二維為例:
(1)增加行維度:arr[np.newaxis,:]
(2)增加列維度:arr[:,np.newaxis]
a=np.arange(8) a # array([0,7]) a.shape # (8,) a[np.newaxis,:] # array([[0,7]]) a.shape # (8,) a[:,np.newaxis] # array([[0],[1],[2],[3],[4],[5],[6],[7]]) a.shape # (8,)
降維:arr.ravel()
arr.ravel()函式在降維時:預設是行序優先生成新陣列(就是一行行讀);如果傳入引數“F”則是列序降維生成新陣列
a=np.array([[1,2],[3,4]]) a.ravel() a.ravel('F') ---------------------------- # 結果 array([1,4]) # 結果 array([1,4])
4. 計算
對陣列進行計算操作
(1)對元素進行加減計算
a=np.arange(8).reshape(2,4) # array([[0,3],[4,7]]) b=np.random.randint(8,size=(2,4)) # array([[1,6]]) a+b a-b ---------------------------- # a+b和a-b結果分別是: array([[ 1,6],[ 8,13]]) array([[-1,-1,-3,[ 0,1]])
(2)乘法:平方/矩陣中元素相乘
a=np.arange(8).reshape(2,6]]) a**2 a*b ----------------------- # a矩陣平方/a*b矩陣中元素相乘結果分別: array([[ 0,9],[16,25,36,49]]) array([[ 0,42]])
(3)矩陣*矩陣:
# 要求a矩陣的行要等於b矩陣的列數;且a矩陣的列等於b矩陣的行數 a=np.arange(8).reshape(2,size=(4,2)) # array([[3,[5,[6,7]]) c1 = np.dot(a,b) c2 = a.dot(b) ---------------------- # ab矩陣相乘的結果:c1=c2 array([[ 31,36],[ 99,100]])
(4)邏輯計算
【注】列表是無法作為一個整體對其中的各個元素進行邏輯判斷的!
# 結果返回:一個數組,其中每個元素根據邏輯判斷的布林型別的結果 a > 3 ----------------------------- # 結果如下: array([[False,False,False],[ True,True,True]])
5. 取值
獲取一維陣列中的某個元素:操作和list列表的index一樣
a = np.array([5,11]) a[0] # 結果為 5 a[:4] # 結果為 從頭開始到索引為4結束 a[2:] # 結果為 從索引為2的開始到結尾 a[::2] # 結果為 從頭開始到結尾,每2個取一個值
獲取多維陣列的某個元素,某行或列值
a = np.array([[32,37]]) a[2,1] # 結果是一個元素 16 a[2][1] # 結果是一個元素 16 a[1] # 第2行 array([12,1]) a[:,2] # 取出全部行,第2列 [15,16] a[1:3,:] # 取出[1,3)行,全部列 a[1,1:] # array([10,1])
獲取滿足邏輯運算的
# 需要注意的是,我們資料進行邏輯計算操作得到的仍然是一個數組 # 如果我們想要的是一個過濾後的陣列,就需要將"邏輯判斷"傳入陣列中 a = np.array([[32,37]]) a[a > 3] a[(a > 3) | (a < 2)] ------------------------------ # 結果分別是: array([32,14,12,37]) array([32,37])
遍歷:結果是按行輸出
a = np.array([[32,37]]) for x in a: print(x) -------------------- [32 15 6 9 14] [12 10 5 23 1] [ 2 16 13 40 37]
6. 複製/分割/合併
複製:arr.cope()
分割:
(1)等分:np.split(arr,n,axis=0/1)(即行數或列數可以整除n時才可以)
(2)不等分:np.array_split(arr,n) 預設按行分n份
a = np.array([[32,21],10],37,8]]) # 可以看到a矩陣是(3*6),所以使用np.split()只能嘗試行分成3份;或者列分成2/3/6份 np.split(a,axis=0) np.split(a,axis=1) np.array_split(a,2) np.array_split(a,axis=1) ------------------------------------------- [array([[32,21]]),array([[12,10]]),array([[ 2,8]])] [array([[32,15],[ 2,16]]),array([[ 6,[ 5,23],[13,40]]),array([[14,[ 1,[37,8]])] [array([[32,array([[14],[ 1],[37]]),array([[21],[10],[ 8]])]
合併:np.concatenate((arr1,arr2,arr3),axis=0/1) 預設接在資料下面
a=np.random.rand(2,3) b=np.random.randint(1,3)) np.concatenate((a,b,a)) # 接在下面 np.concatenate((a,a),axis=1) # 接在後面 ------------------------ array([[0.95912866,0.81396527,0.809493 ],[0.4539276,0.24173315,0.63931439],[0.,0.,0. ],[0.95912866,0.63931439]]) array([[0.95912866,0.809493,0.95912866,0.63931439,0.4539276,0.63931439]])
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。