numpy函式筆記(持續更新)
numpy函式筆記
np.isin用法
np.isin(a,b)
用於判定a中的元素在b中是否出現過,如果出現過返回True,否則返回False,最終結果為一個形狀和a一模一樣的陣列。(注意:這裡的a和b是像陣列型別就行,比如列表的話,傳入進去之後,numpy會自動將其轉化為numpy陣列)- 但是當引數invert被設定為True時,情況恰好相反,如果a中元素在b中沒有出現則返回True,如果出現了則返回False.
import numpy as np # 這裡使用reshape是為了驗證是否對高維陣列適用,返回一個和a形狀一樣的陣列 a=np.array([1,3,7]).reshape(3,1) b=np.arange(9).reshape(3,3) # a 中的元素是否在b中,如果在b中顯示True Np_No_invert=np.isin(a, b, invert=False) print("Np_No_invert\n",Np_No_invert) # a 中的元素是否在b中,如果設定了invert=True,則情況恰恰相反,即a中元素在b中則返回False Np_invert=np.isin(a, b, invert=True) print("Np_invert\n",Np_invert) # Np_No_invert # [[ True] # [ True] # [ True]] # Np_invert # [[False] # [False] # [False]]
numpy.cumsum()
numpy.cumsum(a, axis=None, dtype=None, out=None)
axis=0,按照行累加。
axis=1,按照列累加。
axis不給定具體值,就把numpy陣列當成一個一維陣列。
注意這裡的行和列和普通認為的不一樣,只要認定為是往哪一個軸進行相加。
也就是按照指定維度進行相加
例子如下:
a Out[6]: array([[-0.94525613, -0.84632869, 0.65120093], [ 0.11813225, 0.22240677, -1.6212242 ], [-0.80511744, 1.04439191, -1.45651271]]) np.cumsum(a,1) Out[8]: array([[-0.94525613, -1.79158482, -1.14038389], [ 0.11813225, 0.34053902, -1.28068518], [-0.80511744, 0.23927446, -1.21723825]])
np.around 和np.round四捨五入
這兩個函式的功能是一樣的,np.round內部呼叫的就是np.around。
np.around 返回四捨五入後的值,可指定精度。
around(a, decimals=0, out=None)
a 輸入陣列
decimals 要舍入的小數位數。 預設值為0。 如果為負,整數將四捨五入到小數點左側的位置
import numpy as np n = np.array([-0.746, 4.6, 9.4, 7.447, 10.455, 11.555]) around1 = np.around(n) print(around1) # [ -1. 5. 9. 7. 10. 12.] around2 = np.around(n, decimals=1) print(around2) # [ -0.7 4.6 9.4 7.4 10.5 11.6] around3 = np.around(n, decimals=-1) print(around3) # [ -0. 0. 10. 10. 10. 10.] a=np.random.randn(3,3) a Out[6]: array([[-0.94525613, -0.84632869, 0.65120093], [ 0.11813225, 0.22240677, -1.6212242 ], [-0.80511744, 1.04439191, -1.45651271]]) np.round(a,2) Out[7]: array([[-0.95, -0.85, 0.65], [ 0.12, 0.22, -1.62], [-0.81, 1.04, -1.46]])
np.floor 向下取整
np.floor 返回不大於輸入引數的最大整數。 即對於輸入值 x ,將返回最大的整數 i ,使得 i <= x。 注意在Python中,向下取整總是從 0 舍入。
import numpy as np
n = np.array([-1.7, -2.5, -0.2, 0.6, 1.2, 2.7, 11])
floor = np.floor(n)
print(floor) # [ -2. -3. -1. 0. 1. 2. 11.]
np.ceil 向上取整
np.ceil 函式返回輸入值的上限,即對於輸入 x ,返回最小的整數 i ,使得 i> = x。
import numpy as np
n = np.array([-1.7, -2.5, -0.2, 0.6, 1.2, 2.7, 11])
ceil = np.ceil(n)
print(ceil) # [ -1. -2. -0. 1. 2. 3. 11.]
NumPy中的diag函式
NumPy包中的內建diag函式很有意思。
假設建立一個1維陣列a,和一個3*3陣列b:
import numpy as np
a = np.arange(1, 4)
b = np.arange(1, 10).reshape(3, 3)
結果如下:
>>> a
array([1, 2, 3])
>>> b
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
使用diag函式,看一看結果:
>>> np.diag(a)
array([[1, 0, 0],
[0, 2, 0],
[0, 0, 3]])
>>> np.diag(b)
array([1, 5, 9])
可以發現,當 np.diag(array) 中
array是一個1維陣列時,結果形成一個以一維陣列為對角線元素的矩陣
array是一個二維矩陣時,結果輸出矩陣的對角線元素
np.set_printoptions函式
設定列印選項。也就是指定如何列印numpy陣列,如何顯示numpy陣列。
這些選項確定浮點數、陣列和其他 NumPy 物件的顯示方式。
引數解釋
-
precision:int 或無,可選
浮點輸出的精度位數(預設 8)。如果浮點模式不是固定的,則可能是"無",以列印儘可能多的數字以唯一指定值。
-
threshold:int, 可選
觸發彙總而不是完全 repr 的陣列元素總數(預設 1000)。要始終使用完整重供而不彙總,請傳遞
sys.maxsize
。 -
edgeitems :int, 可選
每個維度的開頭和末尾彙總中的陣列項數(預設值 3)。
-
linewidth:int, 可選
用於插入換行符/行數(預設為 75)。
-
suppress :布林, 可選
如果為 True,則始終使用固定點表示法列印浮點編號,在這種情況下,當前精度中等於零的數字將列印為零。如果 False,則當最小數字的絕對值為 < 1e-4 或最大絕對值與最小值的比率為 > 1e3 時,則使用科學表示法。預設值為 False。
-
nanstr: str,可選
浮點非數字(預設 nan)的字串表示形式。
-
infstr :str, 可選
浮點無窮大的字串表示形式(預設 inf)。
-
sign :字串,"-","+"或"",可選
控制浮點型別的符號的列印。如果為"+",請始終列印正值的符號。如果 '',則始終在正值的符號位置列印空格(空白字元)。如果為"-",則省略正值的符號字元。(預設為"-")
-
formatter :呼叫的字典,可選
如果不是"無",則鍵應指示相應格式函式應用於的型別。可呼叫項應返回字串。未指定的型別(由其相應的鍵)由預設格式器處理。可設定可處理的單個型別包括:
- "布林"
- "int"
- "時間德爾塔" : a
numpy.timedelta64
- "日期時間": a
numpy.datetime64
- "浮動"
- "長浮":128位浮子
- "複雜漂浮"
- "長共體浮":由兩個128位浮子組成
- "數字":型別和
numpy.string_``numpy.unicode_
- "物件":np.object_陣列
- "str" : 所有其他字串
可用於同時設定一組型別的其他鍵包括:
- "全部":設定所有型別
- "int_kind": 設定"int"
- "float_kind":設定"浮動"和"長浮"
- "complex_kind":設定"複雜浮"和"長複雜浮"
- "str_kind":設定"str"和"numpystr"
-
**floatmode : **str,可選
控制浮點型別的精度選項的解釋。可以採取以下值(預設maxprec_equal):
-
"固定":始終列印精確分數數字,
即使這樣列印的數字數會超過唯一指定值所需的數字。
-
"唯一":列印所需的最小小數數字
以唯一方式表示每個值。不同的元素可能具有不同的數字數。精度選項的值將被忽略。
-
"maxprec":以最精確的小數列印,但如果
元素可以唯一表示,數字較少,只能用這麼多數字列印它。
-
"maxprec_equal":以最精確的小數列印,
但是,如果陣列中的每個元素都可以以相同數量的較少數字的唯一表示,則所有元素都使用該數字。
-
官方文件例子
可以設定浮點精度:
>>>
>>> np.set_printoptions(precision=4)
>>> np.array([1.123456789])
[1.1235]
可以總結長陣列:
>>>
>>> np.set_printoptions(threshold=5)
>>> np.arange(10)
array([0, 1, 2, ..., 7, 8, 9])
小結果可以抑制:
>>>
>>> eps = np.finfo(float).eps
>>> x = np.arange(4.)
>>> x**2 - (x + eps)**2
array([-4.9304e-32, -4.4409e-16, 0.0000e+00, 0.0000e+00])
>>> np.set_printoptions(suppress=True)
>>> x**2 - (x + eps)**2
array([-0., -0., 0., 0.])
自定義格式可用於根據需要顯示陣列元素:
>>>
>>> np.set_printoptions(formatter={'all':lambda x: 'int: '+str(-x)})
>>> x = np.arange(3)
>>> x
array([int: 0, int: -1, int: -2])
>>> np.set_printoptions() # formatter gets reset
>>> x
array([0, 1, 2])
若要放回預設選項,可以使用:
>>>
>>> np.set_printoptions(edgeitems=3, infstr='inf',
... linewidth=75, nanstr='nan', precision=8,
... suppress=False, threshold=1000, formatter=None)
此外,若要臨時覆蓋選項,請使用列印選項
作為上下文管理器:
>>>
>>> with np.printoptions(precision=2, suppress=True, threshold=5):
... np.linspace(0, 10, 10)
array([ 0. , 1.11, 2.22, ..., 7.78, 8.89, 10. ])
np.vdot點積函式
矩陣點積為兩個矩陣對應元素乘積之和
定義兩個矩陣a和b
#定義兩個矩陣
a=np.array([[4,3],[5,6]])
b=np.array([[10,11],[12,13]])
print("a")
print(a)
print("b")
print(b)
輸出結果:
a
[[4 3]
[5 6]]
b
[[10 11]
[12 13]]
使用vdot函式計算a和b的點積
#矩陣點積 vdot函式,
#矩陣點積計算公式:兩個矩陣對應位置元素乘積之和
c=np.vdot(a,b)
print("c")
print(c)
輸出結果:
c
211
np.nonzero(a)
返回:陣列a中非零元素的索引值陣列
import numpy as np
a = np.random.uniform(-10, 10, 4)
print(a)
[ 2.69869382 -8.87937198 4.70100555 1.87901029]
b = np.nonzero(a)
print(b)
(array([0, 1, 2, 3], dtype=int64),)
#a是一維陣列,有4個非零元素,返回4個非零元素的序號
a = [[0, 1, 1],
[1, 0, 1],
[1, 1, 0]]
print(a)
[[0, 1, 1], [1, 0, 1], [1, 1, 0]]
b = np.nonzero(a)
print(b)
(array([0, 0, 1, 1, 2, 2], dtype=int64), array([1, 2, 0, 2, 0, 1], dtype=int64))
#a是二維陣列,array長度為6,即a有6個非零元素,第一個array是對非零元素的row描述,
#第二個array是對col的描述。索引元組b一直都是二維陣列
print(np.transpose(b))
[[0 1]
[0 2]
[1 0]
[1 2]
[2 0]
[2 1]]
#呼叫transpose轉置索引序號b元組,非零元素的序號[0,1],即第0行,第一列,以此類推。
np.amin(a,axis=k)
返回 :一維陣列a中的最小值,二維陣列需通過axis指定行或列,獲取行或列的最小值,如不指定,則是所有元素的最小值
import numpy as np
a = [[0, 1, 2],
[1, 0, 3],
[1, 4, 0]]
a1 = np.asarray(a, dtype = np.float32)
print(a1[np.nonzero(a1)])
[ 1. 2. 1. 3. 1. 4.]
#使用a[np.nonzero(a)]獲取a中所有非零值,變一維陣列,但需要將a轉換成array
print(np.amin(a1[np.nonzero(a1)]))
1.0
#獲取陣列的最小值
#把a1中等於0的值換成a1陣列中的最小值
a1[a1==0] = np.amin(a1[np.nonzero(a1)])
print('a1 = ', a1)
a1 = [[ 1. 1. 2.]
[ 1. 1. 3.]
[ 1. 4. 1.]]
np.amax(a, axis=k)
返回:一維陣列a中的最大值,二維陣列需通過axis指定行或列,獲取行或列的最大值,如不指定,則是所有元素的最大值
import numpy as np
a = [[1,4,7],
[2,5,8],
[3,6,9]]
b = np.amax(a, axis=0)
print(b)
b = [3,6,9]