1. 程式人生 > >Python資料分析學習筆記(1)numpy模組基礎入門

Python資料分析學習筆記(1)numpy模組基礎入門

        numpy模組可以進行高效的資料處理,並提供了陣列的支援,很多模組都依賴他,比如pandas、scipy、matplotlib等,因此這個模組是基礎。

(1)匯入:

import numpy

(2)建立一維和二維陣列:

#建立一維陣列
x=numpy.array(["1","3","r","u","a"])
#建立二維陣列
y=numpy.array([[1,2],[22,2],[11,8]])

      結果:

>>> x
array(['1', '3', 'a', 'r', 'u'], dtype='<U1')
>>> y
array([[ 1,  2],
       [ 2, 22],
       [ 8, 11]])

(3)提取陣列特定值:

#建立一維陣列
x=numpy.array(["1","3","r","u","a"])
#建立二維陣列
y=numpy.array([[1,2],[22,2],[11,8]])

#輸出一維陣列的首個元素
print(x[0])
#輸出二維陣列的第2索引的首個元素
print(y[2][0])

    結果:

1
11

(4)陣列最大最小值:

#取最大值和最小值
y1=y.max()#所有元素的最大值
y2=y.min()#所有元素的最小值

    結果:

>>> y1
22
>>> y2
1

(5)陣列元素排序:

#建立一維陣列
x=numpy.array(["1","3","r","u","a"])
#建立二維陣列
y=numpy.array([[1,2],[22,2],[11,8]])
#排序
x.sort()
y.sort()#對二維中的每個一維排序

    結果:

>>> x
array(['1', '3', 'a', 'r', 'u'], dtype='<U1')
>>> y
array([[ 1,  2],
       [ 2, 22],
       [ 8, 11]])

(6)切片:按下標取某一片段元素

#建立一維陣列
x=numpy.array(["1","3","r","u","a"])

#切片:按下標取某一片段元素
#格式:陣列[起始下標:最終下標+1]
x[1:3]#"3","r"
x[:3]#"1","3","r"
x[1:]#"3","r","u","a"

(7)資料整合:

將多個數據源合併存在一個一致的資料儲存中,要考慮實體識別問題和屬性冗餘問題,從而將資料在最低層上加以轉換、提煉和整合:

a=numpy.array([[1,5,6],[9,4,3]])
b=numpy.array([[4,2,2],[1,2,7]])
#將兩個陣列整合在一起
c=numpy.concatenate((a,b))
#輸出測試
print(c)