資料科學和人工智慧技術筆記一、向量、矩陣和陣列

阿新 • • 發佈：2018-11-15

一、向量、矩陣和陣列

作者：Chris Albon

譯者：飛龍

協議：CC BY-NC-SA 4.0

轉置矩陣或向量

# 載入庫
import numpy as np

# 建立向量
vector = np.array([1, 2, 3, 4, 5, 6])

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 轉置向量
vector.T

# array([1, 2, 3, 4, 5, 6]) 

# 轉置矩陣 

matrix.T

'''
array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]]) 
'''

選擇陣列中的元素

# 載入庫
import numpy as np

# 建立行向量
vector = np.array([1, 2, 3, 4, 5, 6])

# 選擇第二個元素
vector[1]

# 2 

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 選擇第二行第二列
matrix[ 
1,1]

# 5 

# 建立矩陣
tensor = np.array([
                    [[[1, 1], [1, 1]], [[2, 2], [2, 2]]],
                    [[[3, 3], [3, 3]], [[4, 4], [4, 4]]]
                  ])

# 選擇三個維度的每個的第二個元素
tensor[1,1,1]

# array([4, 4])

陣列變形

# 載入庫
import numpy as np

# 建立 4x3 矩陣
matrix = np.array([[1, 2, 3 
],
                   [4, 5, 6],
                   [7, 8, 9],
                   [10, 11, 12]])

# 將矩陣變形為 2x6 矩陣
matrix.reshape(2, 6)

'''
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12]]) 
'''

矩陣的逆

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 4],
                   [2, 5]])

# 計算矩陣的逆
np.linalg.inv(matrix)

'''
array([[-1.66666667,  1.33333333],
       [ 0.66666667, -0.33333333]]) 
'''

獲取矩陣對角線

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 返回對角線元素
matrix.diagonal()

# array([1, 5, 9]) 

# 建立矩陣的跡
matrix.diagonal().sum()

# 15

展開矩陣

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 展開矩陣
matrix.flatten()

# array([1, 2, 3, 4, 5, 6, 7, 8, 9])

尋找矩陣的秩

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 返回矩陣的秩
np.linalg.matrix_rank(matrix)

# 2

Find The Maximum And Minimum

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 返回最大元素
np.max(matrix)

# 9 

# 返回最小元素
np.min(matrix)

# 1 

# 尋找每列的最大元素
np.max(matrix, axis=0)

# array([7, 8, 9]) 

# 尋找每行的最大元素
np.max(matrix, axis=1)

# array([3, 6, 9])

描述陣列

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3, 4],
                   [5, 6, 7, 8],
                   [9, 10, 11, 12]])

# 檢視行和列數
matrix.shape

# (3, 4) 

# 檢視元素數（行乘列）
matrix.size

# 12 

# 檢視維數
matrix.ndim

# 2

建立向量

# 載入庫
import numpy as np

# 建立行向量
vector_row = np.array([1, 2, 3])

# 建立列向量
vector_column = np.array([[1],
                          [2],
                          [3]])

建立稀疏矩陣

# Load libraries
import numpy as np
from scipy import sparse

# 建立矩陣
matrix = np.array([[0, 0],
                   [0, 1],
                   [3, 0]])

# 建立壓縮稀疏行（CSR）矩陣
matrix_sparse = sparse.csr_matrix(matrix)

注意：有許多型別的稀疏矩陣。在上面的示例中，我們使用 CSR，但我們使用的型別應該反映我們的用例。

建立矩陣

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 4],
                   [2, 5]])

注意 NumPy 的mat資料結構對於我們的目的而言不太靈活，應該避免。

將字典轉換為矩陣

# 載入庫
from sklearn.feature_extraction import DictVectorizer

# 我們的資料字典
data_dict = [{'Red': 2, 'Blue': 4},
             {'Red': 4, 'Blue': 3},
             {'Red': 1, 'Yellow': 2},
             {'Red': 2, 'Yellow': 2}]

# 建立 DictVectorizer 物件
dictvectorizer = DictVectorizer(sparse=False)

# 將字典轉換為特徵矩陣
features = dictvectorizer.fit_transform(data_dict)

# 檢視特徵矩陣
features

'''
array([[ 4.,  2.,  0.],
       [ 3.,  4.,  0.],
       [ 0.,  1.,  2.],
       [ 0.,  2.,  2.]]) 
'''

# 檢視特徵矩陣的列名
dictvectorizer.get_feature_names()

# ['Blue', 'Red', 'Yellow']

計算矩陣的跡

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 計算矩陣的跡
matrix.diagonal().sum()

# 15

計算矩陣的行列式

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 返回矩陣的行列式
np.linalg.det(matrix)

# -9.5161973539299405e-16

計算均值、方差和標準差

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 返回均值
np.mean(matrix)

# 5.0 

# 返回方差
np.var(matrix)

# 6.666666666666667 

# 返回標準差
np.std(matrix)

# 2.5819888974716112

計算兩個向量的點積

# 載入庫
import numpy as np

# 建立兩個向量
vector_a = np.array([1,2,3])
vector_b = np.array([4,5,6])

# 計算點積
np.dot(vector_a, vector_b)

# 32 

# 計算點積
vector_a @ vector_b

# 32

對元素應用操作

# 載入庫
import numpy as np

# 建立矩陣
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 建立加上 100 的函式
add_100 = lambda i: i + 100

# 建立向量化函式
vectorized_add_100 = np.vectorize(add_100)

# 對矩陣的所有元素應用函式
vectorized_add_100(matrix)

'''
array([[101, 102, 103],
       [104, 105, 106],
       [107, 108, 109]]) 
'''

矩陣的加和減

# 載入庫
import numpy as np

# 建立矩陣
matrix_a = np.array([[1, 1, 1],
                     [1, 1, 1],
                     [1, 1, 2]])

# 建立矩陣
matrix_b = np.array([[1, 3, 1],
                     [1, 3, 1],
                     [1, 3, 8]])

# 將兩個矩陣相加
np.add(matrix_a, matrix_b)

'''
array([[ 2,  4,  2],
       [ 2,  4,  2],
       [ 2,  4, 10]]) 
'''

# 將兩個矩陣相減
np.subtract(matrix_a, matrix_b)

'''
array([[ 0, -2,  0],
       [ 0, -2,  0],
       [ 0, -2, -6]]) 
'''

資料科學和人工智慧技術筆記一、向量、矩陣和陣列

一、向量、矩陣和陣列作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 轉置矩陣或向量 # 載入庫 import numpy as np # 建立向量 vector = np.array([1, 2, 3, 4, 5, 6

資料科學和人工智慧技術筆記十一、線性迴歸

十一、線性迴歸作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 新增互動項 # 載入庫 from sklearn.linear_model import LinearRegression from sklearn.d

資料科學和人工智慧技術筆記二十一、統計學

二十一、統計學作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 貝塞爾校正貝塞爾的校正是我們在樣本方差和樣本標準差的計算中使用 n

資料科學和人工智慧技術筆記六、日期時間預處理

六、日期時間預處理作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 把日期和時間拆成多個特徵 # 載入庫 import pandas as pd # 建立資料幀 df = pd.DataFrame() # 建立五個日期

資料科學和人工智慧技術筆記五、文字預處理

五、文字預處理作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 詞袋 # 載入庫 import numpy as np from sklearn.feature_extraction.text import Coun

資料科學和人工智慧技術筆記四、影象預處理

四、影象預處理作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 影象二值化 # 載入庫 import cv2 import numpy as np from matplotlib import pyplot as plt

資料科學和人工智慧技術筆記三、資料預處理

三、資料預處理作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 為 Scikit-Learn 轉換 Pandas 類別資料 # 匯入所需的庫 from sklearn import preprocessing import

資料科學和人工智慧技術筆記二、資料準備

二、資料準備作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 從字典載入特徵 from sklearn.feature_extraction import DictVectorizer staff = [{'name':

資料科學和人工智慧技術筆記九、模型驗證

九、模型驗證作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 準確率 # 載入庫 from sklearn.model_selection import cross_val_score from sklearn.li

資料科學和人工智慧技術筆記八、特徵選擇

八、特徵選擇作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 用於特徵選取的 ANOVA F 值如果特徵是類別的，計算每個特徵與目標向量之間的卡方（

資料科學和人工智慧技術筆記七、特徵工程

七、特徵工程作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 稀疏特徵矩陣上的降維 # 載入庫 from sklearn.preprocessing import StandardScaler from sklearn.d

資料科學和人工智慧技術筆記十五、支援向量機

十五、支援向量機作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 校準 SVC 中的預測概率 SVC 使用超平面來建立決策區域，不會自然輸出觀察是某一類成員的概率估計。但是，我們實際上可以通過一些技巧輸出校準的類概率。

資料科學和人工智慧技術筆記十四、K 最近鄰

十四、K 最近鄰作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 確定 K 的最佳值 # 載入庫 from sklearn.neighbors import KNeighborsClassifier from skl

資料科學和人工智慧技術筆記十、模型選擇

十、模型選擇作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 在模型選擇期間尋找最佳預處理步驟在進行模型選擇時，我們必須小心正確處理預處理。首先，GridSearchCV使用交叉驗證來確定哪個模型表現最好。然而，在交

資料科學和人工智慧技術筆記十三、樹和森林

十三、樹和森林作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 Adaboost 分類器 # 載入庫 from sklearn.ensemble import AdaBoostClassifier from skle

資料科學和人工智慧技術筆記十二、邏輯迴歸

十二、邏輯迴歸作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 C 超引數快速調優有時，學習演算法的特徵使我們能夠比蠻力或隨機模型搜尋方法更快地搜尋最佳超引數。 scikit-learn 的LogisticRegre

資料科學和人工智慧技術筆記二十、資料視覺化

二十、資料視覺化作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 MatPlotLib 中的雙向條形圖 %matplotlib inline import pandas as pd import matplotlib.py

資料科學和人工智慧技術筆記十八、Keras

十八、Keras 作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 新增丟棄 # 載入庫 import numpy as np from keras.datasets import imdb from keras.pr

資料科學和人工智慧技術筆記十七、聚類

十七、聚類作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 凝聚聚類 # 載入庫 from sklearn import datasets from sklearn.preprocessing import Stan

資料科學和人工智慧技術筆記十六、樸素貝葉斯

十六、樸素貝葉斯作者：Chris Albon 譯者：飛龍協議：CC BY-NC-SA 4.0 伯努利樸素貝葉斯伯努利樸素貝葉斯分類器假設我們的所有特徵都是二元的，它們僅有兩個值（例如，已經是獨熱編碼的標稱分類特徵）。 # 載入庫 import

資料科學和人工智慧技術筆記 一、向量、矩陣和陣列

一、向量、矩陣和陣列

轉置矩陣或向量

選擇陣列中的元素

陣列變形

矩陣的逆

獲取矩陣對角線

展開矩陣

尋找矩陣的秩

Find The Maximum And Minimum

描述陣列

建立向量

建立稀疏矩陣

建立矩陣

將字典轉換為矩陣

計算矩陣的跡

計算矩陣的行列式

計算均值、方差和標準差

計算兩個向量的點積

對元素應用操作

矩陣的加和減

相關推薦

資料科學和人工智慧技術筆記一、向量、矩陣和陣列