1. 程式人生 > >Python中使用pandas.get_dummies()生成one-hot編碼標籤

Python中使用pandas.get_dummies()生成one-hot編碼標籤

one-hot編碼是監督學習中經常對標籤處理的一種方式。


假設我們有一組標籤:

import numpy as np
import pandas as pd

labels = np.array(['Cat', 'Dog', 'Dog', 'Cat', 'Bird', 'Fish'])
print("Labels shape: %d" % labels.shape)
print("Labels:", labels)

我們可以利用pandas.get_dummies()生成one-hot型式:

print(pd.get_dummies(labels))
one_hot = np.asarray(pd.get_dummies(labels))
print("One-hot Labels shape:", one_hot.shape)
print("One-hot Labels:", '\n', one_hot)