Python 使用 openpyxl 模組讀取、寫入 Excel 檔案教學與範例
介紹如何在 Python 中使用 openpyxl 模組讀取與寫入 Excel 的 *.xlsx 檔案。
Python 的 openpyxl 模組可用來讀取或寫入 Office Open XML 格式的 Excel 檔案,支援的檔案類型有 xlsx、xlsm、xltx、xltm,以下將示範如何使用 openpyxl 模組來讀取並修改 Excel 檔案。
讀取、寫入 Excel 檔案
若要讀取 Excel 檔案,可以利用 openpyxl 中的 load_workbook 函數:from openpyxl import load_workbook
# 讀取 Excel 檔案
wb = load_workbook('test.xlsx')load_workbook 載入 Excel 檔案之後,會得到一個活頁簿(workbook)的物件。
若要將活頁簿物件儲存至 Excel 檔案中,則可使用活頁簿的 save 函數:
# 將活頁簿儲存至 Excel 檔案
wb.save('output.xlsx')
建立新活頁簿
除了從 Excel 檔案讀取活頁簿之外,也可以直接在 Python 建立新的活頁簿:# 建立新活頁簿
wb2 = Workbook()
工作表操作
一本活頁簿中會包含一張或多張工作表(worksheet),我們可以透過活頁簿的 sheetnames 來取的所有工作表的名稱:# 顯示工作表名稱
print(wb.sheetnames)['工作表1', '工作表2']或是透過 for 迴圈逐一處理每一張工作表:
# 以 for 迴圈逐一處理每張工作表
for sheet in wb:
print(sheet.title)工作表1
工作表2我們可以透過活頁簿的 active 屬性取得目前作用中的工作表:
# 取得目前作用中的工作表
actSheet = wb.active
print(actSheet.title)工作表1我們可以透過工作表的名稱,直接取得指定的工作表:
# 透過名稱取得工作表
sheet = wb['工作表1']工作表的名稱與顏色也都可以任意修改:
# 更改工作表名稱
sheet.title = "我的工作表"
# 更改工作表標籤顏色
sheet.sheet_properties.tabColor = "1072BA"若要新增工作表,可以使用活頁簿的 create_sheet 函數:
# 新增工作表(放在最後方)
ws1 = wb.create_sheet("新增工作表1")
# 新增工作表(放在最前方)
ws2 = wb.create_sheet("新增工作表2", 0)若要複製工作表,可以使用活頁簿的 copy_worksheet 函數:
# 複製工作表
source = wb.active
target = wb.copy_worksheet(source)
單一儲存格操作
假設我們的 Excel 內容如下:Excel 檔案若要讀取表格中的內容,可以先載入這張工作表之後,以儲存格位置來存取資料:
# 讀取 Excel 檔案
wb = load_workbook('test.xlsx')
sheet = wb['工作表1']
# 根據位置取得儲存格
c = sheet['A4']
# 得取儲存格資料
print(c.value)2018-10-12 00:00:00取得儲存格之後,也可以修改其中的資料:
# 修改儲存格資料
c.value = "2020-06-23 00:00:00"另外也可以直接使用工作表搭配位置索引來修改儲存格的資料:
# 修改儲存格資料
sheet['A4'] = "2020-06-23 00:00:00"除了以文字的 Excel 儲存格位置之外,也可以使用行號與列號來指定儲存格:
# 讀取 Excel 檔案
wb = load_workbook('test.xlsx')
sheet = wb['工作表1']
# 以行號、列號指定儲存格
c = sheet.cell(row=4, column=1)
print(c.value)2018-10-12 00:00:00# 修改儲存格內容
sheet.cell(row=4, column=1, value="2020-06-23 00:00:00")
多儲存格操作
若要一次對指定範圍內的所有儲存格進行操作,可以使用以下幾種方式來指定範圍,取得儲存格物件:# 透過名稱取得工作表
mywb = load_workbook('test.xlsx')
sheet = mywb['工作表1']
# 取得指定範圍內儲存格物件
cellRange = sheet['B2':'C3']
# 以 for 迴圈逐一處理每個儲存格
for row in cellRange:
for c in row:
print(c.value)3
32
4
34以下是其他各種指定範圍的方式:
# 整個 C 欄
colC = sheet['C']
# C 欄與 D 欄
cols = sheet['C:D']
# 第 10 列
row10 = sheet[10]
# 第 5 列到第 10 列
rows = sheet[5:10]另外也可以使用工作表的 iter_rows 或 iter_cols 來處理:
# 以列(row)方向逐一疊代處理
for row in sheet.iter_rows(min_row=1, max_col=3, max_row=2):
for cell in row:
print(cell)<Cell '工作表1'.A1>
<Cell '工作表1'.B1>
<Cell '工作表1'.C1>
<Cell '工作表1'.A2>
<Cell '工作表1'.B2>
<Cell '工作表1'.C2># 以行(column)方向逐一疊代處理
for col in sheet.iter_cols(min_row=1, max_col=3, max_row=2):
for cell in col:
print(cell)<Cell '工作表1'.A1>
<Cell '工作表1'.A2>
<Cell '工作表1'.B1>
<Cell '工作表1'.B2>
<Cell '工作表1'.C1>
<Cell '工作表1'.C2>
只取得資料
若只需要讀取儲存格中的資料,可以透過工作表的 values 來直接取得資料:# 只取得儲存格資料
for row in sheet.values:
for value in row:
print(value)工作表的 iter_rows 或 iter_cols 也可以只取用資料:
# 只取得儲存格資料
for row in sheet.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):
for value in row:
print(value)除了 openpyxl 之外,常見的 Excel 檔案相關的模組還有 xlwt(寫入 xls 檔案)、xlrd(讀取 xls、xlsx 檔案) 與 xlsxwriter(寫入 xlsx 檔案) 有需要的人可以上網搜尋相關的資料。
參考資料:程式前沿、GeeksForGeeks、StackOverflow、python-excel.org、Real Python