Python處理excel檔案

阿新 • • 發佈：2018-11-27

Python處理excel檔案

這裡只介紹幾種常用的庫。對於2003以前的excel版本，即.xls檔案，只能用xlrd和xlwt庫來處理；對於2003及以後的excel檔案，即.xlsx檔案，需要使用openpyxl庫來處理，這裡著重介紹這三個第三方庫。

注：Workbook是對工作簿（excel）的抽象，Worksheet是對錶格(sheet)的抽象，Cell是對單元格的抽象

Python處理.xlsx檔案

匯入模組
```
import openpyxl
```

讀入一個已有的excel

# 當前路徑下
r_wb = openpyxl.load_workbook('test-openpyxl.xlsx')
# 指定路徑下
r_wb = openpyxl.load_workbook(r'C:\Users\y84107470\PycharmProjects\excel-fun\test-openpyxl.xlsx')

新建一個excel

# 無論是匯入的還是新建的excel，後面對Wb(Workbook),ws(worksheet)和cell的操作是一樣的
w_wb = openpyxl.Workbook()

sheet的屬性與操作

獲取所有sheet的名稱

r_sheetnames = r_wb.get_sheet_names()# 目前已棄用，不會報錯，但是又警告，建議用下面的方法
r_sheetnames = r_wb.sheetnames

獲取某個sheet的三種方法

# 按索引，獲取第一個sheet
r_ws = r_wb.get_sheet_by_name(r_sheetnames[0])
# 按名稱，獲取指定名稱的sheet
r_ws = r_wb.get_sheet_by_name('Sheet1') # 目前已棄用，不會報錯，但是又警告，建議用下面的方法
r_ws = r_wb['Sheet1']
# 呼叫正在執行的sheet
r_ws = r_wb.active

新建刪除sheet

# 新建sheet，不加index引數預設插在最後
ws1 = r_wb.create_sheet(title = "page1", index = 0) 
# 刪除sheet
r_wb.remove_sheet(ws1)

常用sheet屬性
- title：表格的標題
- dimensions：表格的大小，這裡的大小是指含有資料的表格的大小，即：左上角的座標:右下角的座標
- max_row：表格的最大行
- min_row：表格的最小行
- max_column：表格的最大列
- min_column：表格的最小列
- rows：按行獲取單元格(Cell物件) - 生成器
- columns：按列獲取單元格(Cell物件) - 生成器
- freeze_panes：凍結窗格
- values：按行獲取表格的內容(資料) - 生成器

獲取或修改屬性

# 修改標題
ws1.title = "Changed"
# 打印表格大小
print('dimensions:', r_ws.dimensions) #輸出：A1:C4
# 獲取表格的最小行(最大行，最大最小列同理)
min_r = r_ws.min_row
#凍結第一行標題行
ws.freeze_panes = 'A2'

cell的屬性與操作

獲取cell

# 直接根據單元格的索引獲取，座標從（1， 1）開始
d = ws.cell(row = 4, column = 2) #通過行列讀

cell常用屬性
- row：單元格所在的行
- column：單元格坐在的列
- coordinate：單元格的座標
- value：單元格的值

獲取或修改屬性

# 列印
print('row:', r_ws.cell(row=2, column=2).row)
print('column:', r_ws.cell(row=2, column=2).column)
print('coordinate:', r_ws.cell(row=2, column=2).coordinate)
print('value:', r_ws.cell(row=2, column=2).value)
# 修改
r_ws.cell(row=2, column=2).value = '連海平'
r_ws.cell(row=2, column=2, value = '共潮生')

遍歷表格資料

使用迭代器

# 按行操作
for row in r_ws.iter_rows('A1:C3'):
	# 兩種方式作用是一樣的
    for cell in row:
        print('cell-value:', cell.value)
    for i in range(len(row)):
        print('row[i]:', row[i].value)

按行列操作

# 用行數列數
for row in range(1, 4):
    for col in range(1, 4):
        w_ws.cell(row= row, column= col, value= 'test')
        print('row:', row, 'col:', col, 'value:', w_ws.cell(row= row, column= col).value)

利用公式

求和
```
r_ws['C5'] = "=SUM(C2:C4)"
```
除法
```
r_ws['C6'] = "=SUM(C2:C3)/C4"
```

例項

例子說明：讀入一個excel，內容如下：
這裡寫圖片描述
將其按得分排序後，在第一列插入一列排名，結果如下：

程式碼如下：

#!/usr/bin/env python 
# -*- coding:utf-8 -*-

import openpyxl

# 讀入已有的excel（修改為自己檔案的路徑）
r_wb = openpyxl.load_workbook(r'C:\Users\69540\Desktop\test-openpyxl.xlsx')

# 獲取r_wb的sheet1
r_ws = r_wb.get_sheet_by_name('Sheet1')

# 獲取讀入的資料
title = []
data = []
data_line = []
for n_row in range(r_ws.min_row, r_ws.max_row + 1):
    for n_col in range(r_ws.min_column, r_ws.max_column + 1):
        # 獲取標題行
        if n_row == r_ws.min_row:
            title.append(r_ws.cell(row= n_row, column= n_col).value)
        # 獲取一行資料
        else:
            data_line.append(r_ws.cell(row= n_row, column= n_col).value)
    # 將一行資料儲存至data列表，並清零data_line
    if data_line:
        data.append(data_line)
        data_line = []

# 處理資料
title_out = title
data_out = data
# 標題行第一列新增字串‘排名’
title_out.insert(0, '排名')
# 資料部分按第三列的得分排序，降序排列
data_out.sort(key= lambda elem:elem[2], reverse= True)
for i in range(len(data_out)):
    data_out[i].insert(0, i + 1)
#將title的合併進data_out列表中
data_out.insert(0, title_out)

# 新建excel及sheet，sheet命名為rank，將資料寫入
w_wb = openpyxl.Workbook()
w_ws = w_wb.create_sheet(title = 'rank', index= 0)
n_max_row = len(data_out)
n_max_col = len(data_out[1])
for row in range(n_max_row):
    for col in range(n_max_col):
            # 寫入資料
            w_ws.cell(row=row + 1, column=col + 1, value=data_out[row][col])

#將新建的excel以指定的名稱儲存在指定的路徑下（修改為自己檔案的路徑）
w_wb.save(r'C:\Users\69540\Desktop\rank.xlsx')

Python處理.xls檔案

讀excel：使用xlrd庫

import xlrd

# 開啟一個已有的excel(當前路徑下，指定路徑下)
# workbook = xlrd.open_workbook('test-xlrd.xls')
workbook = xlrd.open_workbook(r'C:\Users\y84107470\PycharmProjects\excel-fun\test-xlrd.xls')

# sheet的操作
# 抓取所有sheet頁的名稱並列印
worksheets_name = workbook.sheet_names()
print('worksheets are:', worksheets_name)
# 定位到sheet: 1. 指定名稱獲取
#worksheet1 = workbook.sheet_by_name(u'Sheet1')
# 2.1 通過索引順序獲取
#worksheet1 = workbook.sheets()[0]
# 2.2 通過索引順序獲取
worksheet1 = workbook.sheet_by_index(0)
# 列印sheet的名稱，行數，列數
print('sheet_attr:', worksheet1.name, worksheet1.nrows, worksheet1.ncols)

# 讀取表值
# 遍歷sheet1中所有行row
num_rows = worksheet1.nrows
for curr_row in range(num_rows):
    row_val = worksheet1.row_values(curr_row)
    print('row%s is %s' % (curr_row, row_val))
# 遍歷sheet1中所有列col
num_cols = worksheet1.ncols
for curr_col in range(num_cols):
    col_val = worksheet1.col_values(curr_col)
    print('col%s is %s' % (curr_col, col_val))
# 遍歷sheet1中所有單元格cell
for rown in range(num_rows):
    for coln in range(num_cols):
        cell_val = worksheet1.cell_value(rown, coln)
        print(cell_val)

#獲取單元格內容的資料型別（說明：ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error）
print('(1, 0)的型別為：', worksheet1.cell(1, 0).ctype) #第2行第1列:張三 為string型別
print('(1, 1)的型別為：', worksheet1.cell(1, 1).ctype) #第2行第2列:15 為number型別

寫excel：使用xlwt庫

#新建excel檔案並寫入資料，xlwt

import xlwt
#建立workbook和sheet物件
workbook = xlwt.Workbook() #注意Workbook的開頭W要大寫
sheet1 = workbook.add_sheet('sheet1', cell_overwrite_ok=True)
sheet2 = workbook.add_sheet('sheet2', cell_overwrite_ok=True)
#向sheet頁中寫入資料
name = ('李老栓', '張得帥', '曾牛逼')
score = ('22', '33', '44')
sheet1.write(0, 0, '姓名')
sheet1.write(0, 1, '得分')
for i in range(len(name)):
    sheet1.write(i + 1, 0, name[i])
for i in range(len(score)):
    sheet1.write(i + 1, 1, score[i])
#儲存該excel檔案,有同名檔案時直接覆蓋(儲存在當前資料夾下)
workbook.save('test-xlwt.xls')
#儲存該excel檔案,有同名檔案時直接覆蓋(儲存在指定資料夾下)
#workbook.save(r'C:\Users\y84107470\Desktop\test-xlwt.xls')
print('建立excel檔案完成！')

補充：寫excel的庫xlutils

import xlrd
import xlutils.copy
#開啟一個workbook
rb = xlrd.open_workbook('test.xls')
wb = xlutils.copy.copy(rb)
#獲取sheet物件，通過sheet_by_index()獲取的sheet物件沒有write()方法
ws = wb.get_sheet(0)
#寫入資料
ws.write(1, 1, 'changed!')
#新增sheet頁
wb.add_sheet('sheetnnn2', cell_overwrite_ok=True)
#利用儲存時同名覆蓋達到修改excel檔案的目的,注意未被修改的內容保持不變
wb.save('test.xls')

參考：

https://blog.csdn.net/test_soy/article/details/79714858

http://www.mamicode.com/info-detail-2206758.html

使用Python處理Excel檔案的一些程式碼示例

筆記：使用Python處理Excel檔案的一些程式碼示例，以下程式碼來自於《Python資料分析基礎》一書，有刪改 #!/usr/bin/env python3 # 匯入讀取Excel檔案的庫，xlrd，其中的 open_workbook 為讀取工作簿 from xlrd import open_wo

Python處理excel檔案

Python處理excel檔案這裡只介紹幾種常用的庫。對於2003以前的excel版本，即.xls檔案，只能用xlrd和xlwt庫來處理；對於2003及以後的excel檔案，即.xlsx檔案，需要使用openpyxl庫來處理，這裡著重介紹這三個第三方庫。注：Workboo

python高手之路python處理excel檔案

用python來自動生成excel資料檔案。python處理excel檔案主要是第三方模組庫xlrd、xlwt、xluntils和pyExcelerator，除此之外，python處理excel還可以用win32com和openpyxl模組。方法一

python 處理excel檔案、txt檔案

處理excel檔案的python庫有很多，如xlsxwriter、xlrd、openpyxl等。由於經常用pandas處理資料，而且pandas讀寫excel更方便，所以主要講pandas是如何操作excel的。也介紹瞭如何分別使用用xlsxwriter和ope

python高手之路python處理excel檔案(方法彙總)

用python來自動生成excel資料檔案。python處理excel檔案主要是第三方模組庫xlrd、xlwt、xluntils和pyExcelerator，除此之外，python處理excel還可以用win32com和openpyxl模組。方法一：小羅問我怎麼從

用python處理excel檔案(1)

#!/usr/bin/env python3 import xlrd book=xlrd.open_workbook('E:\\研究生學習\\python資料\\實驗資料\\Excel檔案實驗資料\\SOWC 2014 Stat Tables_Table 9.xlsx')

Python批量處理Excel檔案到同一檔案的不同sheet上（未完...）

存在每次活動整理的Excel資料檔案，需放在一個Excel上進行儲存#-*-coding:utf-8-*- import os import pandas as pd path='' files=os.

python處理Excel

表名格式 xls 常用操作問題進行 pre work times 1，xlrd xlrd是用來從Excel中讀寫數據的，但我平常只用它進行讀操作，寫操作會遇到些問題。用xlrd進行讀取比較方便，流程和平常手動操作Excel一樣，打開工作簿(Workbook)，選擇工作

day53——Python 處理 Excel 數據

for 操作 work copy all utils usr excel文件姓名（Windows 下操作）先安裝一些處理 Excel 的模塊： 1 pip install xlrd # 用於讀取Excel數據 2 pip install xlwt

python 處理CSV檔案

讀取 import csv with open('test.csv','r',encoding='utf8') as csvfile: reader = csv.reader(csvfile) for i in reader: print(i) 寫

python將excel檔案變成txt檔案

import xlrd def row2str(row_data): values = ""; for i in range(len(row_data)): if i == len(row_data) - 1: values = val

python實現Excel檔案讀取的程式（附原始碼）

python實現Excel檔案讀取的程式前一段時間幫一個朋友用python寫了一個讀Excel程式操作的程式，具體要求為：讀取兩個Excel檔案，根據其中某個特徵的特徵值對這兩個檔案進行取交集操作，生成三個Excel檔案，第一個Excel檔案為這兩個檔案的公

Python處理word檔案

python對word檔案進行讀寫和複製 import win32conimport win32com.clientimport os#讀取word檔案def readWoldFile(path): #呼叫系統word功能，可以處理doc和docx檔案 mw=win32com.client.Dispatch

在 Node.js 中利用 js-xlsx 處理 Excel 檔案

參考連結：http://scarletsky.github.io/2016/01/30/nodejs-process-excel/ var _headers = [''], _headers_len = _headers.length; headers = _headers.map((v,

python處理txt檔案的一種情況

在txt文字中，以換行符作為標記分段處理txt檔案中的內容的方法: with open(path, 'r', encoding='utf-8') as f: for line in f: if line!='\n': print(line

Python實現Excel檔案的讀寫操作

在Python的學習過程中，有時候需要對Excel檔案進行讀寫操作。其中主要用到兩大模組：使用xlwt module將資料寫入Excel表格，使用xlrd module從Excel讀取資料。下面介紹如何實現使用python對Excel進行讀寫操作。安裝模組 $ sudo pip

python建立Excel檔案資料的方法

# -*- coding: utf-8 -*-# @Time : 2018/12/6 17:10# @Author : suchao# @Disc: : 生成10000條Excel資料# @File : 1000data.py# @Software: PyCharmimport xlrd ,

Python讀取Excel檔案並生成分析結果

筆者需要對存放在Excel裡的很多媒資檔案進行分析，這些節目的解析度有高清、標清之分，高清的節目名稱前面加上“HD-”，比如下面的“HD-護寶聯盟第一季”，標清的則直接是節目名稱，如“HD-護寶聯盟第一季”，這些節目可能分別屬於電視劇、電影、娛樂的欄目，每個節目有對應的時長（分鐘數），然後按欄目放在不同的sh

Python學習筆記--python讀取Excel檔案

簡介：　　　　　今日接了個小單，把資料從xlsx讀取到本地生成散點圖，在讀取日期資料時發現，讀取下來的日期是數字，不是日期的各式　　　所要用的庫： xlrd ：1.1.0 time： datetime: 解決方法：　程式碼 1 import xlrd 2 import

python 處理excel資料

一、安裝xlrd庫： pip install xlrd 二、使用模組 import xlrd path = 'test.xlsx' data = xlrd.open_workbook(path) # 獲取工作表資料 table = data.she

Python處理excel檔案

Python處理excel檔案

Python處理.xlsx檔案

Python處理.xls檔案

相關推薦