1. 程式人生 > 程式設計 >python遍歷檔案目錄、批量處理同類檔案

python遍歷檔案目錄、批量處理同類檔案

本文例項為大家分享了python遍歷檔案目錄、批量處理同類檔案的具體程式碼,供大家參考,具體內容如下

目錄操作

1、獲取當前目錄

import os
curr_path=os.path.dirname(__file__) #返回當前檔案所在的目錄,即當前執行的指令碼所在父目錄
print curr_path

執行示例

(1)使用os.path.dirname(__file__)時,是針對執行時對所給程式指令碼的路徑來獲取父目錄的,即擷取你輸入的指令碼路徑的所在目錄名稱,如上圖示例,輸入絕對路徑時返回絕對路徑,輸入相對路徑時返回相對路徑,如果只輸入了指令碼名稱,則返回空。

注:當從命令列中進入python環境時時,引數__file__不能使用)

(2)當直接使用os.path.dirname(“/home/test_MK/test.py”)時,直接返回“/home/test_MK”

2、獲取目錄檔案列表

file_list=os.listdir("/home/test_MK/test")) 
print file_list

執行示例

3、獲取該目錄下資料夾或者檔案列表

path="/home/test_MK/test"
objects=os.listdir(path)
dir_list=[] #存放目錄列表
file_list=[] #存放檔案列表
for obj in objects:
 if os.path.isdir(os.path.join(path,obj)):#判斷是否是目錄os.path.join()用來將路徑拼接
 dir_list.append(os.path.join(path,obj))#儲存時儲存完整路徑才能對其進行後續操作
 print "dir:",obj
 else:
 file_list.append(os.path.join(path,obj))
 print "file:",obj
print "目錄列表:",dir_list
print "檔案列表:",file_list
#如果項判斷是否是檔案時用os.isfile()

(注:使用os.isdir()與os.isfile()時,引數必須是一個相對路徑或者絕對路徑,不能光是一個檔名或者目錄名稱,這也是上面示例程式碼中使用os.path.join()的原因,否則函式將判斷不出正確結果)

執行示例

批量處理目錄下同類檔案

以處理pcap檔案為例

1、獲取某一資料夾下所有pcap包路徑,過濾掉其它檔案

def getPathFile(path):
 '''
 name:getPathFile
 function:獲取所給資料夾下所有pcap檔案路徑
 path:所給資料夾路徑
 '''
 Path = []
 try:
 pathDir = os.listdir(path)
 for allDir in pathDir:
  child = os.path.join('%s/%s' % (path,allDir))
  #跳過資料夾以及非流量包檔案,將字尾名改為自己需要的檔案型別即可實現自己的過濾
  if os.path.isfile(child) and (".pcap" in str(allDir) or (".cap" in str(allDir))): 
  Path.append(child)
 except:
 pass
 return Path

2、處理函式,列印一個pcap檔案中所有資料包的五元組資訊{src_ip,src_port,dst_ip,dst_port}

def print_pack_f(file_path):
 '''
 name:print_pack_f
 function:列印一個pcap檔案中所有資料包的五元組資訊
 file_path:所給pcap檔案路徑
 '''
 file_p= open(file_path)
 pcap = dpkt.pcap.Reader(file_p) 
 if not pcap:
 return
 print "\n\n*******file:%s*******\n"% file_path
 for (ts,buf) in pcap:
 try:
 eth = dpkt.ethernet.Ethernet(buf) #解包,物理層
 if not isinstance(eth.data,dpkt.ip.IP): #解包,網路層
 continue
 ip = eth.data
 src_ip="%d.%d.%d.%d"%tuple(map(ord,list(ip.src))) 
 dst_ip="%d.%d.%d.%d"%tuple(map(ord,list(ip.dst)))
 if (not isinstance(ip.data,dpkt.tcp.TCP)) and (not isinstance(ip.data,dpkt.udp.UDP)): #解包,傳輸層
 continue
 transf= ip.data
 print "<",src_ip,":",transf.sport,"-->",transf.dport,">"
 except Exception,err:
 print "[error] %s" % err

3、呼叫示例

def main(dir_path):
 all_file_path=getPathFile(dir_path) #獲取目錄下所有pcap檔案路徑
 for file in all_file_path: #遍歷處理
 print_pack_f(file) #單個pcap檔案處理,可將本函式替換成自定義的功能,便可實現批量處理

if __name__ == '__main__':
 opts,args = getopt.getopt(sys.argv[1:],"hi:") #從命令列獲取引數
 if not opts: #若沒有帶引數
 print "\n\
 *******************\n\
 warn! please enter related parameters,enter -h for help!\n\n\
 *******************\n"
 sys.exit()
 input_path=''
 for op,value in opts:
 if op == "-i":
 input_path = value
 elif op == "-h":
 usage() #幫助資訊,只是簡單的一個輸出函式,輸出內容自定義
 sys.exit()
 main(input_path)

結果展示

測試目錄如下

執行結果(python test.py -i ./test)

完畢

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。