python遍歷檔案目錄、批量處理同類檔案
阿新 • • 發佈:2020-01-09
本文例項為大家分享了python遍歷檔案目錄、批量處理同類檔案的具體程式碼,供大家參考,具體內容如下
目錄操作
1、獲取當前目錄
import os curr_path=os.path.dirname(__file__) #返回當前檔案所在的目錄,即當前執行的指令碼所在父目錄 print curr_path
執行示例
(1)使用os.path.dirname(__file__)時,是針對執行時對所給程式指令碼的路徑來獲取父目錄的,即擷取你輸入的指令碼路徑的所在目錄名稱,如上圖示例,輸入絕對路徑時返回絕對路徑,輸入相對路徑時返回相對路徑,如果只輸入了指令碼名稱,則返回空。
(注:當從命令列中進入python環境時時,引數__file__不能使用)
(2)當直接使用os.path.dirname(“/home/test_MK/test.py”)時,直接返回“/home/test_MK”
2、獲取目錄檔案列表
file_list=os.listdir("/home/test_MK/test")) print file_list
執行示例
3、獲取該目錄下資料夾或者檔案列表
path="/home/test_MK/test" objects=os.listdir(path) dir_list=[] #存放目錄列表 file_list=[] #存放檔案列表 for obj in objects: if os.path.isdir(os.path.join(path,obj)):#判斷是否是目錄os.path.join()用來將路徑拼接 dir_list.append(os.path.join(path,obj))#儲存時儲存完整路徑才能對其進行後續操作 print "dir:",obj else: file_list.append(os.path.join(path,obj)) print "file:",obj print "目錄列表:",dir_list print "檔案列表:",file_list #如果項判斷是否是檔案時用os.isfile()
(注:使用os.isdir()與os.isfile()時,引數必須是一個相對路徑或者絕對路徑,不能光是一個檔名或者目錄名稱,這也是上面示例程式碼中使用os.path.join()的原因,否則函式將判斷不出正確結果)
執行示例
批量處理目錄下同類檔案
以處理pcap檔案為例
1、獲取某一資料夾下所有pcap包路徑,過濾掉其它檔案
def getPathFile(path): ''' name:getPathFile function:獲取所給資料夾下所有pcap檔案路徑 path:所給資料夾路徑 ''' Path = [] try: pathDir = os.listdir(path) for allDir in pathDir: child = os.path.join('%s/%s' % (path,allDir)) #跳過資料夾以及非流量包檔案,將字尾名改為自己需要的檔案型別即可實現自己的過濾 if os.path.isfile(child) and (".pcap" in str(allDir) or (".cap" in str(allDir))): Path.append(child) except: pass return Path
2、處理函式,列印一個pcap檔案中所有資料包的五元組資訊{src_ip,src_port,dst_ip,dst_port}
def print_pack_f(file_path): ''' name:print_pack_f function:列印一個pcap檔案中所有資料包的五元組資訊 file_path:所給pcap檔案路徑 ''' file_p= open(file_path) pcap = dpkt.pcap.Reader(file_p) if not pcap: return print "\n\n*******file:%s*******\n"% file_path for (ts,buf) in pcap: try: eth = dpkt.ethernet.Ethernet(buf) #解包,物理層 if not isinstance(eth.data,dpkt.ip.IP): #解包,網路層 continue ip = eth.data src_ip="%d.%d.%d.%d"%tuple(map(ord,list(ip.src))) dst_ip="%d.%d.%d.%d"%tuple(map(ord,list(ip.dst))) if (not isinstance(ip.data,dpkt.tcp.TCP)) and (not isinstance(ip.data,dpkt.udp.UDP)): #解包,傳輸層 continue transf= ip.data print "<",src_ip,":",transf.sport,"-->",transf.dport,">" except Exception,err: print "[error] %s" % err
3、呼叫示例
def main(dir_path): all_file_path=getPathFile(dir_path) #獲取目錄下所有pcap檔案路徑 for file in all_file_path: #遍歷處理 print_pack_f(file) #單個pcap檔案處理,可將本函式替換成自定義的功能,便可實現批量處理 if __name__ == '__main__': opts,args = getopt.getopt(sys.argv[1:],"hi:") #從命令列獲取引數 if not opts: #若沒有帶引數 print "\n\ *******************\n\ warn! please enter related parameters,enter -h for help!\n\n\ *******************\n" sys.exit() input_path='' for op,value in opts: if op == "-i": input_path = value elif op == "-h": usage() #幫助資訊,只是簡單的一個輸出函式,輸出內容自定義 sys.exit() main(input_path)
結果展示
測試目錄如下
執行結果(python test.py -i ./test)
完畢
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。